Método mode() en DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Esta práctica te guiará a través del uso del método mode() en un DataFrame de Pandas. El método mode() se utiliza para encontrar el valor o valores que más se repiten en un DataFrame.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haz clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tengas que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tienes problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona retroalimentación después de la sesión y resolveremos el problema para ti de inmediato.

Importar las bibliotecas necesarias

Primero, importa la biblioteca Pandas utilizando la declaración import:

import pandas as pd

Crear un DataFrame

Ahora, crea un DataFrame utilizando el constructor DataFrame(). Para este ejemplo, vamos a crear un DataFrame con tres columnas: "A", "B" y "C".

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

Encontrar el valor o valores más frecuentes

Para encontrar el valor o valores más frecuentes de cada columna en el DataFrame, utiliza el método mode():

df_mode = df.mode()
print(df_mode)

El método mode() devuelve un DataFrame que contiene el valor o valores más frecuentes de cada columna.

Especificar el eje

Por defecto, el método mode() encuentra el valor o valores más frecuentes a lo largo del eje de columnas (axis=0). Si quieres encontrar el valor o valores más frecuentes a lo largo del eje de filas, especifica axis=1.

Por ejemplo, para encontrar el valor o valores más frecuentes a lo largo del eje de filas, utiliza el siguiente código:

df_mode = df.mode(axis=1)
print(df_mode)

Incluir solo columnas numéricas

Si quieres incluir solo columnas numéricas en el cálculo de la moda, puedes utilizar el parámetro numeric_only. Por defecto, numeric_only está establecido en False. Establece it a True para incluir solo columnas numéricas.

Por ejemplo, para incluir solo columnas numéricas en el cálculo de la moda, utiliza el siguiente código:

df_mode = df.mode(numeric_only=True)
print(df_mode)

Incluir valores nulos

Por defecto, el método mode() no considera los valores nulos. Si quieres incluir los valores nulos en el cálculo de la moda, puedes utilizar el parámetro dropna. Por defecto, dropna está establecido en True. Establece it a False para incluir los valores nulos.

Por ejemplo, para incluir los valores nulos en el cálculo de la moda, utiliza el siguiente código:

df_mode = df.mode(dropna=False)
print(df_mode)

Resumen

En este laboratorio, aprendiste cómo utilizar el método mode() en un DataFrame de Pandas para encontrar el valor o valores que más se repiten. También aprendiste cómo especificar el eje, incluir solo columnas numéricas e incluir valores nulos. Ahora puedes utilizar este conocimiento para encontrar el valor o valores más frecuentes en tus propios proyectos de análisis de datos.