Método de mediana en DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método median() de la biblioteca Pandas para calcular la mediana de los valores en un DataFrame. El método median() nos permite encontrar el valor central en un conjunto de datos, proporcionando una medida de tendencia central.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca pandas

Primero, necesitamos importar la biblioteca 'pandas', que se utiliza comúnmente para la manipulación y análisis de datos.

import pandas as pd

Crear un DataFrame

A continuación, crearemos un objeto DataFrame utilizando el constructor pd.DataFrame(). Esto nos permitirá almacenar y manipular nuestros datos.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------El DataFrame es------")
print(df)

Calcular la mediana a lo largo del eje de índice

Para calcular la mediana a lo largo del eje de índice del DataFrame, podemos usar el método median() con el parámetro axis establecido en 0.

print("---------------------------")
print(df.median(axis=0))

Calcular la mediana a lo largo del eje de columna

Para calcular la mediana a lo largo del eje de columna del DataFrame, podemos usar el método median() con el parámetro axis establecido en 1.

print("---------------------------")
print(df.median(axis=1))

Manejo de valores nulos

Si nuestro DataFrame contiene valores nulos, podemos manejarlos especificando el parámetro skipna. Por defecto, skipna está establecido en True, lo que excluye los valores nulos al calcular la mediana. Si queremos incluir los valores nulos, podemos establecer skipna en False.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------El DataFrame es------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Resumen

En este laboratorio, aprendimos cómo usar el método median() en Pandas para calcular la mediana de los valores en un DataFrame. Exploramos cómo calcular la mediana a lo largo del eje de índice y el eje de columna. Además, aprendimos cómo manejar los valores nulos al calcular la mediana. Calcular la mediana es útil para entender la tendencia central de un conjunto de datos y se puede utilizar para tomar decisiones informadas en el análisis de datos.