Método mean() de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método mean() de la biblioteca Pandas para calcular los valores promedio de un DataFrame. El método mean() se puede usar para calcular el promedio a lo largo del eje de índice o de columna del DataFrame.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar las bibliotecas necesarias

Primero, importemos las bibliotecas necesarias, Pandas y NumPy, usando el siguiente código:

import pandas as pd
import numpy as np

Crear un DataFrame

A continuación, creemos un DataFrame usando el siguiente código:

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})

Calcular el promedio a lo largo del eje de índice

Para calcular el promedio a lo largo del eje de índice del DataFrame, podemos usar el método mean() con el parámetro axis=0. Aquí hay un ejemplo:

mean_index = df.mean(axis=0)
print(mean_index)

Calcular el promedio a lo largo del eje de columna

Para calcular el promedio a lo largo del eje de columna del DataFrame, podemos usar el método mean() con el parámetro axis = 1. Aquí hay un ejemplo:

mean_column = df.mean(axis=1)
print(mean_column)

Manejar valores nulos

Por defecto, el método mean() excluye los valores nulos al calcular el promedio. Sin embargo, podemos cambiar este comportamiento estableciendo el parámetro skipna en False. Aquí hay un ejemplo de cálculo del promedio a lo largo del eje de índice con valores nulos:

df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)

Resumen

En este laboratorio, aprendimos cómo usar el método mean() en la biblioteca Pandas para calcular los valores promedio de un DataFrame. Vimos cómo calcular el promedio a lo largo de los ejes de índice y columna, y cómo manejar los valores nulos al calcular el promedio. El método mean() es una herramienta útil para analizar y resumir datos en DataFrames de Pandas.

Conclusión

El método mean() en la biblioteca Pandas es una herramienta poderosa para calcular los valores promedio de los DataFrames. Proporciona flexibilidad al calcular el promedio a lo largo de diferentes ejes y maneja adecuadamente los valores nulos. Comprender cómo usar el método mean() es una habilidad esencial para el análisis de datos con Pandas.

Resumen

¡Felicitaciones! Has completado el laboratorio del método mean() de DataFrame de Pandas. Puedes practicar más laboratorios en LabEx para mejorar tus habilidades.