Método agg() de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderá a usar el método agg() de la biblioteca pandas para agregar datos en un DataFrame. Este método le permite realizar una o más operaciones en un eje especificado, como filas o columnas, y devuelve un escalar, una Serie o un DataFrame según la función elegida.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca pandas

Primero, debe importar la biblioteca pandas usando la declaración import:

import pandas as pd

Crear un DataFrame

A continuación, cree un objeto DataFrame con el que trabajar. Puede usar la función pd.DataFrame() para crear un DataFrame a partir de una lista o matriz. Aquí hay un ejemplo:

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

Agregando un DataFrame con una sola función sobre las filas

Para agregar el DataFrame usando una sola función, puede usar el método agg(). Especifique la función que desea aplicar a las filas usando un nombre de función de cadena o un objeto de función. Aquí hay un ejemplo:

print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))

Agregando un DataFrame con una sola función sobre las columnas

Para agregar el DataFrame usando una sola función sobre las columnas, establezca el parámetro axis en 'columns'. Esto aplicará la función a cada columna en lugar de a cada fila. Aquí hay un ejemplo:

print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))

Agregando un DataFrame con una lista de funciones sobre las filas y columnas

También puede agregar el DataFrame usando una lista de funciones. Esto le permite realizar múltiples operaciones en las filas o columnas. Aquí hay un ejemplo:

print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))

Agregando un DataFrame con funciones diferentes sobre las columnas

Para mayor flexibilidad, puede pasar un diccionario con nombres de columnas y funciones correspondientes al método agg(). Esto le permite aplicar diferentes funciones a diferentes columnas. Aquí hay un ejemplo:

print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

Resumen

En este laboratorio, aprendiste cómo usar el método agg() en pandas para agregar datos en un DataFrame. Ahora sabes cómo aplicar una sola función y múltiples funciones sobre las filas y columnas del DataFrame. Este método es útil para realizar diversas operaciones de agregación en tus datos. Experimenta con diferentes funciones y ejes para analizar y resumir tu DataFrame. ¡Que disfrutes del análisis!