Método expandiendo del DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, exploraremos el método expanding() del DataFrame de Pandas. Este método es parte de las funciones de ventana en Pandas y se utiliza para transformaciones expandidas. Devuelve un objeto de ventana para la operación especificada.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos rápidamente el problema para usted.

Importar las bibliotecas necesarias

Primero, debemos importar las bibliotecas requeridas, específicamente Pandas. Usaremos el alias pd para referirnos a la biblioteca de Pandas.

import pandas as pd

Crear el DataFrame

A continuación, crearemos un DataFrame con el que trabajar. En este ejemplo, usaremos un DataFrame con las columnas 'A' y 'B'.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

Aplicar el método expanding para calcular la suma acumulativa

Ahora, apliquemos el método expanding() para calcular la suma acumulativa de todo el DataFrame.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

Almacenar el resultado en una nueva columna

También podemos almacenar el resultado del cálculo expandido en una nueva columna del DataFrame. En este ejemplo, almacenaremos la suma acumulativa de la columna 'A' en una nueva columna'resultado'.

df['result'] = df['A'].expanding().sum()
print(df)

Calcular la suma acumulativa a lo largo del eje de filas

Además, podemos calcular la suma acumulativa de todo el DataFrame a lo largo del eje de filas.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

Especificar el número mínimo de observaciones requeridas

También podemos especificar el número mínimo de observaciones necesarias para que el cálculo expandido tenga un valor. Esto se puede hacer utilizando el parámetro min_periods. En este ejemplo, estableceremos min_periods = 2.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

Resumen

En este laboratorio, aprendimos sobre el método expanding() en el DataFrame de Pandas. Aplicamos este método para calcular la suma acumulativa de un DataFrame, almacenar el resultado en una nueva columna, calcular la suma acumulativa a lo largo del eje de filas y especificar un número mínimo de observaciones para el cálculo expandido. El método expanding() es útil para explorar la suma acumulativa de datos a lo largo del tiempo.