Método cumprod() de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos sobre el método cumprod() de la biblioteca Python Pandas. El método cumprod() se utiliza para calcular el producto acumulado de un DataFrame o Serie a lo largo de un eje especificado. Devuelve un nuevo DataFrame o Serie del mismo tamaño que el original, que contiene los valores del producto acumulado.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos el problema rápidamente para usted.

Importar las bibliotecas necesarias

Para comenzar, necesitamos importar la biblioteca pandas, que nos permitirá trabajar con DataFrames.

import pandas as pd

Crear un DataFrame

A continuación, crearemos un DataFrame en el que podamos realizar la operación de producto acumulado. Vamos a crear un DataFrame simple con dos columnas, 'A' y 'B', utilizando la función pd.DataFrame().

## Create the DataFrame
df = pd.DataFrame({"A":[1, 2, 3, 4], "B":[5, 6, 7, 8]})
print(df)

Encontrar el producto acumulado sobre el eje de índice

Ahora, usemos el método cumprod() para calcular el producto acumulado sobre el eje de índice. Podemos especificar el parámetro de eje como 0 o 'index' para realizar la operación a lo largo del eje de índice. El resultado será un nuevo DataFrame con los valores del producto acumulado.

## Find cumulative product over index axis
cumulative_product_index = df.cumprod(axis=0)
print(cumulative_product_index)

Encontrar el producto acumulado sobre el eje de columnas

Del mismo modo, podemos calcular el producto acumulado sobre el eje de columnas especificando el parámetro de eje como 1 o 'columns'. Esto realizará la operación a lo largo del eje de columnas y devolverá un nuevo DataFrame con los valores del producto acumulado.

## Find cumulative product over column axis
cumulative_product_columns = df.cumprod(axis=1)
print(cumulative_product_columns)

Manejar valores nulos

Si el DataFrame contiene valores nulos o NaN, podemos manejarlos utilizando el parámetro skipna. Por defecto, skipna está establecido en True, lo que significa que los valores NA/nulos se excluyen. Si queremos incluir estos valores en el cálculo del producto acumulado, podemos establecer skipna en False.

## Create a DataFrame with missing values
df_with_null = pd.DataFrame({"A":[1, 2, 3, 4], "B":[5, 6, None, 8]})
print(df_with_null)

## Find cumulative product with missing values
cumulative_product_null = df_with_null.cumprod(skipna=False)
print(cumulative_product_null)

Resumen

¡Felicitaciones! Has aprendido cómo usar el método cumprod() en Python Pandas para calcular el producto acumulado de un DataFrame o Serie a lo largo de un eje especificado. Recuerda que el método cumprod() es una herramienta útil para analizar tendencias y patrones de crecimiento en tus datos. Sigue experimentando y explorando los otros métodos disponibles en la biblioteca Pandas para ampliar tus capacidades de manipulación de datos.