Método pct_change() en DataFrame de Pandas

Beginner

Introducción

El método pct_change() en el DataFrame de Pandas calcula el cambio porcentual en el DataFrame entre el elemento actual y el anterior. Es útil para analizar datos y calcular diferencias en ventas, de mes a mes o de año a año.

Consejos de la MV

Después de que la máquina virtual (VM) haya terminado de iniciarse, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si encuentras problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona comentarios después de la sesión y resolveremos rápidamente el problema para ti.

Calcular el cambio porcentual en un DataFrame de Pandas

Para calcular el cambio porcentual en un DataFrame de Pandas, sigue estos pasos:

  1. Importa la librería pandas.
import pandas as pd
  1. Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utiliza el método pct_change() para calcular el cambio porcentual en el DataFrame.
print("-------percentage change in the dataset-------")
print(df.pct_change())

Calcular el cambio porcentual a lo largo del eje de las columnas

Para calcular el cambio porcentual a lo largo del eje de las columnas, modifica el código en el paso 1 de la siguiente manera:

  1. Importa la librería pandas.
import pandas as pd
  1. Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utiliza el método pct_change() con axis=1 para calcular el cambio porcentual a lo largo del eje de las columnas.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))

Calcular el cambio porcentual con un período especificado

Para calcular el cambio porcentual con un período especificado, modifica el código en el paso 1 de la siguiente manera:

  1. Importa la librería pandas.
import pandas as pd
  1. Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utiliza el método pct_change() con periods = 2 para calcular el cambio porcentual con un período especificado.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))

Manejar valores faltantes antes del cálculo

Para manejar los valores faltantes antes de calcular el cambio porcentual, modifica el código en el paso 1 de la siguiente manera:

  1. Importa la librería pandas.
import pandas as pd
  1. Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utiliza el método pct_change() con fill_method='ffill' para manejar los valores faltantes antes del cálculo.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))

Resumen

El método pct_change() en un DataFrame de Pandas calcula el cambio porcentual entre el elemento actual y el anterior. Puede utilizarse para analizar datos y calcular diferencias, y tiene parámetros para manejar valores faltantes y especificar un período para el cálculo. Siguiendo los pasos de este tutorial, puedes utilizar el método pct_change() de manera efectiva en tus tareas de análisis de datos.