Introducción
El método pct_change() en el DataFrame de Pandas calcula el cambio porcentual en el DataFrame entre el elemento actual y el anterior. Es útil para analizar datos y calcular diferencias en ventas, de mes a mes o de año a año.
Consejos de la MV
Después de que la máquina virtual (VM) haya terminado de iniciarse, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.
A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.
Si encuentras problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona comentarios después de la sesión y resolveremos rápidamente el problema para ti.
Calcular el cambio porcentual en un DataFrame de Pandas
Para calcular el cambio porcentual en un DataFrame de Pandas, sigue estos pasos:
- Importa la librería pandas.
import pandas as pd
- Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
- Utiliza el método
pct_change()para calcular el cambio porcentual en el DataFrame.
print("-------percentage change in the dataset-------")
print(df.pct_change())
Calcular el cambio porcentual a lo largo del eje de las columnas
Para calcular el cambio porcentual a lo largo del eje de las columnas, modifica el código en el paso 1 de la siguiente manera:
- Importa la librería pandas.
import pandas as pd
- Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
- Utiliza el método
pct_change()conaxis=1para calcular el cambio porcentual a lo largo del eje de las columnas.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))
Calcular el cambio porcentual con un período especificado
Para calcular el cambio porcentual con un período especificado, modifica el código en el paso 1 de la siguiente manera:
- Importa la librería pandas.
import pandas as pd
- Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
- Utiliza el método
pct_change()conperiods = 2para calcular el cambio porcentual con un período especificado.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))
Manejar valores faltantes antes del cálculo
Para manejar los valores faltantes antes de calcular el cambio porcentual, modifica el código en el paso 1 de la siguiente manera:
- Importa la librería pandas.
import pandas as pd
- Crea un DataFrame con un índice de series temporales (time series index) y los datos deseados.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Imprime el DataFrame original.
print("----------The dataset is----------")
print(df)
- Utiliza el método
pct_change()confill_method='ffill'para manejar los valores faltantes antes del cálculo.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))
Resumen
El método pct_change() en un DataFrame de Pandas calcula el cambio porcentual entre el elemento actual y el anterior. Puede utilizarse para analizar datos y calcular diferencias, y tiene parámetros para manejar valores faltantes y especificar un período para el cálculo. Siguiendo los pasos de este tutorial, puedes utilizar el método pct_change() de manera efectiva en tus tareas de análisis de datos.