Método DataFrame.diff() de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

El método Pandas DataFrame.diff() calcula la diferencia entre elementos en un DataFrame. Proporciona la primera diferencia discreta de los elementos, calculando la diferencia de un elemento de un DataFrame en comparación con otro elemento del mismo DataFrame. Por defecto, el método calcula la diferencia con el elemento anterior en la fila.

Consejos para la MV

Después de que la máquina virtual (VM) haya terminado de iniciar, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si encuentras problemas durante el aprendizaje, no dudes en preguntar a Labby. Proporciona comentarios después de la sesión y resolveremos rápidamente el problema para ti.

Importar las bibliotecas necesarias

Para utilizar el método DataFrame.diff(), primero necesitamos importar la biblioteca pandas:

import pandas as pd

Crear un DataFrame

A continuación, creemos un DataFrame que podamos utilizar para los ejemplos:

df = pd.DataFrame({'a': [1, 3, 8],'b': [3, 5, 8],'c': [16, 25, 36]})

Nuestro DataFrame tiene tres columnas ('a', 'b', 'c') y tres filas.

Calcular la diferencia con la fila anterior

Para calcular la diferencia con la fila anterior, simplemente podemos llamar al método diff() en nuestro DataFrame:

diff_previous_row = df.diff()

Esto calculará la diferencia entre cada elemento y el elemento anterior en la fila.

Calcular la diferencia entre columnas anteriores

Si queremos calcular la diferencia entre columnas anteriores en lugar de filas anteriores, podemos especificar el parámetro axis como 1:

diff_previous_column = df.diff(axis=1)

Esto calculará la diferencia entre cada elemento y el elemento anterior en la columna.

Calcular la diferencia con una fila anterior específica

También podemos calcular la diferencia con una fila anterior específica especificando el parámetro periods. Por ejemplo, para calcular la diferencia con la segunda fila anterior, podemos establecer periods en 2:

diff_second_previous_row = df.diff(periods=2)

Esto calculará la diferencia entre cada elemento y el elemento dos filas antes.

Calcular la diferencia con una columna anterior específica

De manera similar, podemos calcular la diferencia con una columna anterior específica especificando los parámetros periods y axis. Por ejemplo, para calcular la diferencia con la tercera columna anterior, podemos establecer periods en 3 y axis en 1:

diff_third_previous_column = df.diff(periods=3, axis=1)

Esto calculará la diferencia entre cada elemento y el elemento tres columnas antes.

Resumen

El método DataFrame.diff() en Pandas nos permite calcular la diferencia entre elementos en un DataFrame. Podemos calcular la diferencia con filas anteriores o columnas anteriores, así como con filas o columnas anteriores específicas. Este método es útil cuando se analizan datos de series temporales o cuando se comparan valores entre filas o columnas consecutivas. Al utilizar el método diff(), podemos calcular fácilmente los cambios o diferencias en nuestro DataFrame.