Método cummax() de DataFrame de Pandas

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, aprenderemos a usar el método cummax() de la biblioteca pandas. El método cummax() se utiliza para calcular el máximo acumulado a lo largo de un eje de un DataFrame o Serie. Devuelve un DataFrame o Serie del mismo tamaño, que contiene los valores máximos acumulados.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje su retroalimentación después de la sesión y resolveremos el problema rápidamente para usted.

Importar la biblioteca pandas

Para usar el método cummax(), primero debemos importar la biblioteca pandas. Esto se puede hacer ejecutando el siguiente código:

import pandas as pd

Crear un DataFrame

A continuación, necesitamos crear un DataFrame en el que podamos aplicar el método cummax(). Podemos crear un DataFrame utilizando la función pd.DataFrame() y pasando un diccionario. Cada clave en el diccionario representa el nombre de una columna, y el valor correspondiente es una lista que contiene los datos de la columna.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

Aplicar el método cummax()

Ahora, podemos aplicar el método cummax() a nuestro DataFrame. El método cummax() toma tres parámetros opcionales: axis, skipna y otros args/kwargs.

El parámetro axis se utiliza para especificar el eje a lo largo del cual se debe calcular el máximo acumulado. Por defecto, está establecido en 0 o 'index', lo que significa que el máximo acumulado se calculará sobre el eje del índice. Si se establece en 1 o 'columns', el máximo acumulado se calculará sobre el eje de las columnas.

El parámetro skipna es un booleano que determina si los valores NA/nulos deben excluirse del cálculo. Si se establece en True, los valores NA/nulos se excluirán. Si se establece en False, los valores NA/nulos se incluirán.

Para aplicar el método cummax(), podemos usar el siguiente código:

df_cummax = df.cummax(axis=0, skipna=True)

Imprimir el resultado

Finalmente, podemos imprimir el resultado del método cummax() para ver los valores máximos acumulados.

print(df_cummax)

Resumen

En este laboratorio, aprendimos cómo usar el método cummax() en la biblioteca pandas para calcular el máximo acumulado sobre un eje de un DataFrame o Serie. Vimos cómo importar la biblioteca pandas, crear un DataFrame, aplicar el método cummax() con parámetros opcionales e imprimir el resultado. El método cummax() es útil para analizar tendencias y encontrar los valores más altos en un conjunto de datos a lo largo del tiempo. Puede ser una herramienta valiosa en los procesos de análisis de datos y toma de decisiones.