Méthode cummax() pour les DataFrame de Pandas

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à utiliser la méthode cummax() de la bibliothèque pandas. La méthode cummax() est utilisée pour calculer le maximum cumulé sur un axe d'un DataFrame ou d'une Séries. Elle renvoie un DataFrame ou une Séries de la même taille, contenant les valeurs maximales cumulées.

Conseils sur la VM

Une fois le démarrage de la VM terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importez la bibliothèque pandas

Pour utiliser la méthode cummax(), nous devons tout d'abord importer la bibliothèque pandas. Nous pouvons le faire en exécutant le code suivant :

import pandas as pd

Créez un DataFrame

Ensuite, nous devons créer un DataFrame sur lequel nous pouvons appliquer la méthode cummax(). Nous pouvons créer un DataFrame en utilisant la fonction pd.DataFrame() et en passant un dictionnaire. Chaque clé dans le dictionnaire représente un nom de colonne, et la valeur correspondante est une liste contenant les données de la colonne.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

Appliquez la méthode cummax()

Maintenant, nous pouvons appliquer la méthode cummax() à notre DataFrame. La méthode cummax() prend trois paramètres optionnels : axis, skipna et d'autres args/kwargs.

Le paramètre axis est utilisé pour spécifier l'axe le long duquel le maximum cumulé doit être calculé. Par défaut, il est défini sur 0 ou 'index', ce qui signifie que le maximum cumulé sera calculé sur l'axe des index. Si défini sur 1 ou 'columns', le maximum cumulé sera calculé sur l'axe des colonnes.

Le paramètre skipna est un booléen qui détermine si les valeurs NA/null doivent être exclues du calcul. Si défini sur True, les valeurs NA/null seront exclues. Si défini sur False, les valeurs NA/null seront incluses.

Pour appliquer la méthode cummax(), nous pouvons utiliser le code suivant :

df_cummax = df.cummax(axis=0, skipna=True)

Affichez le résultat

Enfin, nous pouvons afficher le résultat de la méthode cummax() pour voir les valeurs maximales cumulées.

print(df_cummax)

Récapitulatif

Dans ce laboratoire, nous avons appris à utiliser la méthode cummax() de la bibliothèque pandas pour calculer le maximum cumulé sur un axe d'un DataFrame ou d'une Séries. Nous avons vu comment importer la bibliothèque pandas, créer un DataFrame, appliquer la méthode cummax() avec des paramètres optionnels et afficher le résultat. La méthode cummax() est utile pour analyser les tendances et trouver les plus hautes valeurs dans un ensemble de données au fil du temps. Elle peut être un outil précieux dans les processus d'analyse de données et de prise de décision.