Méthode cumsum() du DataFrame Pandas

Beginner

Introduction

La méthode cumsum() du DataFrame Pandas est utilisée pour calculer la somme cumulative le long d'un axe d'un DataFrame ou d'une Séries. Elle renvoie un DataFrame ou une Séries de même taille qui contient la somme cumulative.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'étude pour accéder à Jupyter Notebook et pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.

Importer les bibliothèques requises

Pour utiliser la méthode cumsum(), nous devons importer la bibliothèque pandas.

import pandas as pd

Créer un DataFrame

Ensuite, nous devons créer un DataFrame à l'aide des données sur lesquelles nous voulons effectuer la somme cumulative. Par exemple :

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

Calculer la somme cumulative le long de l'axe des index

Pour calculer la somme cumulative le long de l'axe des index, nous pouvons utiliser la méthode cumsum() sur le DataFrame. Par défaut, la méthode cumsum() calcule la somme colonne par colonne, donc nous devons spécifier l'axe comme étant 0.

result = df.cumsum(axis=0)

Calculer la somme cumulative le long de l'axe des colonnes

Pour calculer la somme cumulative le long de l'axe des colonnes, nous pouvons à nouveau utiliser la méthode cumsum() sur le DataFrame, mais cette fois-ci nous spécifions l'axe comme étant 1.

result = df.cumsum(axis=1)

Gérer les valeurs nulles dans le DataFrame

Si le DataFrame contient des valeurs nulles, par défaut la méthode cumsum() saute ces valeurs. Cependant, nous pouvons changer ce comportement et inclure les valeurs nulles dans le calcul de la somme cumulative en spécifiant skipna=False.

result = df.cumsum(axis=0, skipna=False)

Résumé

La méthode cumsum() dans Pandas nous permet de calculer la somme cumulative le long d'un axe d'un DataFrame ou d'une Séries. Elle peut être utilisée pour effectuer des calculs de somme cumulative sur les axes des index et des colonnes. La méthode offre également l'option d'inclure ou d'exclure les valeurs nulles du calcul.