Introduction
La méthode cumsum() du DataFrame Pandas est utilisée pour calculer la somme cumulative le long d'un axe d'un DataFrame ou d'une Séries. Elle renvoie un DataFrame ou une Séries de même taille qui contient la somme cumulative.
Conseils sur la machine virtuelle
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet d'étude pour accéder à Jupyter Notebook et pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limites de Jupyter Notebook.
Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.
Importer les bibliothèques requises
Pour utiliser la méthode cumsum(), nous devons importer la bibliothèque pandas.
import pandas as pd
Créer un DataFrame
Ensuite, nous devons créer un DataFrame à l'aide des données sur lesquelles nous voulons effectuer la somme cumulative. Par exemple :
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})
Calculer la somme cumulative le long de l'axe des index
Pour calculer la somme cumulative le long de l'axe des index, nous pouvons utiliser la méthode cumsum() sur le DataFrame. Par défaut, la méthode cumsum() calcule la somme colonne par colonne, donc nous devons spécifier l'axe comme étant 0.
result = df.cumsum(axis=0)
Calculer la somme cumulative le long de l'axe des colonnes
Pour calculer la somme cumulative le long de l'axe des colonnes, nous pouvons à nouveau utiliser la méthode cumsum() sur le DataFrame, mais cette fois-ci nous spécifions l'axe comme étant 1.
result = df.cumsum(axis=1)
Gérer les valeurs nulles dans le DataFrame
Si le DataFrame contient des valeurs nulles, par défaut la méthode cumsum() saute ces valeurs. Cependant, nous pouvons changer ce comportement et inclure les valeurs nulles dans le calcul de la somme cumulative en spécifiant skipna=False.
result = df.cumsum(axis=0, skipna=False)
Résumé
La méthode cumsum() dans Pandas nous permet de calculer la somme cumulative le long d'un axe d'un DataFrame ou d'une Séries. Elle peut être utilisée pour effectuer des calculs de somme cumulative sur les axes des index et des colonnes. La méthode offre également l'option d'inclure ou d'exclure les valeurs nulles du calcul.