Méthode d'expansion de la DataFrame de Pandas

Beginner

Introduction

Dans ce laboratoire, nous allons explorer la méthode expanding() de la DataFrame Pandas. Cette méthode est partie des fonctions fenêtres de Pandas et est utilisée pour les transformations en expansion. Elle renvoie un objet fenêtre pour l'opération spécifiée.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Carnet de notes pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.

Importer les bibliothèques nécessaires

Tout d'abord, nous devons importer les bibliothèques requises, à savoir Pandas. Nous utiliserons l'alias pd pour désigner la bibliothèque Pandas.

import pandas as pd

Créer la DataFrame

Ensuite, nous allons créer une DataFrame avec laquelle travailler. Dans cet exemple, nous utiliserons une DataFrame avec les colonnes 'A' et 'B'.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

Appliquer la méthode d'expansion pour calculer la somme cumulative

Maintenant, appliquons la méthode expanding() pour calculer la somme cumulative de l'ensemble de la DataFrame.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

Stocker le résultat dans une nouvelle colonne

Nous pouvons également stocker le résultat du calcul en expansion dans une nouvelle colonne de la DataFrame. Dans cet exemple, nous allons stocker la somme cumulative de la colonne 'A' dans une nouvelle colonne'result'.

df['result'] = df['A'].expanding().sum()
print(df)

Calculer la somme cumulative le long de l'axe des lignes

De plus, nous pouvons calculer la somme cumulative de l'ensemble de la DataFrame le long de l'axe des lignes.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

Spécifier le nombre minimum d'observations requises

Nous pouvons également spécifier le nombre minimum d'observations requises pour que le calcul en expansion ait une valeur. Cela peut être fait en utilisant le paramètre min_periods. Dans cet exemple, nous allons définir min_periods = 2.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

Résumé

Dans ce laboratoire, nous avons appris à connaître la méthode expanding() dans la DataFrame de Pandas. Nous avons appliqué cette méthode pour calculer la somme cumulative d'une DataFrame, stocker le résultat dans une nouvelle colonne, calculer la somme cumulative le long de l'axe des lignes et spécifier un nombre minimum d'observations pour le calcul en expansion. La méthode expanding() est utile pour explorer la somme cumulative des données au fil du temps.