Introduction
La méthode pct_change() dans le DataFrame de Pandas calcule le pourcentage de changement dans le DataFrame entre l'élément actuel et l'élément précédent. Elle est utile pour analyser les données et calculer les différences de ventes, d'un mois à l'autre ou d'une année à l'autre.
Conseils pour la machine virtuelle (VM)
Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer sur l'onglet Notebook afin d'accéder à Jupyter Notebook pour pratiquer.
Parfois, vous devrez peut-être attendre quelques secondes que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.
Si vous rencontrez des problèmes lors de votre apprentissage, n'hésitez pas à demander de l'aide à Labby. Donnez votre avis après la session, et nous résoudrons rapidement le problème pour vous.
Calculer le pourcentage de changement dans un DataFrame Pandas
Pour calculer le pourcentage de changement dans un DataFrame Pandas, suivez ces étapes :
- Importez la bibliothèque pandas.
import pandas as pd
- Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
- Utilisez la méthode
pct_change()pour calculer le pourcentage de changement dans le DataFrame.
print("-------percentage change in the dataset-------")
print(df.pct_change())
Calculer le pourcentage de changement le long de l'axe des colonnes
Pour calculer le pourcentage de changement le long de l'axe des colonnes, modifiez le code de l'étape 1 comme suit :
- Importez la bibliothèque pandas.
import pandas as pd
- Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
- Utilisez la méthode
pct_change()avecaxis=1pour calculer le pourcentage de changement le long de l'axe des colonnes.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))
Calculer le pourcentage de changement sur une période spécifiée
Pour calculer le pourcentage de changement sur une période spécifiée, modifiez le code de l'étape 1 comme suit :
- Importez la bibliothèque pandas.
import pandas as pd
- Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
- Utilisez la méthode
pct_change()avecperiods=2pour calculer le pourcentage de changement sur une période spécifiée.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))
Gérer les valeurs manquantes avant le calcul
Pour gérer les valeurs manquantes avant de calculer le pourcentage de changement, modifiez le code de l'étape 1 comme suit :
- Importez la bibliothèque pandas.
import pandas as pd
- Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
- Utilisez la méthode
pct_change()avecfill_method='ffill'pour gérer les valeurs manquantes avant le calcul.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))
Résumé
La méthode pct_change() dans un DataFrame Pandas calcule le pourcentage de changement entre l'élément actuel et l'élément précédent. Elle peut être utilisée pour analyser des données et calculer des différences, et elle dispose de paramètres pour gérer les valeurs manquantes et spécifier une période de calcul. En suivant les étapes de ce tutoriel, vous pouvez utiliser efficacement la méthode pct_change() dans vos tâches d'analyse de données.