Méthode pct_change() du DataFrame Pandas

PandasPandasBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

La méthode pct_change() dans le DataFrame de Pandas calcule le pourcentage de changement dans le DataFrame entre l'élément actuel et l'élément précédent. Elle est utile pour analyser les données et calculer les différences de ventes, d'un mois à l'autre ou d'une année à l'autre.

Conseils pour la machine virtuelle (VM)

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer sur l'onglet Notebook afin d'accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes lors de votre apprentissage, n'hésitez pas à demander de l'aide à Labby. Donnez votre avis après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") pandas/AdvancedOperationsGroup -.-> pandas/time_series_analysis("Time Series Analysis") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/handle_missing_values -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} python/importing_modules -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} python/using_packages -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} pandas/basic_statistics -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} pandas/time_series_analysis -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} pandas/reshape_data -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} python/data_collections -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} python/data_analysis -.-> lab-68688{{"Méthode pct_change() du DataFrame Pandas"}} end

Calculer le pourcentage de changement dans un DataFrame Pandas

Pour calculer le pourcentage de changement dans un DataFrame Pandas, suivez ces étapes :

  1. Importez la bibliothèque pandas.
import pandas as pd
  1. Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utilisez la méthode pct_change() pour calculer le pourcentage de changement dans le DataFrame.
print("-------percentage change in the dataset-------")
print(df.pct_change())

Calculer le pourcentage de changement le long de l'axe des colonnes

Pour calculer le pourcentage de changement le long de l'axe des colonnes, modifiez le code de l'étape 1 comme suit :

  1. Importez la bibliothèque pandas.
import pandas as pd
  1. Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utilisez la méthode pct_change() avec axis=1 pour calculer le pourcentage de changement le long de l'axe des colonnes.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))

Calculer le pourcentage de changement sur une période spécifiée

Pour calculer le pourcentage de changement sur une période spécifiée, modifiez le code de l'étape 1 comme suit :

  1. Importez la bibliothèque pandas.
import pandas as pd
  1. Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utilisez la méthode pct_change() avec periods=2 pour calculer le pourcentage de changement sur une période spécifiée.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))

Gérer les valeurs manquantes avant le calcul

Pour gérer les valeurs manquantes avant de calculer le pourcentage de changement, modifiez le code de l'étape 1 comme suit :

  1. Importez la bibliothèque pandas.
import pandas as pd
  1. Créez un DataFrame avec un index de série temporelle et les données souhaitées.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Affichez le DataFrame original.
print("----------The dataset is----------")
print(df)
  1. Utilisez la méthode pct_change() avec fill_method='ffill' pour gérer les valeurs manquantes avant le calcul.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))

Résumé

La méthode pct_change() dans un DataFrame Pandas calcule le pourcentage de changement entre l'élément actuel et l'élément précédent. Elle peut être utilisée pour analyser des données et calculer des différences, et elle dispose de paramètres pour gérer les valeurs manquantes et spécifier une période de calcul. En suivant les étapes de ce tutoriel, vous pouvez utiliser efficacement la méthode pct_change() dans vos tâches d'analyse de données.