Pandas DataFrame pct_change-Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die Methode pct_change() im Pandas DataFrame berechnet die prozentuale Änderung im DataFrame zwischen dem aktuellen und dem vorherigen Element. Sie ist nützlich für die Analyse von Daten und die Berechnung von Unterschieden in den Verkäufen von Monat zu Monat oder von Jahr zu Jahr.

VM-Tipps

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und auf Jupyter Notebook für die Übung zuzugreifen.

Manchmal müssen Sie möglicherweise einige Sekunden warten, bis das Laden von Jupyter Notebook abgeschlossen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem umgehend für Sie lösen.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL pandas(("Pandas")) -.-> pandas/DataCleaningGroup(["Data Cleaning"]) python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) pandas(("Pandas")) -.-> pandas/AdvancedOperationsGroup(["Advanced Operations"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas/DataCleaningGroup -.-> pandas/handle_missing_values("Handling Missing Values") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") python/ModulesandPackagesGroup -.-> python/using_packages("Using Packages") pandas/DataAnalysisGroup -.-> pandas/basic_statistics("Basic Statistics") pandas/AdvancedOperationsGroup -.-> pandas/time_series_analysis("Time Series Analysis") pandas/AdvancedOperationsGroup -.-> pandas/reshape_data("Reshaping Data") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/handle_missing_values -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} python/importing_modules -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} python/using_packages -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} pandas/basic_statistics -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} pandas/time_series_analysis -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} pandas/reshape_data -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} python/data_collections -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} python/data_analysis -.-> lab-68688{{"Pandas DataFrame pct_change-Methode"}} end

Berechnung der prozentualen Änderung in einem Pandas DataFrame

Um die prozentuale Änderung in einem Pandas DataFrame zu berechnen, befolgen Sie diese Schritte:

  1. Importieren Sie die pandas-Bibliothek.
import pandas as pd
  1. Erstellen Sie einen DataFrame mit einem Zeitreihenindex und den gewünschten Daten.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Geben Sie den ursprünglichen DataFrame aus.
print("----------The dataset is----------")
print(df)
  1. Verwenden Sie die Methode pct_change(), um die prozentuale Änderung im DataFrame zu berechnen.
print("-------percentage change in the dataset-------")
print(df.pct_change())

Berechnung der prozentualen Änderung entlang der Spaltenachse

Um die prozentuale Änderung entlang der Spaltenachse zu berechnen, ändern Sie den Code in Schritt 1 wie folgt:

  1. Importieren Sie die pandas-Bibliothek.
import pandas as pd
  1. Erstellen Sie einen DataFrame mit einem Zeitreihenindex und den gewünschten Daten.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Geben Sie den ursprünglichen DataFrame aus.
print("----------The dataset is----------")
print(df)
  1. Verwenden Sie die Methode pct_change() mit axis=1, um die prozentuale Änderung entlang der Spaltenachse zu berechnen.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))

Berechnung der prozentualen Änderung für einen bestimmten Zeitraum

Um die prozentuale Änderung für einen bestimmten Zeitraum zu berechnen, ändern Sie den Code in Schritt 1 wie folgt:

  1. Importieren Sie die pandas-Bibliothek.
import pandas as pd
  1. Erstellen Sie einen DataFrame mit einem Zeitreihenindex und den gewünschten Daten.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Geben Sie den ursprünglichen DataFrame aus.
print("----------The dataset is----------")
print(df)
  1. Verwenden Sie die Methode pct_change() mit periods=2, um die prozentuale Änderung für einen bestimmten Zeitraum zu berechnen.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))

Umgang mit fehlenden Werten vor der Berechnung

Um mit fehlenden Werten vor der Berechnung der prozentualen Änderung umzugehen, ändern Sie den Code in Schritt 1 wie folgt:

  1. Importieren Sie die pandas-Bibliothek.
import pandas as pd
  1. Erstellen Sie einen DataFrame mit einem Zeitreihenindex und den gewünschten Daten.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. Geben Sie den ursprünglichen DataFrame aus.
print("----------The dataset is----------")
print(df)
  1. Verwenden Sie die Methode pct_change() mit fill_method='ffill', um mit fehlenden Werten vor der Berechnung umzugehen.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))

Zusammenfassung

Die Methode pct_change() im Pandas DataFrame berechnet die prozentuale Änderung zwischen dem aktuellen und dem vorherigen Element. Sie kann zur Datenanalyse und zur Berechnung von Unterschieden verwendet werden und verfügt über Parameter, um fehlende Werte zu behandeln und einen Zeitraum für die Berechnung festzulegen. Indem Sie die Schritte in diesem Tutorial befolgen, können Sie die Methode pct_change() effektiv in Ihren Datenanalyseaufgaben einsetzen.