Pandas DataFrame.diff()-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die Methode Pandas DataFrame.diff() berechnet die Differenz zwischen Elementen in einem DataFrame. Sie liefert die erste diskrete Differenz der Elemente, indem sie die Differenz eines DataFrame-Elements im Vergleich zu einem anderen Element im DataFrame berechnet. Standardmäßig berechnet die Methode die Differenz zum vorherigen Element in der Zeile.

Tipps für die virtuelle Maschine (VM)

Nachdem die VM gestartet wurde, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und auf Jupyter Notebook für die Übung zuzugreifen.

Manchmal müssen Sie möglicherweise einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Aufgrund von Einschränkungen in Jupyter Notebook kann die Validierung von Operationen nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie umgehend beheben.

Importieren der erforderlichen Bibliotheken

Um die Methode DataFrame.diff() zu verwenden, müssen wir zunächst die pandas-Bibliothek importieren:

import pandas as pd

Erstellen eines DataFrames

Als Nächstes erstellen wir einen DataFrame, den wir für die Beispiele verwenden können:

df = pd.DataFrame({'a': [1, 3, 8],'b': [3, 5, 8],'c': [16, 25, 36]})

Unser DataFrame hat drei Spalten ('a', 'b', 'c') und drei Zeilen.

Berechnen der Differenz zur vorherigen Zeile

Um die Differenz zur vorherigen Zeile zu berechnen, können wir einfach die Methode diff() auf unserem DataFrame aufrufen:

diff_previous_row = df.diff()

Dadurch wird die Differenz zwischen jedem Element und dem vorherigen Element in der Zeile berechnet.

Berechnen der Differenz zwischen vorherigen Spalten

Wenn wir stattdessen die Differenz zwischen vorherigen Spalten anstelle von vorherigen Zeilen berechnen möchten, können wir den Parameter axis auf 1 setzen:

diff_previous_column = df.diff(axis=1)

Dadurch wird die Differenz zwischen jedem Element und dem vorherigen Element in der Spalte berechnet.

Berechnen der Differenz zu einer bestimmten vorherigen Zeile

Wir können auch die Differenz zu einer bestimmten vorherigen Zeile berechnen, indem wir den Parameter periods angeben. Beispielsweise können wir, um die Differenz zur vorvorherigen Zeile zu berechnen, periods auf 2 setzen:

diff_second_previous_row = df.diff(periods=2)

Dadurch wird die Differenz zwischen jedem Element und dem Element zwei Zeilen davor berechnet.

Berechnen der Differenz zu einer bestimmten vorherigen Spalte

Ähnlich können wir die Differenz zu einer bestimmten vorherigen Spalte berechnen, indem wir die Parameter periods und axis angeben. Beispielsweise können wir, um die Differenz zur vorvorvorherigen Spalte zu berechnen, periods auf 3 und axis auf 1 setzen:

diff_third_previous_column = df.diff(periods=3, axis=1)

Dadurch wird die Differenz zwischen jedem Element und dem Element drei Spalten davor berechnet.

Zusammenfassung

Die Methode DataFrame.diff() in Pandas ermöglicht es uns, die Differenz zwischen Elementen in einem DataFrame zu berechnen. Wir können die Differenz zu vorherigen Zeilen oder vorherigen Spalten sowie zu bestimmten vorherigen Zeilen oder Spalten berechnen. Diese Methode ist nützlich, wenn man Zeitreihendaten analysiert oder Werte zwischen aufeinanderfolgenden Zeilen oder Spalten vergleicht. Durch die Verwendung der diff()-Methode können wir die Änderungen oder Differenzen in unserem DataFrame einfach berechnen.