Pandas DataFrame expandierende Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir die expanding()-Methode des Pandas DataFrames erkunden. Diese Methode ist Teil der Fensterfunktionen in Pandas und wird für expandierende Transformationen verwendet. Sie gibt ein Fensterobjekt für die angegebene Operation zurück.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Operationen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Zunächst müssen wir die erforderlichen Bibliotheken importieren, nämlich Pandas. Wir werden das Alias pd verwenden, um auf die Pandas-Bibliothek zu verweisen.

import pandas as pd

Erstellen des DataFrames

Als nächstes werden wir einen DataFrame erstellen, mit dem wir arbeiten können. In diesem Beispiel werden wir einen DataFrame mit den Spalten 'A' und 'B' verwenden.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

Wendung der expandierenden Methode an, um die kumulative Summe zu berechnen

Nun wenden wir die expanding()-Methode an, um die kumulative Summe des gesamten DataFrames zu berechnen.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

Speichern des Ergebnisses in einer neuen Spalte

Wir können das Ergebnis der expandierenden Berechnung auch in einer neuen Spalte des DataFrames speichern. In diesem Beispiel werden wir die kumulative Summe der Spalte 'A' in einer neuen Spalte'result' speichern.

df['result'] = df['A'].expanding().sum()
print(df)

Berechnung der kumulativen Summe entlang der Zeilenachse

Des Weiteren können wir die kumulative Summe des gesamten DataFrames entlang der Zeilenachse berechnen.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

Festlegen der Mindestanzahl von Beobachtungen erforderlich

Wir können auch die Mindestanzahl von Beobachtungen angeben, die erforderlich sind, damit die expandierende Berechnung einen Wert hat. Dies kann mit dem Parameter min_periods erreicht werden. In diesem Beispiel setzen wir min_periods = 2.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

Zusammenfassung

In diesem Lab haben wir uns mit der expanding()-Methode in einem Pandas DataFrame beschäftigt. Wir haben diese Methode angewendet, um die kumulative Summe eines DataFrames zu berechnen, das Ergebnis in einer neuen Spalte zu speichern, die kumulative Summe entlang der Zeilenachse zu berechnen und eine Mindestanzahl von Beobachtungen für die expandierende Berechnung anzugeben. Die expanding()-Methode ist nützlich, um die kumulative Summe von Daten im Laufe der Zeit zu untersuchen.