Pandas DataFrame Cumsum-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die cumsum()-Methode des Pandas DataFrames wird verwendet, um die kumulative Summe über eine Achse eines DataFrames oder einer Series zu berechnen. Sie gibt ein DataFrame oder eine Series der gleichen Größe zurück, die die kumulative Summe enthält.

Tipps für die virtuelle Maschine

Nachdem der Start der virtuellen Maschine abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken

Um die cumsum()-Methode zu verwenden, müssen wir die pandas-Bibliothek importieren.

import pandas as pd

Erstellen eines DataFrames

Als nächstes müssen wir ein DataFrame mit den Daten erstellen, auf denen wir die kumulative Summe berechnen möchten. Beispielsweise:

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

Berechnen der kumulativen Summe über die Indexachse

Um die kumulative Summe über die Indexachse zu berechnen, können wir die cumsum()-Methode auf dem DataFrame verwenden. Standardmäßig berechnet die cumsum()-Methode die Summe spaltenweise, daher müssen wir die Achse als 0 angeben.

result = df.cumsum(axis=0)

Berechnen der kumulativen Summe über die Spaltenachse

Um die kumulative Summe über die Spaltenachse zu berechnen, können wir erneut die cumsum()-Methode auf dem DataFrame verwenden, aber diesmal geben wir die Achse als 1 an.

result = df.cumsum(axis=1)

Umgang mit NULL-Werten im DataFrame

Wenn das DataFrame NULL-Werte enthält, überspringt die cumsum()-Methode standardmäßig diese Werte. Wir können jedoch dieses Verhalten ändern und die NULL-Werte in die Berechnung der kumulativen Summe einbeziehen, indem wir skipna=False angeben.

result = df.cumsum(axis=0, skipna=False)

Zusammenfassung

Die cumsum()-Methode in Pandas ermöglicht es uns, die kumulative Summe über eine Achse eines DataFrames oder einer Series zu berechnen. Sie kann verwendet werden, um kumulative Summenberechnungen sowohl über die Index- als auch über die Spaltenachse durchzuführen. Die Methode bietet auch die Option, NULL-Werte bei der Berechnung mit einzubeziehen oder auszuschließen.