Pandas DataFrame Cummax-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie die cummax()-Methode in der pandas-Bibliothek verwendet wird. Die cummax()-Methode wird verwendet, um das kumulative Maximum über einer Achse eines DataFrames oder einer Series zu berechnen. Sie gibt einen DataFrame oder eine Series der gleichen Größe zurück, die die kumulativen Maximalwerte enthält.

VM-Tipps

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der pandas-Bibliothek

Um die cummax()-Methode zu verwenden, müssen wir zunächst die pandas-Bibliothek importieren. Wir können dies tun, indem wir den folgenden Code ausführen:

import pandas as pd

Erstellen eines DataFrames

Als nächstes müssen wir einen DataFrame erstellen, auf dem wir die cummax()-Methode anwenden können. Wir können einen DataFrame mit der pd.DataFrame()-Funktion erstellen und ein Dictionary übergeben. Jeder Schlüssel im Dictionary stellt einen Spaltennamen dar, und der zugehörige Wert ist eine Liste, die die Spalendaten enthält.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

Anwenden der cummax()-Methode

Jetzt können wir die cummax()-Methode auf unseren DataFrame anwenden. Die cummax()-Methode nimmt drei optionale Parameter: axis, skipna und zusätzliche args/kwargs.

Der axis-Parameter wird verwendet, um die Achse anzugeben, entlang der das kumulative Maximum berechnet werden soll. Standardmäßig ist er auf 0 oder 'index' gesetzt, was bedeutet, dass das kumulative Maximum über der Indexachse berechnet wird. Wenn auf 1 oder 'columns' gesetzt, wird das kumulative Maximum über der Spaltenachse berechnet.

Der skipna-Parameter ist ein boolescher Wert, der bestimmt, ob NA-/Null-Werte von der Berechnung ausgeschlossen werden sollen. Wenn auf True gesetzt, werden NA-/Null-Werte ausgeschlossen. Wenn auf False gesetzt, werden NA-/Null-Werte eingeschlossen.

Um die cummax()-Methode anzuwenden, können wir den folgenden Code verwenden:

df_cummax = df.cummax(axis=0, skipna=True)

Drucken des Ergebnisses

Schließlich können wir das Ergebnis der cummax()-Methode drucken, um die kumulativen Maximalwerte zu sehen.

print(df_cummax)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die cummax()-Methode in der pandas-Bibliothek verwendet, um das kumulative Maximum über einer Achse eines DataFrames oder einer Series zu berechnen. Wir haben gesehen, wie man die pandas-Bibliothek importiert, einen DataFrame erstellt, die cummax()-Methode mit optionalen Parametern anwendet und das Ergebnis druckt. Die cummax()-Methode ist nützlich bei der Analyse von Trends und der Suche nach den höchsten Werten in einem Datensatz im Laufe der Zeit. Sie kann ein wertvolles Werkzeug bei der Datenanalyse und bei Entscheidungsprozessen sein.