Pandas DataFrame Max Methode: Entschlüsseln von Dateninsights

Einführung

In diesem Lab werden wir uns die max()-Methode in einem Pandas DataFrame ansehen. Diese Methode wird verwendet, um den maximalen Wert in einem DataFrame zu finden. Wir werden die Syntax, die Parameter und die Verwendung dieser Methode anhand von Beispielen erkunden.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Erstelle einen DataFrame

Zunächst erstellen wir ein DataFrame, um die max()-Methode zu verstehen und zu sehen, wie sie funktioniert. Wir werden den folgenden Code verwenden:

import pandas as pd

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})

print(df)

Dieser Code erstellt ein DataFrame mit vier Spalten: A, B, C und D. Jede Spalte hat drei Werte.

Suche maximale Werte über der Indexachse

Als nächstes suchen wir die maximalen Werte über der Indexachse (Zeilen) des DataFrames. Wir übergeben axis=0 als Parameter an die max()-Methode. Siehe den folgenden Code:

max_values = df.max(axis=0)

print(max_values)

Dieser Code druckt die maximalen Werte über der Indexachse für jede Spalte aus.

Suche maximale Werte über der Spaltenachse

Jetzt suchen wir die maximalen Werte über der Spaltenachse (Spalten) des DataFrames. Wir übergeben axis=1 als Parameter an die max()-Methode. Siehe den folgenden Code:

max_values = df.max(axis=1)

print(max_values)

Dieser Code druckt die maximalen Werte über der Spaltenachse für jede Zeile aus.

Inkludiere Null-Werte

Manchmal kann unser DataFrame Nullwerte enthalten. Um Nullwerte bei der Berechnung des Maximums zu berücksichtigen, können wir den Parameter skipna=False verwenden. Siehe den folgenden Code:

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})

max_values = df.max(axis=0, skipna=False)

print(max_values)

Dieser Code druckt die maximalen Werte über der Indexachse, einschließlich der Nullwerte, aus.

Ausschließen von Null-Werten

Um Nullwerte bei der Berechnung des Maximums auszuschließen, können wir den Parameter skipna=True verwenden. Siehe den folgenden Code:

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})

max_values = df.max(axis=0, skipna=True)

print(max_values)

Dieser Code druckt die maximalen Werte über der Indexachse, wobei Nullwerte ausgeschlossen sind.

Zusammenfassung

In diesem Lab haben wir uns mit der max()-Methode im Pandas DataFrame beschäftigt. Wir haben untersucht, wie man die maximalen Werte über der Indexachse und der Spaltenachse findet, inklusive oder exklusive Nullwerte. Die max()-Methode ist hilfreich bei der Suche nach den höchsten Werten in einem DataFrame und kann auf verschiedene Anwendungsfälle angewendet werden. Stellen Sie sicher, die Syntax und die Parameter der max()-Methode zu überprüfen, um sie effektiv in Ihren eigenen Projekten anzuwenden.