Pandas DataFrame Median Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie man die median()-Methode in der Pandas-Bibliothek verwendet, um den Median von Werten in einem DataFrame zu berechnen. Die median()-Methode ermöglicht es uns, den Mittelwert in einem Datensatz zu finden und somit einen Maßstab für die zentrale Tendenz zu erhalten.

Tipps für die VM

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der pandas-Bibliothek

Zunächst müssen wir die 'pandas'-Bibliothek importieren, die üblicherweise zur Datenmanipulation und -analyse verwendet wird.

import pandas as pd

Erstellen eines DataFrames

Als nächstes werden wir ein DataFrame-Objekt mithilfe des pd.DataFrame()-Konstruktors erstellen. Dies wird uns ermöglichen, unsere Daten zu speichern und zu manipulieren.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)

Median entlang der Indexachse berechnen

Um den Median entlang der Indexachse des DataFrames zu berechnen, können wir die median()-Methode mit dem axis-Parameter auf 0 gesetzt verwenden.

print("---------------------------")
print(df.median(axis=0))

Median entlang der Spaltenachse berechnen

Um den Median entlang der Spaltenachse des DataFrames zu berechnen, können wir die median()-Methode mit dem axis-Parameter auf 1 gesetzt verwenden.

print("---------------------------")
print(df.median(axis=1))

Umgang mit NULL-Werten

Wenn unser DataFrame NULL-Werte enthält, können wir sie behandeln, indem wir den skipna-Parameter angeben. Standardmäßig ist skipna auf True gesetzt, was NULL-Werte bei der Berechnung des Medians ausschließt. Wenn wir NULL-Werte berücksichtigen möchten, können wir skipna auf False setzen.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die median()-Methode in Pandas verwendet, um den Median von Werten in einem DataFrame zu berechnen. Wir haben untersucht, wie man den Median entlang der Indexachse und der Spaltenachse berechnet. Darüber hinaus haben wir gelernt, wie man NULL-Werte bei der Berechnung des Medians behandelt. Das Berechnen des Medians ist hilfreich, um die zentrale Tendenz eines Datensatzes zu verstehen und kann bei der Datenanalyse verwendet werden, um informierte Entscheidungen zu treffen.