Pandas DataFrame Median Methode

Beginner

Einführung

In diesem Lab werden wir lernen, wie man die median()-Methode in der Pandas-Bibliothek verwendet, um den Median von Werten in einem DataFrame zu berechnen. Die median()-Methode ermöglicht es uns, den Mittelwert in einem Datensatz zu finden und somit einen Maßstab für die zentrale Tendenz zu erhalten.

Tipps für die VM

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die pandas-Bibliothek

Zunächst müssen wir die 'pandas'-Bibliothek importieren, die üblicherweise zur Datenmanipulation und -analyse verwendet wird.

import pandas as pd

Erstelle ein DataFrame

Als nächstes werden wir ein DataFrame-Objekt mithilfe des pd.DataFrame()-Konstruktors erstellen. Dies wird uns ermöglichen, unsere Daten zu speichern und zu manipulieren.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)

Berechne den Median entlang der Indexachse

Um den Median entlang der Indexachse des DataFrames zu berechnen, können wir die median()-Methode mit dem axis-Parameter auf 0 gesetzt verwenden.

print("---------------------------")
print(df.median(axis=0))

Berechne den Median entlang der Spaltenachse

Um den Median entlang der Spaltenachse des DataFrames zu berechnen, können wir die median()-Methode mit dem axis-Parameter auf 1 gesetzt verwenden.

print("---------------------------")
print(df.median(axis=1))

Behandlung von NULL-Werten

Wenn unser DataFrame NULL-Werte enthält, können wir sie behandeln, indem wir den skipna-Parameter angeben. Standardmäßig ist skipna auf True gesetzt, was NULL-Werte bei der Berechnung des Medians ausschließt. Wenn wir NULL-Werte berücksichtigen möchten, können wir skipna auf False setzen.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die median()-Methode in Pandas verwendet, um den Median von Werten in einem DataFrame zu berechnen. Wir haben untersucht, wie man den Median entlang der Indexachse und der Spaltenachse berechnet. Darüber hinaus haben wir gelernt, wie man NULL-Werte bei der Berechnung des Medians behandelt. Das Berechnen des Medians ist hilfreich, um die zentrale Tendenz eines Datensatzes zu verstehen und kann bei der Datenanalyse verwendet werden, um informierte Entscheidungen zu treffen.