Pandas DataFrame Mad Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernst du, wie du die mad()-Methode in der Pandas-Bibliothek verwenden kannst, um die mittlere absolute Abweichung eines DataFrames zu berechnen. Die mittlere absolute Abweichung ist ein Maß für die Variation in einem Datensatz und wird definiert als die durchschnittliche Entfernung zwischen jedem Datenwert und der durchschnittlichen Zahl.

Tipps für die virtuelle Maschine (VM)

Nachdem der Start der VM abgeschlossen ist, klicke in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal musst du einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn du bei der Lernphase Probleme hast, kannst du Labby gerne fragen. Gib nach der Sitzung Feedback, und wir werden das Problem für dich prompt beheben.

Importiere die erforderlichen Bibliotheken

Zunächst importiere die pandas-Bibliothek als pd. Dadurch kannst du das Pandas DataFrame und seine mad()-Methode verwenden.

import pandas as pd

Erstelle ein DataFrame

Als nächstes erstelle ein DataFrame, mit dem du arbeiten kannst. In diesem Beispiel erstellst du ein DataFrame mit vier Spalten (A, B, C und D) und drei Zeilen.

df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6], "C": [7, 8, 9], "D": [10, 11, 12]})

Berechne die mittlere absolute Abweichung

Jetzt, da du ein DataFrame hast, kannst du die mittlere absolute Abweichung mit der mad()-Methode berechnen. Um die mittlere absolute Abweichung über die Indexachse zu berechnen, gib axis=0 als Argument an.

mad_index = df.mad(axis=0)

Um die mittlere absolute Abweichung über die Spaltenachse zu berechnen, gib axis=1 als Argument an.

mad_columns = df.mad(axis=1)

Drucke die Ergebnisse

Schließlich kannst du die Werte der mittleren absoluten Abweichung ausdrucken.

print("Mittlere absolute Abweichung über die Indexachse:")
print(mad_index)

print("Mittlere absolute Abweichung über die Spaltenachse:")
print(mad_columns)

Zusammenfassung

In diesem Lab hast du gelernt, wie du die mad()-Methode in der Pandas-Bibliothek verwendest, um die mittlere absolute Abweichung eines DataFrames zu berechnen. Die mittlere absolute Abweichung ist ein Maß für die Variation in einem Datensatz und wird definiert als der durchschnittliche Abstand zwischen jedem Datenwert und der durchschnittlichen (Mittelwert). Indem du den in diesem Lab beschriebenen Schritten folgst, solltest du jetzt in der Lage sein, die mad()-Methode auf deine eigenen DataFrames anzuwenden und die Variation in deinen Daten zu analysieren.