Einführung
In diesem Lab werden wir lernen, wie man die mean()-Methode in der Pandas-Bibliothek verwendet, um die Mittelwerte eines DataFrames zu berechnen. Die mean()-Methode kann verwendet werden, um den Mittelwert entlang der Index- oder Spaltenachse des DataFrames zu berechnen.
Tipps für die VM
Nachdem der VM-Start abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.
Importiere die erforderlichen Bibliotheken
Zunächst importieren wir die erforderlichen Bibliotheken, Pandas und NumPy, mit dem folgenden Code:
import pandas as pd
import numpy as np
Erstelle einen DataFrame
Als nächstes erstellen wir ein DataFrame mit dem folgenden Code:
df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
Berechne den Mittelwert entlang der Indexachse
Um den Mittelwert entlang der Indexachse des DataFrames zu berechnen, können wir die mean()-Methode mit dem Parameter axis=0 verwenden. Hier ist ein Beispiel:
mean_index = df.mean(axis=0)
print(mean_index)
Berechne den Mittelwert entlang der Spaltenachse
Um den Mittelwert entlang der Spaltenachse des DataFrames zu berechnen, können wir die mean()-Methode mit dem Parameter axis=1 verwenden. Hier ist ein Beispiel:
mean_column = df.mean(axis=1)
print(mean_column)
Behandle leere Werte
Standardmäßig ignoriert die mean()-Methode Null-Werte beim Berechnen des Mittelwerts. Wir können jedoch dieses Verhalten ändern, indem wir den Parameter skipna auf False setzen. Hier ist ein Beispiel für die Berechnung des Mittelwerts entlang der Indexachse mit Null-Werten:
df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)
Zusammenfassung
In diesem Lab haben wir gelernt, wie man die mean()-Methode in der Pandas-Bibliothek verwendet, um Mittelwerte eines DataFrames zu berechnen. Wir haben gesehen, wie man den Mittelwert entlang der Index- und Spaltenachsen berechnet und wie man Null-Werte beim Berechnen des Mittelwerts behandelt. Die mean()-Methode ist ein nützliches Werkzeug zur Analyse und Zusammenfassung von Daten in Pandas-DataFrames.
Fazit
Die mean()-Methode in der Pandas-Bibliothek ist ein leistungsstarkes Werkzeug zur Berechnung von Mittelwerten von DataFrames. Sie bietet Flexibilität bei der Berechnung des Mittelwerts entlang unterschiedlicher Achsen und behandelt Null-Werte angemessen. Das Verständnis, wie man die mean()-Methode verwendet, ist eine essentielle Fähigkeit für die Datenanalyse mit Pandas.
Zusammenfassung
Herzlichen Glückwunsch! Sie haben das Lab über die mean()-Methode von Pandas-DataFrames abgeschlossen. Sie können in LabEx weitere Labs absolvieren, um Ihre Fähigkeiten zu verbessern.