Meisterung der Pandas DataFrame Mittelwertmethode

Einführung

In diesem Lab werden wir lernen, wie man die mean()-Methode in der Pandas-Bibliothek verwendet, um die Mittelwerte eines DataFrames zu berechnen. Die mean()-Methode kann verwendet werden, um den Mittelwert entlang der Index- oder Spaltenachse des DataFrames zu berechnen.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken

Zunächst importieren wir die erforderlichen Bibliotheken, Pandas und NumPy, mit dem folgenden Code:

import pandas as pd
import numpy as np

Erstelle einen DataFrame

Als nächstes erstellen wir ein DataFrame mit dem folgenden Code:

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})

Berechne den Mittelwert entlang der Indexachse

Um den Mittelwert entlang der Indexachse des DataFrames zu berechnen, können wir die mean()-Methode mit dem Parameter axis=0 verwenden. Hier ist ein Beispiel:

mean_index = df.mean(axis=0)
print(mean_index)

Berechne den Mittelwert entlang der Spaltenachse

Um den Mittelwert entlang der Spaltenachse des DataFrames zu berechnen, können wir die mean()-Methode mit dem Parameter axis=1 verwenden. Hier ist ein Beispiel:

mean_column = df.mean(axis=1)
print(mean_column)

Behandle leere Werte

Standardmäßig ignoriert die mean()-Methode Null-Werte beim Berechnen des Mittelwerts. Wir können jedoch dieses Verhalten ändern, indem wir den Parameter skipna auf False setzen. Hier ist ein Beispiel für die Berechnung des Mittelwerts entlang der Indexachse mit Null-Werten:

df_with_null = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
mean_null = df_with_null.mean(axis=0, skipna=False)
print(mean_null)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die mean()-Methode in der Pandas-Bibliothek verwendet, um Mittelwerte eines DataFrames zu berechnen. Wir haben gesehen, wie man den Mittelwert entlang der Index- und Spaltenachsen berechnet und wie man Null-Werte beim Berechnen des Mittelwerts behandelt. Die mean()-Methode ist ein nützliches Werkzeug zur Analyse und Zusammenfassung von Daten in Pandas-DataFrames.

Fazit

Die mean()-Methode in der Pandas-Bibliothek ist ein leistungsstarkes Werkzeug zur Berechnung von Mittelwerten von DataFrames. Sie bietet Flexibilität bei der Berechnung des Mittelwerts entlang unterschiedlicher Achsen und behandelt Null-Werte angemessen. Das Verständnis, wie man die mean()-Methode verwendet, ist eine essentielle Fähigkeit für die Datenanalyse mit Pandas.

Zusammenfassung

Herzlichen Glückwunsch! Sie haben das Lab über die mean()-Methode von Pandas-DataFrames abgeschlossen. Sie können in LabEx weitere Labs absolvieren, um Ihre Fähigkeiten zu verbessern.