Pandas DataFrame Modusmethode

Beginner

Einführung

In diesem Lab werden Sie durch die Verwendung der mode()-Methode in einem Pandas DataFrame geführt. Die mode()-Methode wird verwendet, um den oder die häufigsten auftretenden Wert(e) in einem DataFrame zu finden.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importiere die erforderlichen Bibliotheken

Zunächst importieren Sie die Pandas-Bibliothek mit dem import-Statement:

import pandas as pd

Erstelle einen DataFrame

Erstellen Sie nun einen DataFrame mit dem DataFrame()-Konstruktor. Für dieses Beispiel erstellen wir einen DataFrame mit drei Spalten: "A", "B" und "C".

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

Finde den Moduswert(en)

Um den Moduswert(e) jeder Spalte im DataFrame zu finden, verwenden Sie die mode()-Methode:

df_mode = df.mode()
print(df_mode)

Die mode()-Methode gibt einen DataFrame zurück, der den Moduswert(e) jeder Spalte enthält.

Definiere die Achse

Standardmäßig findet die mode()-Methode den Moduswert(e) entlang der Spaltenachse (axis=0). Wenn Sie den Moduswert(e) entlang der Zeilenachse finden möchten, geben Sie axis=1 an.

Beispielsweise um den Moduswert(e) entlang der Zeilenachse zu finden, verwenden Sie folgenden Code:

df_mode = df.mode(axis=1)
print(df_mode)

Include nur numerische Spalten

Wenn Sie nur numerische Spalten in der Modusberechnung einbeziehen möchten, können Sie das numeric_only-Parameter verwenden. Standardmäßig ist numeric_only auf False gesetzt. Setzen Sie es auf True, um nur numerische Spalten einzubeziehen.

Beispielsweise um nur numerische Spalten in der Modusberechnung einzubeziehen, verwenden Sie folgenden Code:

df_mode = df.mode(numeric_only=True)
print(df_mode)

Include leere Werte

Standardmäßig berücksichtigt die mode()-Methode keine Leerwerte. Wenn Sie Leerwerte in der Modusberechnung einbeziehen möchten, können Sie den dropna-Parameter verwenden. Standardmäßig ist dropna auf True gesetzt. Setzen Sie es auf False, um Leerwerte einzubeziehen.

Beispielsweise um Leerwerte in der Modusberechnung einzubeziehen, verwenden Sie folgenden Code:

df_mode = df.mode(dropna=False)
print(df_mode)

Zusammenfassung

In diesem Lab haben Sie gelernt, wie Sie die mode()-Methode in einem Pandas DataFrame verwenden, um den häufigsten auftretenden Wert(en) zu finden. Sie haben auch gelernt, wie Sie die Achse angeben, nur numerische Spalten einbeziehen und Leerwerte berücksichtigen. Jetzt können Sie diese Kenntnisse nutzen, um die Moduswert(e) in Ihren eigenen Datenanalyseprojekten zu bestimmen.