Pandas DataFrame Nunique Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir uns mit der DataFrame.nunique()-Methode von Python pandas befassen. Diese Methode wird verwendet, um die Anzahl der unterschiedlichen oder einzigartigen Beobachtungen in einem pandas DataFrame zu zählen.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der pandas-Bibliothek

Bevor wir beginnen, müssen wir die pandas-Bibliothek importieren, die für die Datenmanipulation und -analyse verwendet wird. Wir können sie mit dem folgenden Code importieren:

import pandas as pd

Erstellen eines DataFrames

Lassen Sie uns ein Beispiel-DataFrame erstellen, mit dem wir arbeiten können. Wir werden die pd.DataFrame()-Funktion verwenden, um ein DataFrame mit drei Spalten, A, B und C, und drei Zeilen Daten zu erstellen. In jeder Spalte werden einige Duplikate vorhanden sein.

df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1], 'C': [2, 5, 5]})

Zählen der einzigartigen Werte im DataFrame

Lassen Sie uns jetzt die DataFrame.nunique()-Methode verwenden, um die Anzahl der einzigartigen Werte im DataFrame zu zählen. Wir können den axis-Parameter auf "0" festlegen, um die einzigartigen Werte über der Indexachse (Spalten) zu zählen, oder auf "1", um die einzigartigen Werte über der Spaltenachse (Zeilen) zu zählen.

print("Anzahl der einzigartigen Werte in jeder Spalte:")
print(df.nunique(axis=0))

print("Anzahl der einzigartigen Werte in jeder Zeile:")
print(df.nunique(axis=1))

Umgang mit NULL-Werten

Standardmäßig werden NULL-Werte von der DataFrame.nunique()-Methode bei der Zählung nicht berücksichtigt. Wenn eine Spalte NULL-Werte enthält, wird diese als "0" gezählt. Lassen Sie uns ein weiteres DataFrame mit einigen NULL-Werten erstellen und erneut die einzigartigen Werte zählen.

df = pd.DataFrame({'A': [1, None, 3], 'B': [1, None, 1], 'C': [2, None, 5]})

Zählen der einzigartigen Werte mit NULL-Werten

Lassen Sie uns die einzigartigen Werte in diesem neuen DataFrame zählen, einschließlich der NULL-Werte.

print("Anzahl der einzigartigen Werte in jeder Zeile mit NULL-Werten:")
print(df.nunique(axis=1))

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die DataFrame.nunique()-Methode in pandas verwendet, um die Anzahl der einzigartigen Werte in einem DataFrame zu zählen. Wir haben auch gelernt, wie man NULL-Werte behandelt und die einzigartigen Werte einschließlich der NULL-Werte zählt. Diese Methode ist nützlich bei der Analyse von Datensätzen und zum Verständnis der Verteilung der Werte in einem DataFrame.