Pandas DataFrame Isnull Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir lernen, wie die DataFrame.isnull()-Methode in pandas verwendet wird. Diese Methode wird verwendet, um fehlende Werte in einem DataFrame zu erkennen. Wenn diese Methode auf einen DataFrame angewendet wird, wird ein DataFrame von booleschen Werten zurückgegeben, wobei True angibt, dass das Element ein NULL-Wert ist, und False angibt, dass das Element kein NULL-Wert ist. Es ist wichtig zu beachten, dass diese Methode leere Zeichenfolgen oder numpy.inf nicht als NULL-Werte betrachtet.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Ein DataFrame erstellen

Lassen Sie uns beginnen, indem wir ein DataFrame mit einigen fehlenden Werten erstellen. Wir werden die pd.DataFrame-Funktion aus pandas und die Konstante np.nan aus numpy verwenden.

## Importing pandas as pd
import pandas as pd
## Importing numpy as np
import numpy as np

## Creating the DataFrame
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0), (np.nan, 2.0, np.nan, np.nan), (2.0, 3.0, np.nan, 9.0)], columns=list('abcd'))

Dies wird ein DataFrame mit vier Spalten ('a', 'b', 'c', 'd') und drei Zeilen erstellen. Das DataFrame enthält fehlende Werte, die durch np.nan dargestellt werden.

Fehlende Werte erkennen

Jetzt werden wir die DataFrame.isnull()-Methode verwenden, um die fehlenden Werte im DataFrame zu erkennen.

## Detecting missing values in the DataFrame
missing_values = df.isnull()

## Printing the DataFrame with missing values
print(missing_values)

Dies wird ein DataFrame zurückgeben, das aus booleschen Werten für jedes Element im ursprünglichen DataFrame besteht. Die True-Werte geben an, dass das entsprechende Element ein fehlender Wert (np.nan) ist, und die False-Werte geben an, dass das Element kein fehlender Wert ist.

Leere Zeichenfolgen als fehlende Werte betrachten

Standardmäßig betrachtet die DataFrame.isnull()-Methode leere Zeichenfolgen nicht als fehlende Werte. Wenn Sie leere Zeichenfolgen als fehlende Werte betrachten möchten, können Sie sie vor der Verwendung der Methode durch np.nan ersetzen.

## Replacing empty strings with np.nan
df = df.replace('', np.nan)

## Detecting missing values in the DataFrame
missing_values = df.isnull()

## Printing the DataFrame with missing values
print(missing_values)

Dies betrachtet jetzt leere Zeichenfolgen als fehlende Werte und gibt ein DataFrame mit booleschen Werten zurück, die die Anwesenheit von fehlenden Werten anzeigen.

Zusammenfassung

In diesem Lab haben wir gelernt, wie die DataFrame.isnull()-Methode in pandas verwendet wird, um fehlende Werte in einem DataFrame zu erkennen. Wir haben gesehen, dass sie ein DataFrame von booleschen Werten zurückgibt, wobei True einen fehlenden Wert und False einen nicht-fehlenden Wert angibt. Wir haben auch gesehen, dass standardmäßig leere Zeichenfolgen nicht als fehlende Werte betrachtet werden, dass sie jedoch als fehlende Werte behandelt werden können, indem sie vor der Verwendung der Methode durch np.nan ersetzt werden. Diese Methode ist nützlich für die Datenbereinigung und -vorkernaufgaben in Projekten der Datenanalyse und des maschinellen Lernens.