Pandas DataFrame Dropna-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab werden wir uns mit der dropna()-Methode von pandas für DataFrame befassen. Diese Methode wird verwendet, um fehlende Werte aus einem DataFrame zu entfernen, indem Zeilen oder Spalten mit NULL- oder NaN-Werten gelöscht werden.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen von Jupyter Notebook nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der pandas-Bibliothek

Bevor wir beginnen, müssen wir die pandas-Bibliothek importieren. Wir werden für diese Bibliothek den Alias pd verwenden.

import pandas as pd

Erstellen eines DataFrames

Lassen Sie uns ein DataFrame erstellen, das einige fehlende Werte enthält.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

Verwenden der dropna()-Methode, um Zeilen mit fehlenden Werten zu löschen

Wir können die dropna()-Methode verwenden, um Zeilen zu löschen, die fehlende Werte enthalten. Standardmäßig entfernt es jede Zeile, die mindestens einen NULL- oder NaN-Wert hat.

df_dropped = df.dropna()

Zeige das Ergebnis an

Lassen Sie uns das ursprüngliche DataFrame und das resultierende DataFrame nach dem Löschen von Zeilen mit fehlenden Werten ausgeben.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

Zusammenfassung

In diesem Lab haben wir uns mit der pandas-dropna()-Methode für DataFrames beschäftigt, die verwendet wird, um Zeilen oder Spalten mit fehlenden Werten zu löschen. Indem wir diese fehlenden Werte löschen, können wir unser DataFrame bereinigen und es für weitere Analysen geeignet machen. Denken Sie daran, dass diese Methode das DataFrame modifiziert und standardmäßig ein neues DataFrame zurückgibt, aber wir können auch wählen, das DataFrame in-place zu modifizieren, indem wir den inplace-Parameter auf True setzen.