Pandas DataFrame Drop-Methode

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie man die drop()-Methode in der Python-Pandas-Bibliothek verwendet, um bestimmte Zeilen oder Spalten aus einem DataFrame zu entfernen. Die drop()-Methode ermöglicht es uns, Labels zu entfernen, indem wir Index- oder Spaltennamen und die entsprechende Achse angeben. Wir können auch Labels auf verschiedenen Ebenen in einem DataFrame mit mehreren Indizes entfernen.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der linken oberen Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der pandas-Bibliothek

Zunächst müssen wir die pandas-Bibliothek importieren, um das DataFrame und die drop()-Methode zu verwenden. Wir können pandas mit dem folgenden Code importieren:

import pandas as pd

Erstellen eines DataFrames

Als nächstes erstellen wir ein DataFrame, mit dem wir arbeiten können. Wir erstellen ein DataFrame mit einigen Beispielwerten mit dem folgenden Code:

df = pd.DataFrame([[0, 1, 2, 3], [4, 5, 6, 7], [8, 9, 10, 11]], columns=['a', 'b', 'c', 'd'])

Entfernen von bestimmten Zeilen mit der drop()-Methode

Um bestimmte Zeilen aus dem DataFrame zu entfernen, können wir die drop()-Methode mit dem index-Parameter verwenden. Der index-Parameter gibt das Label oder die Labels der Zeilen an, die entfernt werden sollen. Wir können auch den axis-Parameter als 0 oder 'index' angeben, um anzuzeigen, dass wir Zeilen entfernen möchten. Hier ist ein Beispiel:

dropped_df = df.drop([1])

Entfernen von bestimmten Spalten mit der drop()-Methode

Um bestimmte Spalten aus dem DataFrame zu entfernen, können wir die drop()-Methode mit dem columns-Parameter verwenden. Der columns-Parameter gibt das Label oder die Labels der Spalten an, die entfernt werden sollen. Wir müssen den axis-Parameter als 1 oder 'columns' setzen, um anzuzeigen, dass wir Spalten entfernen möchten. Hier ist ein Beispiel:

dropped_df = df.drop(columns=['b'])

Verwenden von inplace=True, um das DataFrame direkt zu modifizieren

Standardmäßig gibt die drop()-Methode ein neues DataFrame mit den entfernten Zeilen oder Spalten zurück. Wenn wir jedoch das ursprüngliche DataFrame direkt modifizieren möchten, können wir den inplace-Parameter auf True setzen. Hier ist ein Beispiel:

df.drop([1], inplace=True)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die drop()-Methode in der Python Pandas-Bibliothek verwendet, um bestimmte Zeilen oder Spalten aus einem DataFrame zu entfernen. Wir können die zu entfernenden Labels mithilfe des index- oder columns-Parameters angeben und den axis-Parameter verwenden, um die Achse anzugeben, entlang der die Labels entfernt werden sollen. Denken Sie daran, dass standardmäßig die drop()-Methode ein neues DataFrame mit den entfernten Labels zurückgibt, aber wir können das ursprüngliche DataFrame direkt modifizieren, indem wir den inplace-Parameter auf True setzen. Die drop()-Methode ist ein leistungsstarkes Werkzeug, wenn es darum geht, mit DataFrames in pandas zu arbeiten.


Ich habe den Inhalt überarbeitet, um die Anforderungen zu erfüllen. Geben Sie mir bitte Bescheid, wenn Sie weitere Hilfe benötigen.