Pandas DataFrame Convert_dtypes Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Die DataFrame.convert_dtypes()-Methode in Python Pandas wird verwendet, um die Spalten eines DataFrames in die besten passenden Datentypen umzuwandeln. Sie ist besonders nützlich, wenn es um DataFrame-Spalten mit gemischten Datentypen geht oder wenn wir die Arbeitsspeicherauslastung optimieren möchten, indem wir die Daten in den geeignetsten Datentypen speichern.

Tipps für die VM

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.

Importieren der erforderlichen Bibliotheken und Erstellen eines DataFrames

Zunächst müssen wir die pandas-Bibliothek importieren, die die DataFrame-Klasse und die convert_dtypes()-Methode bereitstellt. Anschließend können wir einen DataFrame mit Spalten unterschiedlicher Datentypen erstellen.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

Überprüfen der aktuellen Datentypen des DataFrames

Um die aktuellen Datentypen der DataFrame-Spalten zu sehen, können wir das dtypes-Attribut verwenden.

print("Aktuelle Datentypen:")
print(df.dtypes)

Konvertieren der DataFrame-Spalten in die besten passenden Datentypen

Um die DataFrame-Spalten in die besten passenden Datentypen umzuwandeln, können wir die convert_dtypes()-Methode verwenden. Standardmäßig versucht es, Objekt-Datentypen in die geeignetsten Typen umzuwandeln, wie StringDtype für Objekt-Spalten, die Strings enthalten, und BooleanDtype für Objekt-Spalten, die boolesche Werte enthalten.

df_converted = df.convert_dtypes()

Überprüfen der Datentypen nach der Konvertierung

Wir können jetzt die Datentypen der DataFrame-Spalten nach der Konvertierung überprüfen.

print("Datentypen nach der Konvertierung:")
print(df_converted.dtypes)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die DataFrame.convert_dtypes()-Methode in Python Pandas verwendet, um die Spalten eines DataFrames in die besten passenden Datentypen umzuwandeln. Diese Methode ist nützlich, wenn es um gemischte Datentypen in Spalten geht oder wenn die Arbeitsspeicherauslastung optimiert werden soll. Indem wir die Spalten in die geeignetsten Datentypen umwandeln, können wir die Effizienz der Datenanalyse und -manipulation verbessern.