Einführung
Die DataFrame.convert_dtypes()-Methode in Python Pandas wird verwendet, um die Spalten eines DataFrames in die besten passenden Datentypen umzuwandeln. Sie ist besonders nützlich, wenn es um DataFrame-Spalten mit gemischten Datentypen geht oder wenn wir die Arbeitsspeicherauslastung optimieren möchten, indem wir die Daten in den geeignetsten Datentypen speichern.
Tipps für die VM
Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu öffnen.
Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.
Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem für Sie prompt beheben.
Importiere die erforderlichen Bibliotheken und erstelle einen DataFrame
Zunächst müssen wir die pandas-Bibliothek importieren, die die DataFrame-Klasse und die convert_dtypes()-Methode bereitstellt. Anschließend können wir einen DataFrame mit Spalten unterschiedlicher Datentypen erstellen.
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})
Prüfe die aktuellen Datentypen des DataFrames
Um die aktuellen Datentypen der DataFrame-Spalten zu sehen, können wir das dtypes-Attribut verwenden.
print("Aktuelle Datentypen:")
print(df.dtypes)
Wandle die Spalten des DataFrames in die besten passenden Datentypen um
Um die DataFrame-Spalten in die besten passenden Datentypen umzuwandeln, können wir die convert_dtypes()-Methode verwenden. Standardmäßig versucht es, Objekt-Datentypen in die geeignetsten Typen umzuwandeln, wie StringDtype für Objekt-Spalten, die Strings enthalten, und BooleanDtype für Objekt-Spalten, die boolesche Werte enthalten.
df_converted = df.convert_dtypes()
Prüfe die Datentypen nach der Umwandlung
Wir können jetzt die Datentypen der DataFrame-Spalten nach der Konvertierung überprüfen.
print("Datentypen nach der Konvertierung:")
print(df_converted.dtypes)
Zusammenfassung
In diesem Lab haben wir gelernt, wie man die DataFrame.convert_dtypes()-Methode in Python Pandas verwendet, um die Spalten eines DataFrames in die besten passenden Datentypen umzuwandeln. Diese Methode ist nützlich, wenn es um gemischte Datentypen in Spalten geht oder wenn die Arbeitsspeicherauslastung optimiert werden soll. Indem wir die Spalten in die geeignetsten Datentypen umwandeln, können wir die Effizienz der Datenanalyse und -manipulation verbessern.