Pandas DataFrame Astype Methode

PandasPandasBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab lernen wir, wie wir die astype()-Methode in der Pandas-Bibliothek in Python verwenden. Die astype()-Methode ermöglicht es uns, den Datentyp eines Pandas DataFrames in einen bestimmten Typ umzuwandeln. Wir können die Datentypen aller Spalten oder bestimmter Spalten im DataFrame umwandeln.

VM-Tipps

Nachdem die VM gestartet ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Datentypen aller Spalten eines DataFrames umwandeln

Wir können die astype()-Methode verwenden, um die Datentypen aller Spalten in einem DataFrame in einen bestimmten Typ umzuwandeln. Hier ist ein Beispiel:

import pandas as pd

## Erstellen eines DataFrames
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Vor der Umwandlung des Datentyps des DataFrames-----")
print(df.dtypes)

## Umwandlung der Datentypen aller Spalten in int32
df = df.astype('int32')

print("----Nach der Umwandlung des Datentyps des DataFrames-----")
print(df.dtypes)

Ausgabe:

----Vor der Umwandlung des Datentyps des DataFrames-----
A int64
B int64
dtype: object

----Nach der Umwandlung des Datentyps des DataFrames-----
A int32
B int32
dtype: object

In diesem Beispiel erstellen wir ein DataFrame mit zwei Spalten A und B. Vor der Umwandlung der Datentypen haben beide Spalten den Datentyp int64. Nachdem wir die astype()-Methode mit dem Argument 'int32' verwendet haben, werden beide Spalten in den Datentyp int32 umgewandelt.

Datentyp einer bestimmten Spalte eines DataFrames umwandeln

Wir können auch die astype()-Methode verwenden, um den Datentyp einer bestimmten Spalte in einem DataFrame umzuwandeln. Hier ist ein Beispiel:

import pandas as pd

## Erstellen eines DataFrames
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Vor der Umwandlung des Datentyps des DataFrames-----")
print(df.dtypes)

## Umwandlung des Datentyps der Spalte 'A' in int32
df['A'] = df['A'].astype('int32')

print("----Nach der Umwandlung des Datentyps einer einzelnen Spalte des DataFrames-----")
print(df.dtypes)

Ausgabe:

----Vor der Umwandlung des Datentyps des DataFrames-----
A int64
B int64
dtype: object

----Nach der Umwandlung des Datentyps einer einzelnen Spalte des DataFrames-----
A int32
B int64
dtype: object

In diesem Beispiel erstellen wir ein DataFrame mit zwei Spalten A und B. Vor der Umwandlung des Datentyps hat die Spalte A den Datentyp int64 und die Spalte B den Datentyp int64. Nachdem wir die astype()-Methode mit dem Argument 'int32' auf die Spalte A anwenden, wird nur der Datentyp der Spalte A in int32 umgewandelt, während der Datentyp der Spalte B int64 bleibt.

Überprüfen des konvertierten DataFrames

Nachdem wir die Datentypen eines DataFrames umgewandelt haben, können wir den aktualisierten DataFrame überprüfen, um zu verifizieren, ob die Umwandlungen erfolgreich waren. Hier ist ein Beispiel:

import pandas as pd

## Erstellen eines DataFrames
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Nach der Umwandlung des Datentyps einer einzelnen Spalte des DataFrames-----")
df['B'] = df['B'].astype('float')
print(df.dtypes)
print("-----DataFrame nach der Umwandlung in float-Datentypen-----")
print(df)

Ausgabe:

----Nach der Umwandlung des Datentyps einer einzelnen Spalte des DataFrames-----
A int64
B float64
dtype: object

-----DataFrame nach der Umwandlung in float-Datentypen-----
   A     B
0  1   6.0
1  2   7.0
2  3   8.0
3  4   9.0
4  5  10.0

In diesem Beispiel erstellen wir ein DataFrame mit zwei Spalten A und B. Nachdem wir die astype()-Methode mit dem Argument 'float' auf die Spalte B anwenden, wird der Datentyp der Spalte B in float64 umgewandelt. Anschließend drucken wir die Datentypen des DataFrames, um die Änderungen zu bestätigen, und drucken das DataFrame selbst, um die aktualisierten Werte zu sehen.

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die astype()-Methode in Pandas verwendet, um die Datentypen eines DataFrames umzuwandeln. Wir haben gesehen, wie man alle Spalten-Datentypen und bestimmte Spalten-Datentypen mit der astype()-Methode umwandelt und haben auch den resultierenden DataFrame nach den Umwandlungen überprüft. Die astype()-Methode ist nützlich bei der Manipulation und Transformation von Daten in einem Pandas DataFrame.