Método astype() de DataFrame de Pandas

Beginner

Introducción

En este laboratorio, aprenderemos a usar el método astype() en la biblioteca Pandas de Python. El método astype() nos permite convertir el tipo de datos de un DataFrame de Pandas a un tipo especificado. Podemos convertir los tipos de datos de todas las columnas o de columnas específicas en el DataFrame.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Convertir los tipos de datos de todas las columnas de un DataFrame

Podemos usar el método astype() para convertir los tipos de datos de todas las columnas en un DataFrame a un tipo especificado. Aquí hay un ejemplo:

import pandas as pd

## Crear un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Antes de convertir el tipo de datos del DataFrame-----")
print(df.dtypes)

## Convertir los tipos de datos de todas las columnas a int32
df = df.astype('int32')

print("----Después de convertir el tipo de datos del DataFrame-----")
print(df.dtypes)

Salida:

----Antes de convertir el tipo de datos del DataFrame-----
A int64
B int64
dtype: object

----Después de convertir el tipo de datos del DataFrame-----
A int32
B int32
dtype: object

En este ejemplo, creamos un DataFrame con dos columnas A y B. Antes de convertir los tipos de datos, ambas columnas tienen el tipo de datos int64. Después de usar el método astype() con el argumento 'int32', ambas columnas se convierten al tipo de datos int32.

Convertir el tipo de datos de una columna específica de un DataFrame

También podemos usar el método astype() para convertir el tipo de datos de una columna específica en un DataFrame. Aquí hay un ejemplo:

import pandas as pd

## Crear un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Antes de convertir el tipo de datos del DataFrame-----")
print(df.dtypes)

## Convertir el tipo de datos de la columna 'A' a int32
df['A'] = df['A'].astype('int32')

print("----Después de convertir el tipo de datos de una sola columna del DataFrame-----")
print(df.dtypes)

Salida:

----Antes de convertir el tipo de datos del DataFrame-----
A int64
B int64
dtype: object

----Después de convertir el tipo de datos de una sola columna del DataFrame-----
A int32
B int64
dtype: object

En este ejemplo, creamos un DataFrame con dos columnas A y B. Antes de convertir el tipo de datos, la columna A tiene el tipo de datos int64 y la columna B tiene el tipo de datos int64. Después de usar el método astype() con el argumento 'int32' en la columna A, solo el tipo de datos de la columna A se convierte a int32, mientras que el tipo de datos de la columna B sigue siendo int64.

Verificar el DataFrame convertido

Después de convertir los tipos de datos de un DataFrame, podemos verificar el DataFrame actualizado para comprobar si las conversiones tuvieron éxito. Aquí hay un ejemplo:

import pandas as pd

## Crear un DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Después de convertir el tipo de datos de una sola columna del DataFrame-----")
df['B'] = df['B'].astype('float')
print(df.dtypes)
print("-----DataFrame después de convertir a tipos de datos float-----")
print(df)

Salida:

----Después de convertir el tipo de datos de una sola columna del DataFrame-----
A int64
B float64
dtype: object

-----DataFrame después de convertir a tipos de datos float-----
   A     B
0  1   6.0
1  2   7.0
2  3   8.0
3  4   9.0
4  5  10.0

En este ejemplo, creamos un DataFrame con dos columnas A y B. Después de usar el método astype() con el argumento 'float' en la columna B, el tipo de datos de la columna B se convierte a float64. Luego imprimimos los tipos de datos del DataFrame para confirmar los cambios e imprimimos el DataFrame en sí para ver los valores actualizados.

Resumen

En este laboratorio, aprendimos a usar el método astype() en Pandas para convertir los tipos de datos de un DataFrame. Vimos cómo convertir los tipos de datos de todas las columnas y de columnas específicas usando el método astype(), y también comprobamos el DataFrame resultante después de las conversiones. El método astype() es útil para manipular y transformar datos en un DataFrame de Pandas.