Método Astype em DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos como usar o método astype() na biblioteca Pandas em Python. O método astype() permite converter o tipo de dados de um DataFrame Pandas para um tipo especificado. Podemos converter os tipos de dados de todas as colunas ou de colunas específicas no DataFrame.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Converter todos os tipos de dados das colunas do DataFrame

Podemos usar o método astype() para converter os tipos de dados de todas as colunas em um DataFrame para um tipo especificado. Aqui está um exemplo:

import pandas as pd

## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Before converting datatype of DataFrame-----")
print(df.dtypes)

## Convert the datatypes of all columns to int32
df = df.astype('int32')

print("----After converting datatype of DataFrame-----")
print(df.dtypes)

Output:

----Before converting datatype of DataFrame-----
A int64
B int64
dtype: object

----After converting datatype of DataFrame-----
A int32
B int32
dtype: object

Neste exemplo, criamos um DataFrame com duas colunas A e B. Antes de converter os tipos de dados, ambas as colunas têm o tipo de dados int64. Após usar o método astype() com o argumento 'int32', ambas as colunas são convertidas para o tipo de dados int32.

Converter o tipo de dado de uma coluna específica do DataFrame

Também podemos usar o método astype() para converter o tipo de dados de uma coluna específica em um DataFrame. Aqui está um exemplo:

import pandas as pd

## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----Before converting datatype of DataFrame-----")
print(df.dtypes)

## Convert the datatype of column 'A' to int32
df['A'] = df['A'].astype('int32')

print("----After converting single column datatype of DataFrame-----")
print(df.dtypes)

Output:

----Before converting datatype of DataFrame-----
A int64
B int64
dtype: object

----After converting single column datatype of DataFrame-----
A int32
B int64
dtype: object

Neste exemplo, criamos um DataFrame com duas colunas A e B. Antes de converter o tipo de dados, a coluna A tem o tipo de dados int64 e a coluna B tem o tipo de dados int64. Após usar o método astype() com o argumento 'int32' na coluna A, apenas o tipo de dados da coluna A é convertido para int32, enquanto o tipo de dados da coluna B permanece int64.

Verificando o DataFrame convertido

Após converter os tipos de dados de um DataFrame, podemos verificar o DataFrame atualizado para verificar se as conversões foram bem-sucedidas. Aqui está um exemplo:

import pandas as pd

## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)

print("----After converting single column datatype of DataFrame-----")
df['B'] = df['B'].astype('float')
print(df.dtypes)
print("-----DataFrame after converting to float datatypes-----")
print(df)

Output:

----After converting single column datatype of DataFrame-----
A int64
B float64
dtype: object

-----DataFrame after converting to float datatypes-----
   A     B
0  1   6.0
1  2   7.0
2  3   8.0
3  4   9.0
4  5  10.0

Neste exemplo, criamos um DataFrame com duas colunas A e B. Após usar o método astype() com o argumento 'float' na coluna B, o tipo de dados da coluna B é convertido para float64. Em seguida, imprimimos os tipos de dados do DataFrame para confirmar as alterações e imprimimos o próprio DataFrame para ver os valores atualizados.

Resumo

Neste laboratório, aprendemos como usar o método astype() no Pandas para converter os tipos de dados de um DataFrame. Vimos como converter todos os tipos de dados de coluna e tipos de dados de coluna específicos usando o método astype(), e também verificamos o DataFrame resultante após as conversões. O método astype() é útil para manipular e transformar dados em um DataFrame do Pandas.