Introdução
Neste laboratório, aprenderemos como usar o método astype() na biblioteca Pandas em Python. O método astype() permite converter o tipo de dados de um DataFrame Pandas para um tipo especificado. Podemos converter os tipos de dados de todas as colunas ou de colunas específicas no DataFrame.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Converter todos os tipos de dados das colunas do DataFrame
Podemos usar o método astype() para converter os tipos de dados de todas as colunas em um DataFrame para um tipo especificado. Aqui está um exemplo:
import pandas as pd
## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)
print("----Before converting datatype of DataFrame-----")
print(df.dtypes)
## Convert the datatypes of all columns to int32
df = df.astype('int32')
print("----After converting datatype of DataFrame-----")
print(df.dtypes)
Output:
----Before converting datatype of DataFrame-----
A int64
B int64
dtype: object
----After converting datatype of DataFrame-----
A int32
B int32
dtype: object
Neste exemplo, criamos um DataFrame com duas colunas A e B. Antes de converter os tipos de dados, ambas as colunas têm o tipo de dados int64. Após usar o método astype() com o argumento 'int32', ambas as colunas são convertidas para o tipo de dados int32.
Converter o tipo de dado de uma coluna específica do DataFrame
Também podemos usar o método astype() para converter o tipo de dados de uma coluna específica em um DataFrame. Aqui está um exemplo:
import pandas as pd
## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)
print("----Before converting datatype of DataFrame-----")
print(df.dtypes)
## Convert the datatype of column 'A' to int32
df['A'] = df['A'].astype('int32')
print("----After converting single column datatype of DataFrame-----")
print(df.dtypes)
Output:
----Before converting datatype of DataFrame-----
A int64
B int64
dtype: object
----After converting single column datatype of DataFrame-----
A int32
B int64
dtype: object
Neste exemplo, criamos um DataFrame com duas colunas A e B. Antes de converter o tipo de dados, a coluna A tem o tipo de dados int64 e a coluna B tem o tipo de dados int64. Após usar o método astype() com o argumento 'int32' na coluna A, apenas o tipo de dados da coluna A é convertido para int32, enquanto o tipo de dados da coluna B permanece int64.
Verificando o DataFrame convertido
Após converter os tipos de dados de um DataFrame, podemos verificar o DataFrame atualizado para verificar se as conversões foram bem-sucedidas. Aqui está um exemplo:
import pandas as pd
## Create a DataFrame
data = {'A':[1,2,3,4,5],'B':[6,7,8,9,10]}
df = pd.DataFrame(data)
print("----After converting single column datatype of DataFrame-----")
df['B'] = df['B'].astype('float')
print(df.dtypes)
print("-----DataFrame after converting to float datatypes-----")
print(df)
Output:
----After converting single column datatype of DataFrame-----
A int64
B float64
dtype: object
-----DataFrame after converting to float datatypes-----
A B
0 1 6.0
1 2 7.0
2 3 8.0
3 4 9.0
4 5 10.0
Neste exemplo, criamos um DataFrame com duas colunas A e B. Após usar o método astype() com o argumento 'float' na coluna B, o tipo de dados da coluna B é convertido para float64. Em seguida, imprimimos os tipos de dados do DataFrame para confirmar as alterações e imprimimos o próprio DataFrame para ver os valores atualizados.
Resumo
Neste laboratório, aprendemos como usar o método astype() no Pandas para converter os tipos de dados de um DataFrame. Vimos como converter todos os tipos de dados de coluna e tipos de dados de coluna específicos usando o método astype(), e também verificamos o DataFrame resultante após as conversões. O método astype() é útil para manipular e transformar dados em um DataFrame do Pandas.