Introdução
O método DataFrame.convert_dtypes() em Python Pandas é usado para converter as colunas de um DataFrame para os melhores tipos de dados possíveis. É especialmente útil ao lidar com colunas de DataFrame que contêm tipos de dados mistos ou quando queremos otimizar o uso da memória, armazenando dados nos tipos de dados mais adequados.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias e criar um DataFrame
Primeiramente, precisamos importar a biblioteca pandas, que fornece a classe DataFrame e o método convert_dtypes(). Em seguida, podemos criar um DataFrame com colunas de diferentes tipos de dados.
import pandas as pd
df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})
Verificar os tipos de dados atuais do DataFrame
Para ver os tipos de dados atuais das colunas do DataFrame, podemos usar o atributo dtypes.
print("Current data types:")
print(df.dtypes)
Converter as colunas do DataFrame para os melhores tipos de dados possíveis
Para converter as colunas do DataFrame para os melhores tipos de dados possíveis, podemos usar o método convert_dtypes(). Por padrão, ele tenta converter tipos de dados object para os tipos mais adequados, como StringDtype para colunas object contendo strings, e BooleanDtype para colunas object contendo valores booleanos.
df_converted = df.convert_dtypes()
Verificar os tipos de dados após a conversão
Podemos agora verificar os tipos de dados das colunas do DataFrame após a conversão.
print("Data types after conversion:")
print(df_converted.dtypes)
Resumo
Neste laboratório, aprendemos como usar o método DataFrame.convert_dtypes() em Python Pandas para converter as colunas de um DataFrame para os melhores tipos de dados possíveis. Este método é útil ao lidar com tipos de dados mistos em colunas ou ao otimizar o uso de memória. Ao converter as colunas para os tipos de dados mais adequados, podemos melhorar a eficiência da análise e manipulação de dados.