Método convert_dtypes do DataFrame Pandas

Beginner

Introdução

O método DataFrame.convert_dtypes() em Python Pandas é usado para converter as colunas de um DataFrame para os melhores tipos de dados possíveis. É especialmente útil ao lidar com colunas de DataFrame que contêm tipos de dados mistos ou quando queremos otimizar o uso da memória, armazenando dados nos tipos de dados mais adequados.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias e criar um DataFrame

Primeiramente, precisamos importar a biblioteca pandas, que fornece a classe DataFrame e o método convert_dtypes(). Em seguida, podemos criar um DataFrame com colunas de diferentes tipos de dados.

import pandas as pd

df = pd.DataFrame({'A': ['a', 'b', 'c'], 'B': ['d', 'e', 'f'], 'C': [1, 2, 3], 'D': [True, False, True]})

Verificar os tipos de dados atuais do DataFrame

Para ver os tipos de dados atuais das colunas do DataFrame, podemos usar o atributo dtypes.

print("Current data types:")
print(df.dtypes)

Converter as colunas do DataFrame para os melhores tipos de dados possíveis

Para converter as colunas do DataFrame para os melhores tipos de dados possíveis, podemos usar o método convert_dtypes(). Por padrão, ele tenta converter tipos de dados object para os tipos mais adequados, como StringDtype para colunas object contendo strings, e BooleanDtype para colunas object contendo valores booleanos.

df_converted = df.convert_dtypes()

Verificar os tipos de dados após a conversão

Podemos agora verificar os tipos de dados das colunas do DataFrame após a conversão.

print("Data types after conversion:")
print(df_converted.dtypes)

Resumo

Neste laboratório, aprendemos como usar o método DataFrame.convert_dtypes() em Python Pandas para converter as colunas de um DataFrame para os melhores tipos de dados possíveis. Este método é útil ao lidar com tipos de dados mistos em colunas ou ao otimizar o uso de memória. Ao converter as colunas para os tipos de dados mais adequados, podemos melhorar a eficiência da análise e manipulação de dados.