Introdução
O método info() na biblioteca Pandas do Python é usado para obter um resumo de um DataFrame. Ele fornece informações valiosas sobre o DataFrame, incluindo o tipo de dado (dtype) do índice e das colunas, valores não nulos e uso de memória.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Primeiramente, precisamos importar a biblioteca pandas, que é uma poderosa biblioteca de manipulação de dados em Python.
import pandas as pd
Criar um DataFrame
Em seguida, precisamos criar um DataFrame. Podemos fazer isso usando a função pd.DataFrame() e passando um dicionário de dados.
int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})
Usar o método info()
Agora que temos nosso DataFrame, podemos usar o método info() para obter as informações de resumo. Por padrão, o método info() imprime o resumo completo do DataFrame.
df.info()
Analisar a saída
Após executar o código, você verá as informações de resumo sobre o DataFrame, incluindo o tipo de dados de cada coluna, o número de valores não nulos e o uso de memória. Aqui está um exemplo de saída:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
## Column Non-Null Count Dtype
--- ------ -------------- -----
0 int_col 5 non-null int64
1 text_col 5 non-null object
2 float_col 5 non-null float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes
Resumo
O método info() na biblioteca Python Pandas é um método útil para obter um resumo rápido de um DataFrame. Ele fornece informações sobre o tipo de dados (dtype) do índice e das colunas, valores não nulos e uso de memória. Por padrão, ele exibe o resumo completo, mas você também pode modificar os parâmetros para personalizar a saída. Este método é útil para entender a estrutura do DataFrame, especialmente ao lidar com grandes conjuntos de dados. Com as informações obtidas de info(), você pode tomar decisões informadas sobre limpeza, manipulação e análise de dados.