Método Info do DataFrame Pandas

Beginner

Introdução

O método info() na biblioteca Pandas do Python é usado para obter um resumo de um DataFrame. Ele fornece informações valiosas sobre o DataFrame, incluindo o tipo de dado (dtype) do índice e das colunas, valores não nulos e uso de memória.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Primeiramente, precisamos importar a biblioteca pandas, que é uma poderosa biblioteca de manipulação de dados em Python.

import pandas as pd

Criar um DataFrame

Em seguida, precisamos criar um DataFrame. Podemos fazer isso usando a função pd.DataFrame() e passando um dicionário de dados.

int_values = [1, 2, 3, 4, 5]
text_values = ['alpha', 'beta', 'gamma', 'delta', 'epsilon']
float_values = [0.0, 0.25, 0.5, 0.75, 1.0]
df = pd.DataFrame({"int_col": int_values, "text_col": text_values, "float_col": float_values})

Usar o método info()

Agora que temos nosso DataFrame, podemos usar o método info() para obter as informações de resumo. Por padrão, o método info() imprime o resumo completo do DataFrame.

df.info()

Analisar a saída

Após executar o código, você verá as informações de resumo sobre o DataFrame, incluindo o tipo de dados de cada coluna, o número de valores não nulos e o uso de memória. Aqui está um exemplo de saída:

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5 entries, 0 to 4
Data columns (total 3 columns):
 ##   Column    Non-Null Count  Dtype
---  ------    --------------  -----
 0   int_col   5 non-null      int64
 1   text_col  5 non-null      object
 2   float_col 5 non-null      float64
dtypes: float64(1), int64(1), object(1)
memory usage: 248.0+ bytes

Resumo

O método info() na biblioteca Python Pandas é um método útil para obter um resumo rápido de um DataFrame. Ele fornece informações sobre o tipo de dados (dtype) do índice e das colunas, valores não nulos e uso de memória. Por padrão, ele exibe o resumo completo, mas você também pode modificar os parâmetros para personalizar a saída. Este método é útil para entender a estrutura do DataFrame, especialmente ao lidar com grandes conjuntos de dados. Com as informações obtidas de info(), você pode tomar decisões informadas sobre limpeza, manipulação e análise de dados.