Método Histograma DataFrame Pandas

Beginner

Introdução

O método hist() na biblioteca Pandas permite-nos criar histogramas, que são representações visuais da distribuição de dados. Este método é usado num objeto DataFrame e chama a função matplotlib.pyplot.hist() em cada série dentro do DataFrame, resultando num histograma por coluna.

Dicas para a VM (Máquina Virtual)

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e aceder ao Jupyter Notebook para praticar.

Por vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se encontrar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para si.

Importar as bibliotecas necessárias

Para usar o método hist(), precisamos importar as bibliotecas necessárias, que são pandas e matplotlib.pyplot.

import pandas as pd
import matplotlib.pyplot as plt

Criar um DataFrame

Em seguida, precisamos criar um objeto DataFrame usando o método pd.DataFrame(). Podemos passar um dicionário como argumento, onde as chaves representam os nomes das colunas e os valores representam os dados.

data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)

Criar um histograma

Agora, podemos usar o método hist() no DataFrame para criar um histograma de cada coluna.

df.hist()
plt.show()

Personalizar o histograma

Podemos personalizar o histograma fornecendo parâmetros adicionais ao método hist(). Por exemplo, podemos especificar o número de bins (classes), a cor das barras do histograma e o título do histograma.

df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()

Resumo

O método hist() no Pandas nos permite criar histogramas dos dados dentro de um DataFrame. Ao usar este método, podemos visualizar a distribuição dos nossos dados, o que pode ser útil para análise e exploração de dados. Adicionalmente, podemos personalizar a aparência do histograma fornecendo parâmetros adicionais ao método hist(). No geral, o método hist() é uma ferramenta útil para analisar e visualizar dados no Pandas.