Introdução
O método hist() na biblioteca Pandas permite-nos criar histogramas, que são representações visuais da distribuição de dados. Este método é usado num objeto DataFrame e chama a função matplotlib.pyplot.hist() em cada série dentro do DataFrame, resultando num histograma por coluna.
Dicas para a VM (Máquina Virtual)
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e aceder ao Jupyter Notebook para praticar.
Por vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se encontrar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para si.
Importar as bibliotecas necessárias
Para usar o método hist(), precisamos importar as bibliotecas necessárias, que são pandas e matplotlib.pyplot.
import pandas as pd
import matplotlib.pyplot as plt
Criar um DataFrame
Em seguida, precisamos criar um objeto DataFrame usando o método pd.DataFrame(). Podemos passar um dicionário como argumento, onde as chaves representam os nomes das colunas e os valores representam os dados.
data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)
Criar um histograma
Agora, podemos usar o método hist() no DataFrame para criar um histograma de cada coluna.
df.hist()
plt.show()
Personalizar o histograma
Podemos personalizar o histograma fornecendo parâmetros adicionais ao método hist(). Por exemplo, podemos especificar o número de bins (classes), a cor das barras do histograma e o título do histograma.
df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()
Resumo
O método hist() no Pandas nos permite criar histogramas dos dados dentro de um DataFrame. Ao usar este método, podemos visualizar a distribuição dos nossos dados, o que pode ser útil para análise e exploração de dados. Adicionalmente, podemos personalizar a aparência do histograma fornecendo parâmetros adicionais ao método hist(). No geral, o método hist() é uma ferramenta útil para analisar e visualizar dados no Pandas.