Introdução
Neste laboratório, aprenderemos sobre o método pivot_table() na biblioteca Python pandas. O método pivot_table() é usado para agregar e resumir dados em um DataFrame. Ele retorna uma tabela dinâmica (pivot table) no estilo de planilha como um novo DataFrame.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias e criar o DataFrame
Primeiramente, vamos importar a biblioteca pandas e criar um DataFrame com alguns dados de exemplo. Criaremos um DataFrame com as colunas 'Date' (Data), 'State' (Estado), 'Temperature' (Temperatura) e 'Humidity' (Umidade).
import pandas as pd
df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})
Agregar o DataFrame usando o método pivot_table()
Para agregar os dados no DataFrame usando o método pivot_table(), precisamos especificar as colunas que queremos usar como índices, colunas e os valores que queremos agregar.
pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')
Exibir o DataFrame resultante
Finalmente, vamos exibir o DataFrame da tabela dinâmica resultante.
print(pivot_df)
Resumo
Seguindo estes passos, conseguimos usar o método pivot_table() na biblioteca pandas para agregar e resumir dados em um DataFrame. Este método é útil para analisar e visualizar dados em um formato tabular. O DataFrame da tabela dinâmica resultante fornece uma maneira conveniente de ver os valores agregados com base em diferentes índices e colunas.