Método Pivot Table do DataFrame Pandas

Beginner

Introdução

Neste laboratório, aprenderemos sobre o método pivot_table() na biblioteca Python pandas. O método pivot_table() é usado para agregar e resumir dados em um DataFrame. Ele retorna uma tabela dinâmica (pivot table) no estilo de planilha como um novo DataFrame.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias e criar o DataFrame

Primeiramente, vamos importar a biblioteca pandas e criar um DataFrame com alguns dados de exemplo. Criaremos um DataFrame com as colunas 'Date' (Data), 'State' (Estado), 'Temperature' (Temperatura) e 'Humidity' (Umidade).

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

Agregar o DataFrame usando o método pivot_table()

Para agregar os dados no DataFrame usando o método pivot_table(), precisamos especificar as colunas que queremos usar como índices, colunas e os valores que queremos agregar.

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

Exibir o DataFrame resultante

Finalmente, vamos exibir o DataFrame da tabela dinâmica resultante.

print(pivot_df)

Resumo

Seguindo estes passos, conseguimos usar o método pivot_table() na biblioteca pandas para agregar e resumir dados em um DataFrame. Este método é útil para analisar e visualizar dados em um formato tabular. O DataFrame da tabela dinâmica resultante fornece uma maneira conveniente de ver os valores agregados com base em diferentes índices e colunas.