Introdução
Neste laboratório, você aprenderá como usar o método agg() na biblioteca pandas para agregar dados em um DataFrame. Este método permite que você execute uma ou mais operações em um eixo especificado, como linhas ou colunas, e retorna um escalar, Series ou DataFrame com base na função escolhida.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar a biblioteca pandas
Primeiro, você precisa importar a biblioteca pandas usando a instrução import:
import pandas as pd
Criar um DataFrame
Em seguida, crie um objeto DataFrame para trabalhar. Você pode usar a função pd.DataFrame() para criar um DataFrame a partir de uma lista ou array. Aqui está um exemplo:
df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])
Agregação de DataFrame com uma única função sobre as linhas
Para agregar o DataFrame usando uma única função, você pode usar o método agg(). Especifique a função que deseja aplicar às linhas usando o nome de uma função string ou um objeto função. Aqui está um exemplo:
print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))
Agregação de DataFrame com uma única função sobre as colunas
Para agregar o DataFrame usando uma única função sobre as colunas, defina o parâmetro axis como 'columns'. Isso aplicará a função a cada coluna em vez de cada linha. Aqui está um exemplo:
print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))
Agregação de DataFrame com uma lista de funções sobre linhas e colunas
Você também pode agregar o DataFrame usando uma lista de funções. Isso permite que você execute múltiplas operações nas linhas ou colunas. Aqui está um exemplo:
print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))
Agregação de DataFrame com diferentes funções sobre as colunas
Para maior flexibilidade, você pode passar um dicionário de nomes de colunas e funções correspondentes para o método agg(). Isso permite que você aplique diferentes funções a diferentes colunas. Aqui está um exemplo:
print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))
Resumo
Neste laboratório, você aprendeu como usar o método agg() no pandas para agregar dados em um DataFrame. Agora você sabe como aplicar funções únicas e múltiplas sobre as linhas e colunas do DataFrame. Este método é útil para realizar várias operações de agregação em seus dados. Experimente com diferentes funções e eixos para analisar e resumir seu DataFrame. Boas análises!