Método agg() do DataFrame Pandas

Beginner

Introdução

Neste laboratório, você aprenderá como usar o método agg() na biblioteca pandas para agregar dados em um DataFrame. Este método permite que você execute uma ou mais operações em um eixo especificado, como linhas ou colunas, e retorna um escalar, Series ou DataFrame com base na função escolhida.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a biblioteca pandas

Primeiro, você precisa importar a biblioteca pandas usando a instrução import:

import pandas as pd

Criar um DataFrame

Em seguida, crie um objeto DataFrame para trabalhar. Você pode usar a função pd.DataFrame() para criar um DataFrame a partir de uma lista ou array. Aqui está um exemplo:

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

Agregação de DataFrame com uma única função sobre as linhas

Para agregar o DataFrame usando uma única função, você pode usar o método agg(). Especifique a função que deseja aplicar às linhas usando o nome de uma função string ou um objeto função. Aqui está um exemplo:

print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))

Agregação de DataFrame com uma única função sobre as colunas

Para agregar o DataFrame usando uma única função sobre as colunas, defina o parâmetro axis como 'columns'. Isso aplicará a função a cada coluna em vez de cada linha. Aqui está um exemplo:

print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))

Agregação de DataFrame com uma lista de funções sobre linhas e colunas

Você também pode agregar o DataFrame usando uma lista de funções. Isso permite que você execute múltiplas operações nas linhas ou colunas. Aqui está um exemplo:

print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))

Agregação de DataFrame com diferentes funções sobre as colunas

Para maior flexibilidade, você pode passar um dicionário de nomes de colunas e funções correspondentes para o método agg(). Isso permite que você aplique diferentes funções a diferentes colunas. Aqui está um exemplo:

print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

Resumo

Neste laboratório, você aprendeu como usar o método agg() no pandas para agregar dados em um DataFrame. Agora você sabe como aplicar funções únicas e múltiplas sobre as linhas e colunas do DataFrame. Este método é útil para realizar várias operações de agregação em seus dados. Experimente com diferentes funções e eixos para analisar e resumir seu DataFrame. Boas análises!