Método Expanding do Pandas DataFrame

Beginner

Introdução

Neste laboratório, exploraremos o método expanding() do Pandas DataFrame. Este método faz parte das funções de janela no Pandas e é usado para transformações expansivas. Ele retorna um objeto de janela para a operação especificada.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Primeiramente, precisamos importar as bibliotecas necessárias, nomeadamente o Pandas. Usaremos o alias pd para nos referir à biblioteca Pandas.

import pandas as pd

Criar o DataFrame

Em seguida, criaremos um DataFrame para trabalhar. Neste exemplo, usaremos um DataFrame com as colunas 'A' e 'B'.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

Aplicar o método expanding para calcular a soma cumulativa

Agora, vamos aplicar o método expanding() para calcular a soma cumulativa de todo o DataFrame.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

Armazenar o resultado em uma nova coluna

Também podemos armazenar o resultado do cálculo expanding em uma nova coluna do DataFrame. Neste exemplo, armazenaremos a soma cumulativa da coluna 'A' em uma nova coluna 'result'.

df['result'] = df['A'].expanding().sum()
print(df)

Calcular a soma cumulativa ao longo do eixo da linha

Além disso, podemos calcular a soma cumulativa de todo o DataFrame ao longo do eixo das linhas.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

Especificar o número mínimo de observações necessárias

Também podemos especificar o número mínimo de observações necessárias para que o cálculo expanding tenha um valor. Isso pode ser feito usando o parâmetro min_periods. Neste exemplo, definiremos min_periods=2.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

Resumo

Neste laboratório, aprendemos sobre o método expanding() em DataFrames do Pandas. Aplicamos este método para calcular a soma cumulativa de um DataFrame, armazenar o resultado em uma nova coluna, calcular a soma cumulativa ao longo do eixo das linhas e especificar um número mínimo de observações para o cálculo expanding. O método expanding() é útil para explorar a soma cumulativa de dados ao longo do tempo.