Método Cumsum do DataFrame Pandas

Beginner

Introdução

O método cumsum() do Pandas DataFrame é usado para calcular a soma cumulativa sobre um eixo de um DataFrame ou Series. Ele retorna um DataFrame ou Series do mesmo tamanho que contém a soma cumulativa.

Dicas para a VM (Máquina Virtual)

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar as bibliotecas necessárias

Para usar o método cumsum(), precisamos importar a biblioteca pandas.

import pandas as pd

Criar um DataFrame

Em seguida, precisamos criar um DataFrame usando os dados nos quais queremos realizar a soma cumulativa. Por exemplo:

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

Calcular a soma cumulativa sobre o eixo do índice

Para calcular a soma cumulativa sobre o eixo do índice, podemos usar o método cumsum() no DataFrame. Por padrão, o método cumsum() calcula a soma por coluna (column-wise), então precisamos especificar o eixo como 0.

result = df.cumsum(axis=0)

Calcular a soma cumulativa sobre o eixo da coluna

Para calcular a soma cumulativa sobre o eixo da coluna, podemos novamente usar o método cumsum() no DataFrame, mas desta vez especificamos o eixo como 1.

result = df.cumsum(axis=1)

Manipulação de valores nulos no DataFrame

Se o DataFrame contiver valores nulos, por padrão o método cumsum() ignora esses valores. No entanto, podemos alterar este comportamento e incluir os valores nulos no cálculo da soma cumulativa, especificando skipna=False.

result = df.cumsum(axis=0, skipna=False)

Resumo

O método cumsum() no Pandas permite calcular a soma cumulativa sobre um eixo de um DataFrame ou Series. Ele pode ser usado para realizar cálculos de soma cumulativa tanto sobre os eixos de índice quanto de coluna. O método também oferece a opção de incluir ou excluir valores nulos do cálculo.