Introdução
O método cumsum() do Pandas DataFrame é usado para calcular a soma cumulativa sobre um eixo de um DataFrame ou Series. Ele retorna um DataFrame ou Series do mesmo tamanho que contém a soma cumulativa.
Dicas para a VM (Máquina Virtual)
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar as bibliotecas necessárias
Para usar o método cumsum(), precisamos importar a biblioteca pandas.
import pandas as pd
Criar um DataFrame
Em seguida, precisamos criar um DataFrame usando os dados nos quais queremos realizar a soma cumulativa. Por exemplo:
df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})
Calcular a soma cumulativa sobre o eixo do índice
Para calcular a soma cumulativa sobre o eixo do índice, podemos usar o método cumsum() no DataFrame. Por padrão, o método cumsum() calcula a soma por coluna (column-wise), então precisamos especificar o eixo como 0.
result = df.cumsum(axis=0)
Calcular a soma cumulativa sobre o eixo da coluna
Para calcular a soma cumulativa sobre o eixo da coluna, podemos novamente usar o método cumsum() no DataFrame, mas desta vez especificamos o eixo como 1.
result = df.cumsum(axis=1)
Manipulação de valores nulos no DataFrame
Se o DataFrame contiver valores nulos, por padrão o método cumsum() ignora esses valores. No entanto, podemos alterar este comportamento e incluir os valores nulos no cálculo da soma cumulativa, especificando skipna=False.
result = df.cumsum(axis=0, skipna=False)
Resumo
O método cumsum() no Pandas permite calcular a soma cumulativa sobre um eixo de um DataFrame ou Series. Ele pode ser usado para realizar cálculos de soma cumulativa tanto sobre os eixos de índice quanto de coluna. O método também oferece a opção de incluir ou excluir valores nulos do cálculo.