Pandas DataFrame Cumsum 메서드

Beginner

소개

Pandas DataFrame 의 cumsum() 메서드는 DataFrame 또는 Series 축에 대한 누적 합계를 계산하는 데 사용됩니다. 누적 합계를 포함하는 동일한 크기의 DataFrame 또는 Series 를 반환합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

cumsum() 메서드를 사용하려면 pandas 라이브러리를 가져와야 합니다.

import pandas as pd

DataFrame 생성

다음으로, 누적 합계를 수행하려는 데이터를 사용하여 DataFrame 을 생성해야 합니다. 예를 들어:

df = pd.DataFrame({"A": [1, 2, 3, 4], "B": [5, 6, 7, 8]})

인덱스 축을 기준으로 누적 합 계산

인덱스 축을 기준으로 누적 합계를 계산하려면 DataFrame 에서 cumsum() 메서드를 사용할 수 있습니다. 기본적으로 cumsum() 메서드는 열별로 합계를 계산하므로, axis 를 0 으로 지정해야 합니다.

result = df.cumsum(axis=0)

열 축을 기준으로 누적 합 계산

열 축을 기준으로 누적 합계를 계산하려면, DataFrame 에서 다시 cumsum() 메서드를 사용할 수 있습니다. 하지만 이번에는 axis 를 1 로 지정합니다.

result = df.cumsum(axis=1)

DataFrame 에서 Null 값 처리 방법

DataFrame 에 Null 값이 포함된 경우, 기본적으로 cumsum() 메서드는 이러한 값을 건너뜁니다. 하지만 skipna=False를 지정하여 이 동작을 변경하고 누적 합계 계산에 Null 값을 포함시킬 수 있습니다.

result = df.cumsum(axis=0, skipna=False)

요약

Pandas 의 cumsum() 메서드를 사용하면 DataFrame 또는 Series 축을 기준으로 누적 합계를 계산할 수 있습니다. 인덱스 및 열 축 모두에서 누적 합계 계산을 수행하는 데 사용할 수 있습니다. 이 메서드는 또한 계산에서 Null 값을 포함하거나 제외하는 옵션을 제공합니다.