Pandas DataFrame Expanding 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 의 expanding() 메서드를 살펴보겠습니다. 이 메서드는 Pandas 의 윈도우 함수 (window functions) 의 일부이며, 확장 변환 (expanding transformations) 에 사용됩니다. 지정된 연산에 대한 윈도우 객체 (window object) 를 반환합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접속하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해, 연산의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

먼저, 필요한 라이브러리, 즉 Pandas 를 임포트해야 합니다. Pandas 라이브러리를 참조하기 위해 pd 별칭을 사용합니다.

import pandas as pd

DataFrame 생성

다음으로, 작업할 DataFrame 을 생성합니다. 이 예제에서는 'A'와 'B' 열을 가진 DataFrame 을 사용합니다.

df = pd.DataFrame({"A": [1, 2, 3], "B": [1, 1, 1]})

expanding 메서드를 사용하여 누적 합 계산

이제 expanding() 메서드를 적용하여 전체 DataFrame 의 누적 합을 계산해 보겠습니다.

df_expanding_sum = df.expanding().sum()
print(df_expanding_sum)

결과를 새로운 열에 저장

expanding 계산의 결과를 DataFrame 의 새로운 열에 저장할 수도 있습니다. 이 예제에서는 'A' 열의 누적 합을 새로운 열 'result'에 저장합니다.

df['result'] = df['A'].expanding().sum()
print(df)

행 축을 따라 누적 합 계산

또한, 행 축을 따라 전체 DataFrame 의 누적 합을 계산할 수 있습니다.

df_expanding_sum_row = df.T.expanding().sum().T
print(df_expanding_sum_row)

필요한 최소 관측치 수 지정

expanding 계산이 값을 가지기 위해 필요한 최소 관측치 수를 지정할 수도 있습니다. 이는 min_periods 매개변수를 사용하여 수행할 수 있습니다. 이 예제에서는 min_periods=2로 설정합니다.

df_expanding_sum_min = df.expanding(min_periods=2).sum()
print(df_expanding_sum_min)

요약

이 랩에서는 Pandas DataFrame 의 expanding() 메서드에 대해 배웠습니다. 이 메서드를 사용하여 DataFrame 의 누적 합을 계산하고, 결과를 새 열에 저장하고, 행 축을 따라 누적 합을 계산하고, expanding 계산에 대한 최소 관측치 수를 지정했습니다. expanding() 메서드는 시간에 따른 데이터의 누적 합을 탐색하는 데 유용합니다.