소개
Pandas DataFrame 의 pct_change() 메서드는 DataFrame 에서 현재 요소와 이전 요소 간의 백분율 변화를 계산합니다. 이는 데이터 분석 및 판매량, 월별 또는 연도별 차이 계산에 유용합니다.
VM 팁
VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.
학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.
Pandas DataFrame 에서 백분율 변화 계산하기
Pandas DataFrame 에서 백분율 변화를 계산하려면 다음 단계를 따르십시오.
- pandas 라이브러리를 임포트합니다.
import pandas as pd
- 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
pct_change()메서드를 사용하여 DataFrame 의 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change())
열 축을 따라 백분율 변화 계산
열 축을 따라 백분율 변화를 계산하려면, 1 단계의 코드를 다음과 같이 수정합니다.
- pandas 라이브러리를 임포트합니다.
import pandas as pd
- 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
axis=1과 함께pct_change()메서드를 사용하여 열 축을 따라 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))
지정된 기간으로 백분율 변화 계산
지정된 기간으로 백분율 변화를 계산하려면, 1 단계의 코드를 다음과 같이 수정합니다.
- pandas 라이브러리를 임포트합니다.
import pandas as pd
- 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
periods=2와 함께pct_change()메서드를 사용하여 지정된 기간으로 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))
계산 전 결측값 처리
백분율 변화를 계산하기 전에 결측값을 처리하려면, 1 단계의 코드를 다음과 같이 수정합니다.
- pandas 라이브러리를 임포트합니다.
import pandas as pd
- 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
- 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
- 계산 전에 결측값을 처리하기 위해
fill_method='ffill'과 함께pct_change()메서드를 사용합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))
요약
Pandas DataFrame 의 pct_change() 메서드는 현재 요소와 이전 요소 간의 백분율 변화를 계산합니다. 데이터를 분석하고 차이를 계산하는 데 사용할 수 있으며, 결측값을 처리하고 계산 기간을 지정하는 매개변수를 가지고 있습니다. 이 튜토리얼의 단계를 따르면 데이터 분석 작업에서 pct_change() 메서드를 효과적으로 사용할 수 있습니다.