Pandas DataFrame pct_change 메서드

Beginner

소개

Pandas DataFrame 의 pct_change() 메서드는 DataFrame 에서 현재 요소와 이전 요소 간의 백분율 변화를 계산합니다. 이는 데이터 분석 및 판매량, 월별 또는 연도별 차이 계산에 유용합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

Pandas DataFrame 에서 백분율 변화 계산하기

Pandas DataFrame 에서 백분율 변화를 계산하려면 다음 단계를 따르십시오.

  1. pandas 라이브러리를 임포트합니다.
import pandas as pd
  1. 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
  1. pct_change() 메서드를 사용하여 DataFrame 의 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change())

열 축을 따라 백분율 변화 계산

열 축을 따라 백분율 변화를 계산하려면, 1 단계의 코드를 다음과 같이 수정합니다.

  1. pandas 라이브러리를 임포트합니다.
import pandas as pd
  1. 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
  1. axis=1과 함께 pct_change() 메서드를 사용하여 열 축을 따라 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(axis=1))

지정된 기간으로 백분율 변화 계산

지정된 기간으로 백분율 변화를 계산하려면, 1 단계의 코드를 다음과 같이 수정합니다.

  1. pandas 라이브러리를 임포트합니다.
import pandas as pd
  1. 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
  1. periods=2와 함께 pct_change() 메서드를 사용하여 지정된 기간으로 백분율 변화를 계산합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(periods=2))

계산 전 결측값 처리

백분율 변화를 계산하기 전에 결측값을 처리하려면, 1 단계의 코드를 다음과 같이 수정합니다.

  1. pandas 라이브러리를 임포트합니다.
import pandas as pd
  1. 시계열 인덱스와 원하는 데이터로 DataFrame 을 생성합니다.
Values = pd.date_range('2021-01-01', periods=3, freq='5W')
df = pd.DataFrame({'coffee': [755.2, 751.23, 852.21], 'Tea': [700.21, 695.21, 726.21], 'Pepper': [900.14, 8254.1, 455.27]}, index=Values)
  1. 원본 DataFrame 을 출력합니다.
print("----------The dataset is----------")
print(df)
  1. 계산 전에 결측값을 처리하기 위해 fill_method='ffill'과 함께 pct_change() 메서드를 사용합니다.
print("-------percentage change in the dataset-------")
print(df.pct_change(fill_method='ffill'))

요약

Pandas DataFrame 의 pct_change() 메서드는 현재 요소와 이전 요소 간의 백분율 변화를 계산합니다. 데이터를 분석하고 차이를 계산하는 데 사용할 수 있으며, 결측값을 처리하고 계산 기간을 지정하는 매개변수를 가지고 있습니다. 이 튜토리얼의 단계를 따르면 데이터 분석 작업에서 pct_change() 메서드를 효과적으로 사용할 수 있습니다.