Pandas DataFrame Diff 메서드

Beginner

소개

Pandas DataFrame 의 diff() 메서드는 DataFrame 내 요소 간의 차이를 계산합니다. 이 메서드는 요소의 첫 번째 이산 차이를 제공하며, DataFrame 요소와 DataFrame 내 다른 요소 간의 차이를 계산합니다. 기본적으로 이 메서드는 행의 이전 요소와의 차이를 계산합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 즉시 문제를 해결해 드리겠습니다.

필요한 라이브러리 가져오기

DataFrame 의 diff() 메서드를 사용하려면 먼저 pandas 라이브러리를 가져와야 합니다.

import pandas as pd

DataFrame 생성하기

다음으로, 예제에 사용할 DataFrame 을 생성해 보겠습니다.

df = pd.DataFrame({'a': [1, 3, 8],'b': [3, 5, 8],'c': [16, 25, 36]})

우리의 DataFrame 은 세 개의 열 ('a', 'b', 'c') 과 세 개의 행을 가지고 있습니다.

이전 행과의 차이 계산

이전 행과의 차이를 계산하려면, DataFrame 에서 diff() 메서드를 호출하면 됩니다.

diff_previous_row = df.diff()

이렇게 하면 각 요소와 행의 이전 요소 간의 차이가 계산됩니다.

이전 열 간의 차이 계산

이전 행 대신 이전 열 간의 차이를 계산하려면, axis 매개변수를 1 로 지정할 수 있습니다.

diff_previous_column = df.diff(axis=1)

이렇게 하면 각 요소와 열의 이전 요소 간의 차이가 계산됩니다.

특정 이전 행과의 차이 계산

periods 매개변수를 지정하여 특정 이전 행과의 차이를 계산할 수도 있습니다. 예를 들어, 두 번째 이전 행과의 차이를 계산하려면 periods를 2 로 설정할 수 있습니다.

diff_second_previous_row = df.diff(periods=2)

이렇게 하면 각 요소와 두 행 이전의 요소 간의 차이가 계산됩니다.

특정 이전 열과의 차이 계산

마찬가지로, periodsaxis 매개변수를 지정하여 특정 이전 열과의 차이를 계산할 수 있습니다. 예를 들어, 세 번째 이전 열과의 차이를 계산하려면 periods를 3 으로, axis를 1 로 설정할 수 있습니다.

diff_third_previous_column = df.diff(periods=3, axis=1)

이렇게 하면 각 요소와 세 열 이전의 요소 간의 차이가 계산됩니다.

요약

Pandas 의 DataFrame.diff() 메서드를 사용하면 DataFrame 의 요소 간의 차이를 계산할 수 있습니다. 이전 행 또는 이전 열과의 차이뿐만 아니라 특정 이전 행 또는 열과의 차이도 계산할 수 있습니다. 이 메서드는 시계열 데이터를 분석하거나 연속적인 행 또는 열 간의 값을 비교할 때 유용합니다. diff() 메서드를 사용하면 DataFrame 의 변화 또는 차이를 쉽게 계산할 수 있습니다.