Pandas DataFrame cummax 메서드 마스터하기 - 누적 최댓값 계산

소개

이 랩에서는 pandas 라이브러리의 cummax() 메서드를 사용하는 방법을 배웁니다. cummax() 메서드는 DataFrame 또는 Series 축에 대한 누적 최댓값을 계산하는 데 사용됩니다. 이는 누적 최댓값을 포함하는 동일한 크기의 DataFrame 또는 Series 를 반환합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 자유롭게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

pandas 라이브러리 가져오기

cummax() 메서드를 사용하려면 먼저 pandas 라이브러리를 임포트해야 합니다. 다음 코드를 실행하여 이를 수행할 수 있습니다.

import pandas as pd

DataFrame 생성

다음으로, cummax() 메서드를 적용할 수 있는 DataFrame 을 생성해야 합니다. pd.DataFrame() 함수를 사용하여 딕셔너리를 전달하여 DataFrame 을 생성할 수 있습니다. 딕셔너리의 각 키는 열 이름을 나타내고, 해당 값은 열 데이터를 포함하는 리스트입니다.

df = pd.DataFrame({"A":[1, 2, 8, 4], "B":[9, 10, 7, 8], "C":[9, 10, 11, 12], "D":[13, 16, 15, 16]})

cummax() 메서드 적용

이제 cummax() 메서드를 DataFrame 에 적용할 수 있습니다. cummax() 메서드는 세 가지 선택적 매개변수를 사용합니다: axis, skipna, 그리고 추가적인 args/kwargs.

axis 매개변수는 누적 최댓값을 계산할 축을 지정하는 데 사용됩니다. 기본적으로 0 또는 'index'로 설정되어 있으며, 이는 누적 최댓값이 인덱스 축을 따라 계산됨을 의미합니다. 1 또는 'columns'로 설정하면 누적 최댓값이 열 축을 따라 계산됩니다.

skipna 매개변수는 NA/null 값을 계산에서 제외할지 여부를 결정하는 부울 값입니다. True로 설정하면 NA/null 값이 제외됩니다. False로 설정하면 NA/null 값이 포함됩니다.

cummax() 메서드를 적용하려면 다음 코드를 사용할 수 있습니다.

df_cummax = df.cummax(axis=0, skipna=True)

결과 출력

마지막으로, cummax() 메서드의 결과를 출력하여 누적 최댓값을 확인할 수 있습니다.

print(df_cummax)

요약

이 랩에서는 pandas 라이브러리에서 cummax() 메서드를 사용하여 DataFrame 또는 Series 축에 대한 누적 최댓값을 계산하는 방법을 배웠습니다. pandas 라이브러리를 가져오고, DataFrame 을 생성하고, 선택적 매개변수를 사용하여 cummax() 메서드를 적용하고, 결과를 출력하는 방법을 살펴보았습니다. cummax() 메서드는 추세를 분석하고 시간 경과에 따른 데이터 세트에서 가장 높은 값을 찾는 데 유용합니다. 데이터 분석 및 의사 결정 과정에서 유용한 도구가 될 수 있습니다.