Pandas DataFrame cummin 메서드

Beginner

소개

이 랩에서는 Python pandas 라이브러리의 cummin() 메서드를 사용하는 방법을 배우겠습니다. cummin() 메서드는 DataFrame 또는 Series 축을 따라 누적 최소값을 계산합니다. 누적 최소값을 포함하는 동일한 크기의 DataFrame 또는 Series 를 반환합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

pandas 라이브러리 가져오기

먼저, cummin() 메서드를 사용하기 위해 pandas 라이브러리를 가져와야 합니다. 프로그램 시작 부분에 다음 코드 줄을 추가하여 이를 수행할 수 있습니다.

import pandas as pd

DataFrame 생성하기

다음으로, 예제에 사용할 DataFrame 을 생성해 보겠습니다. pd.DataFrame() 생성자를 사용하고 값의 딕셔너리를 전달하여 이를 수행할 수 있습니다. 다음은 예시입니다.

df = pd.DataFrame({"A": [1, 2, 8, 4], "B": [9, 10, 7, 8], "C": [9, 10, 11, 12], "D": [13, 16, 15, 16]})

이렇게 하면 네 개의 열 (A, B, C, D) 과 네 개의 행이 있는 DataFrame 이 생성됩니다.

인덱스 축을 기준으로 누적 최소값 찾기

인덱스 축을 기준으로 누적 최소값을 찾으려면, DataFrame 에서 cummin() 메서드를 사용할 수 있습니다. axis 매개변수를 0 또는 'index'로 지정해야 합니다. 다음은 예시입니다.

df_cummin = df.cummin(axis=0)

이렇게 하면 인덱스 축을 기준으로 각 열의 누적 최소값을 계산하여 결과를 df_cummin DataFrame 에 저장합니다.

열 축을 기준으로 누적 최소값 찾기

열 축을 기준으로 누적 최소값을 찾으려면, DataFrame 에서 cummin() 메서드를 사용할 수 있습니다. axis 매개변수를 1 또는 'columns'로 지정해야 합니다. 다음은 예시입니다.

df_cummin = df.cummin(axis=1)

이렇게 하면 열 축을 기준으로 각 행의 누적 최소값을 계산하여 결과를 df_cummin DataFrame 에 저장합니다.

Null 값 처리 방법

기본적으로 cummin() 메서드는 NA/null 값을 제외합니다. 전체 행/열이 NA 인 경우 결과는 NA 가 됩니다. skipna 매개변수를 False 로 설정하여 이 동작을 변경할 수 있습니다. 다음은 예시입니다.

df_cummin = df.cummin(skipna=False)

이렇게 하면 null 값을 포함하여 인덱스 축을 기준으로 각 열의 누적 최소값을 계산하고 결과를 df_cummin DataFrame 에 저장합니다.

요약

이 랩에서는 pandas 라이브러리에서 cummin() 메서드를 사용하는 방법을 배웠습니다. DataFrame 의 인덱스 또는 열 축을 기준으로 누적 최소값을 찾는 방법을 배웠습니다. 또한 계산 중에 null 값을 처리하는 방법도 배웠습니다. cummin() 메서드는 데이터를 분석하고 시간 경과에 따른 추세를 찾는 데 유용합니다.