Pandas DataFrame ffill 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 의 ffill() 메서드를 사용하는 과정을 단계별로 안내합니다. "forward fill"의 약자인 ffill() 메서드는 DataFrame 에서 누락된 값을 채우는 데 사용되며, null 값 앞에 오는 마지막 값을 가져와 채웁니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접속하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

ffill() 메서드를 사용하려면 pandas 라이브러리를 가져와야 합니다. 다음 코드를 실행하여 가져올 수 있습니다.

import pandas as pd

결측값이 있는 DataFrame 생성

다음으로, 몇 가지 결측값이 있는 DataFrame 을 생성해야 합니다. 다음 코드를 실행하여 생성할 수 있습니다.

df = pd.DataFrame({"A": [2, None, 4], "B": [None, 4, np.nan], "C": [2, 0.25, np.nan], "D": [9, 4, None]})

ffill() 메서드를 사용하여 결측값 채우기

이제 ffill() 메서드를 사용하여 DataFrame 의 결측값을 채울 수 있습니다. 이렇게 하려면 다음 코드를 실행하십시오.

df_filled = df.ffill()

axis 매개변수 지정

기본적으로 ffill() 메서드는 인덱스 축 (axis=0) 을 따라 결측값을 채웁니다. 하지만 열 축 (axis=1) 을 따라 결측값을 채우도록 axis 매개변수를 지정할 수도 있습니다. 이렇게 하려면 다음 코드를 실행하십시오.

df_filled = df.ffill(axis=1)

Inplace 채우기

기본적으로 ffill() 메서드는 원본 DataFrame 을 수정하지 않습니다. 하지만 inplace=True 매개변수를 지정하여 결측값을 제자리에서 채울 수 있습니다. 이렇게 하려면 다음 코드를 실행하십시오.

df.ffill(axis=1, inplace=True)

limit 매개변수 지정

연속된 NaN 값의 전방 채우기 (forward fill) 횟수를 제한하기 위해 limit 매개변수를 지정할 수도 있습니다. 이렇게 하려면 다음 코드를 실행하십시오.

df_filled = df.ffill(axis=1, limit=2)

요약

이 랩에서는 Pandas DataFrame 의 ffill() 메서드를 사용하여 DataFrame 의 결측값을 채우는 방법을 배웠습니다. 필요한 라이브러리를 가져오고, 결측값이 있는 DataFrame 을 생성하고, 다른 축을 따라 결측값을 채우고, 제자리에서 결측값을 채우고, 연속된 NaN 값의 전방 채우기 (forward fill) 횟수를 제한하는 방법을 배웠습니다. 이 메서드는 결측 데이터를 처리하고 분석을 위해 데이터 세트를 전처리하는 데 유용할 수 있습니다.