Pandas DataFrame dropna 메서드

Beginner

소개

이 랩에서는 DataFrame 의 pandas dropna() 메서드에 대해 배우겠습니다. 이 메서드는 null 또는 NaN 값을 포함하는 행이나 열을 삭제하여 DataFrame 에서 누락된 값을 제거하는 데 사용됩니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위한 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 즉시 문제를 해결해 드리겠습니다.

pandas 라이브러리 가져오기

시작하기 전에 pandas 라이브러리를 가져와야 합니다. 이 라이브러리에는 pd 별칭을 사용합니다.

import pandas as pd

DataFrame 생성

몇 가지 누락된 값을 포함하는 DataFrame 을 생성해 보겠습니다.

df = pd.DataFrame([
    ['Abhishek', 100, 'Science', None],
    ['Anurag', 101, 'Science', 85],
    ['Chetan', 103, 'Maths', None]
], columns=['Name', 'Roll No', 'Subject', 'Marks'])

dropna() 메서드를 사용하여 결측값이 있는 행 삭제

dropna() 메서드를 사용하여 누락된 값을 포함하는 행을 삭제할 수 있습니다. 기본적으로, null 또는 NaN 값이 하나 이상 있는 모든 행을 제거합니다.

df_dropped = df.dropna()

결과 표시

원래 DataFrame 과 누락된 값이 있는 행을 삭제한 후의 결과 DataFrame 을 출력해 보겠습니다.

print("Original DataFrame:")
print(df)

print("DataFrame after dropping rows with missing values:")
print(df_dropped)

요약

이 랩에서는 누락된 값이 있는 행 또는 열을 삭제하는 데 사용되는 DataFrame 의 pandas dropna() 메서드에 대해 배웠습니다. 이러한 누락된 값을 삭제함으로써 DataFrame 을 정리하고 추가 분석에 적합하게 만들 수 있습니다. 이 메서드는 기본적으로 DataFrame 을 수정하고 새로운 DataFrame 을 반환하지만, inplace 매개변수를 True로 설정하여 DataFrame 을 제자리에서 수정하도록 선택할 수도 있습니다.