Pandas DataFrame isna() 메서드 사용법

Beginner

소개

이 랩에서는 Pandas 의 DataFrame.isna() 메서드를 사용하는 방법을 배웁니다. isna() 메서드는 Pandas DataFrame 에서 누락된 값을 감지하는 데 사용됩니다. 이 메서드는 각 요소가 null 값인지 여부를 나타내는 부울 값의 DataFrame 을 반환합니다. isna() 메서드는 빈 문자열이나 numpy.inf와 같은 특수 값을 null 값으로 간주하지 않습니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

DataFrame 생성

먼저, pandas 라이브러리의 DataFrame() 함수를 사용하여 일부 누락된 값을 가진 DataFrame 을 생성해 보겠습니다. 필요한 라이브러리를 가져오고 'a', 'b', 'c', 'd' 열을 가진 DataFrame 을 생성합니다.

#importing pandas as pd
import pandas as pd
#importing numpy as np
import numpy as np

#creating the DataFrame
df = pd.DataFrame([(0.0, np.nan, -1.0, 1.0),
                   (np.nan, 2.0, np.nan, np.nan),
                   (2.0, 3.0, np.nan, 9.0)],
                  columns=list('abcd'))

print("------The DataFrame is----------")
print(df)

누락된 값 감지

다음으로, isna() 메서드를 사용하여 DataFrame 에서 누락된 값을 감지합니다. 어떤 요소가 null 값인지 확인하기 위해 결과를 출력합니다.

print("---------------------------------")
print(df.isna())

결과 평가

코드를 실행하면 isna() 메서드가 원래 DataFrame 의 각 요소에 대한 부울 값으로 구성된 DataFrame 을 반환하는 것을 볼 수 있습니다. False 는 요소가 null 값이 아님을 나타내고, True 는 요소가 null 값임을 나타냅니다.

빈 문자열 고려

이전 예제에서 isna() 메서드는 빈 문자열을 null 값으로 간주하지 않았습니다. 다른 DataFrame 을 생성하고 isna() 메서드가 동일하게 동작하는지 확인해 보겠습니다.

#creating another DataFrame
df = pd.DataFrame({'a': [0, 1, ''], 'b': ['', None, 3]})

print("------The DataFrame is----------")
print(df)

누락된 값 다시 감지

이제 새로운 DataFrame 에서 isna() 메서드를 사용하여 누락된 값을 감지해 보겠습니다.

print("---------------------------------")
print(df.isna())

요약

이 랩에서는 Pandas 에서 DataFrame.isna() 메서드를 사용하여 DataFrame 에서 누락된 값을 감지하는 방법을 배웠습니다. 누락된 값이 있는 DataFrame 을 생성하고, isna() 메서드를 사용하여 해당 누락된 값을 감지하고 결과를 관찰했습니다. 또한 isna() 메서드가 빈 문자열을 null 값으로 간주하지 않는다는 것을 확인했습니다. 이 메서드는 pandas DataFrame 에서 누락된 데이터를 처리하는 데 유용합니다.


더 궁금한 점이 있으시면 언제든지 문의해주세요.