Pandas DataFrame Nunique 메서드

Beginner

소개

이 랩에서는 Python pandas 의 DataFrame.nunique() 메서드에 대해 배우겠습니다. 이 메서드는 pandas DataFrame 에서 고유한 관측치 (unique observations) 의 수를 세는 데 사용됩니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접속하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

pandas 라이브러리 가져오기

시작하기 전에, 데이터 조작 및 분석에 사용되는 pandas 라이브러리를 임포트해야 합니다. 다음 코드를 사용하여 임포트할 수 있습니다.

import pandas as pd

DataFrame 생성하기

작업할 샘플 DataFrame 을 생성해 보겠습니다. pd.DataFrame() 함수를 사용하여 A, B, C 세 개의 열과 세 개의 데이터 행을 가진 DataFrame 을 생성합니다. 각 열에는 중복된 값이 포함됩니다.

df = pd.DataFrame({'A': [1, 2, 3], 'B': [1, 1, 1], 'C': [2, 5, 5]})

DataFrame 내 고유값 개수 세기

이제 DataFrame.nunique() 메서드를 사용하여 DataFrame 내 고유 값의 개수를 세어 보겠습니다. axis 매개변수를 "0"으로 지정하여 인덱스 축 (열) 에 대한 고유 값을 세거나, "1"로 지정하여 열 축 (행) 에 대한 고유 값을 셀 수 있습니다.

print("각 열의 고유 값 개수:")
print(df.nunique(axis=0))

print("각 행의 고유 값 개수:")
print(df.nunique(axis=1))

Null 값 처리

기본적으로 DataFrame.nunique() 메서드는 null 값을 개수에 포함하지 않습니다. 열에 null 값이 포함된 경우 "0"으로 계산됩니다. 몇 개의 null 값을 가진 다른 DataFrame 을 생성하고 다시 고유 값을 세어 보겠습니다.

df = pd.DataFrame({'A': [1, None, 3], 'B': [1, None, 1], 'C': [2, None, 5]})

Null 값을 포함한 고유값 개수 세기

이 새로운 DataFrame 에서 null 값을 포함하여 고유 값을 세어 보겠습니다.

print("null 값을 포함한 각 행의 고유 값 개수:")
print(df.nunique(axis=1))

요약

이 랩에서는 pandas 에서 DataFrame.nunique() 메서드를 사용하여 DataFrame 의 고유 값 수를 세는 방법을 배웠습니다. 또한 null 값을 처리하고 null 값을 포함한 고유 값을 세는 방법도 배웠습니다. 이 메서드는 데이터 세트를 분석하고 DataFrame 의 값 분포를 이해하는 데 유용합니다.