Pandas DataFrame 최빈값 (Mode) 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 의 mode() 메서드 사용법을 안내합니다. mode() 메서드는 DataFrame 에서 가장 자주 나타나는 값 (들) 을 찾는 데 사용됩니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 즉시 문제를 해결해 드리겠습니다.

필요한 라이브러리 임포트

먼저, import 문을 사용하여 Pandas 라이브러리를 임포트합니다:

import pandas as pd

DataFrame 생성

이제 DataFrame() 생성자를 사용하여 DataFrame 을 생성합니다. 이 예제에서는 "A", "B", "C" 세 개의 열을 가진 DataFrame 을 생성해 보겠습니다.

df = pd.DataFrame({"A": [1, 2, 1], "B": [2, 2, 1], "C": [5, 2, 5]})

최빈값 찾기

DataFrame 의 각 열에 대한 최빈값을 찾으려면 mode() 메서드를 사용합니다:

df_mode = df.mode()
print(df_mode)

mode() 메서드는 각 열의 최빈값을 포함하는 DataFrame 을 반환합니다.

축 지정

기본적으로 mode() 메서드는 열 축 (axis=0) 을 따라 최빈값을 찾습니다. 행 축을 따라 최빈값을 찾으려면 axis=1을 지정합니다.

예를 들어, 행 축을 따라 최빈값을 찾으려면 다음 코드를 사용합니다:

df_mode = df.mode(axis=1)
print(df_mode)

숫자 열만 포함

최빈값 계산에 숫자 열만 포함하려면 numeric_only 매개변수를 사용할 수 있습니다. 기본적으로 numeric_onlyFalse로 설정되어 있습니다. 숫자 열만 포함하려면 True로 설정하십시오.

예를 들어, 최빈값 계산에 숫자 열만 포함하려면 다음 코드를 사용합니다:

df_mode = df.mode(numeric_only=True)
print(df_mode)

Null 값 포함

기본적으로 mode() 메서드는 null 값을 고려하지 않습니다. 최빈값 계산에 null 값을 포함하려면 dropna 매개변수를 사용할 수 있습니다. 기본적으로 dropnaTrue로 설정되어 있습니다. null 값을 포함하려면 False로 설정하십시오.

예를 들어, 최빈값 계산에 null 값을 포함하려면 다음 코드를 사용합니다:

df_mode = df.mode(dropna=False)
print(df_mode)

요약

이 랩에서는 Pandas DataFrame 에서 mode() 메서드를 사용하여 가장 자주 발생하는 값 (들) 을 찾는 방법을 배웠습니다. 또한 축을 지정하고, 숫자 열만 포함하며, null 값을 포함하는 방법도 배웠습니다. 이제 이 지식을 사용하여 자체 데이터 분석 프로젝트에서 최빈값 (들) 을 찾을 수 있습니다.