Pandas DataFrame 중앙값 메서드

Beginner

소개

이 랩에서는 Pandas 라이브러리의 median() 메서드를 사용하여 DataFrame 내 값들의 중앙값을 계산하는 방법을 배웁니다. median() 메서드를 사용하면 데이터 세트의 중간값을 찾아 중심 경향성을 측정할 수 있습니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

pandas 라이브러리 임포트

먼저, 데이터 조작 및 분석에 일반적으로 사용되는 'pandas' 라이브러리를 임포트해야 합니다.

import pandas as pd

DataFrame 생성

다음으로, pd.DataFrame() 생성자를 사용하여 DataFrame 객체를 생성합니다. 이를 통해 데이터를 저장하고 조작할 수 있습니다.

df = pd.DataFrame({"A": [0, 52, 78], "B": [77, 45, 96], "C": [16, 23, 135], "D": [17, 22, 56]})
print("------DataFrame------")
print(df)

인덱스 축을 따라 중앙값 계산

DataFrame 의 인덱스 축을 따라 중앙값을 계산하려면, axis 매개변수를 0 으로 설정하여 median() 메서드를 사용할 수 있습니다.

print("---------------------------")
print(df.median(axis=0))

열 축을 따라 중앙값 계산

DataFrame 의 열 축을 따라 중앙값을 계산하려면, axis 매개변수를 1 로 설정하여 median() 메서드를 사용할 수 있습니다.

print("---------------------------")
print(df.median(axis=1))

Null 값 처리

DataFrame 에 결측값이 포함된 경우, skipna 매개변수를 지정하여 처리할 수 있습니다. 기본적으로 skipnaTrue로 설정되어 있으며, 중앙값을 계산할 때 결측값을 제외합니다. 결측값을 포함하려면 skipnaFalse로 설정할 수 있습니다.

df = pd.DataFrame({"A": [0, None, 78], "B": [77, 45, None], "C": [16, 23, None], "D": [17, 22, 56]})
print("------The DataFrame is------")
print(df)
print("---------------------------")
print(df.median(axis=0, skipna=False))

요약

이 랩에서는 Pandas 의 median() 메서드를 사용하여 DataFrame 의 값에 대한 중앙값을 계산하는 방법을 배웠습니다. 인덱스 축과 열 축을 따라 중앙값을 계산하는 방법을 살펴보았습니다. 또한, 중앙값을 계산할 때 결측값을 처리하는 방법을 배웠습니다. 중앙값 계산은 데이터 세트의 중심 경향을 이해하는 데 유용하며, 데이터 분석에서 정보에 입각한 결정을 내리는 데 사용될 수 있습니다.