Pandas DataFrame hist 메서드

Beginner

소개

Pandas 라이브러리의 hist() 메서드는 데이터 분포를 시각적으로 표현하는 히스토그램을 생성할 수 있게 해줍니다. 이 메서드는 DataFrame 객체에서 사용되며, DataFrame 내 각 시리즈에 대해 matplotlib.pyplot.hist() 함수를 호출하여 각 열별로 하나의 히스토그램을 생성합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

hist() 메서드를 사용하려면 필요한 라이브러리인 pandasmatplotlib.pyplot을 임포트해야 합니다.

import pandas as pd
import matplotlib.pyplot as plt

DataFrame 생성

다음으로, pd.DataFrame() 메서드를 사용하여 DataFrame 객체를 생성해야 합니다. 딕셔너리를 인수로 전달할 수 있으며, 여기서 키는 열 이름을 나타내고 값은 데이터를 나타냅니다.

data = {'length': [1.5, 0.5, 1.2, 0.9, 3], 'width': [0.7, 0.2, 0.15, 0.2, 1.1]}
df = pd.DataFrame(data)

히스토그램 생성

이제 DataFrame 에서 hist() 메서드를 사용하여 각 열의 히스토그램을 생성할 수 있습니다.

df.hist()
plt.show()

히스토그램 사용자 정의

hist() 메서드에 추가 매개변수를 제공하여 히스토그램을 사용자 정의할 수 있습니다. 예를 들어, bin 의 수, 히스토그램 막대의 색상 및 히스토그램의 제목을 지정할 수 있습니다.

df.hist(bins=10, color='skyblue')
plt.title('Histogram')
plt.show()

요약

Pandas 의 hist() 메서드를 사용하면 DataFrame 내의 데이터에 대한 히스토그램을 생성할 수 있습니다. 이 메서드를 사용하면 데이터의 분포를 시각화할 수 있으며, 이는 데이터 분석 및 탐색에 유용할 수 있습니다. 또한, hist() 메서드에 추가 매개변수를 제공하여 히스토그램의 모양을 사용자 정의할 수 있습니다. 전반적으로, hist() 메서드는 Pandas 에서 데이터를 분석하고 시각화하는 데 유용한 도구입니다.