Matplotlib 을 이용한 히스토그램 플롯

Beginner

This tutorial is from open-source community. Access the source code

소개

Matplotlib 는 Python 에서 널리 사용되는 데이터 시각화 라이브러리입니다. 데이터 분포를 시각화하는 가장 일반적인 방법 중 하나는 히스토그램을 사용하는 것입니다. 이 Lab 에서는 Matplotlib 를 사용하여 히스토그램을 생성하고 다양한 사용자 정의 옵션을 탐색하는 방법을 배우겠습니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

먼저, Matplotlib 및 NumPy 를 포함한 필요한 라이브러리를 가져와야 합니다.

import matplotlib.pyplot as plt
import numpy as np

샘플 데이터 생성

다음으로, 히스토그램에 사용할 샘플 데이터를 생성합니다. 이 예제에서는 세 개의 무작위 데이터 세트를 생성합니다.

np.random.seed(19680801)
n_bins = 10
x = np.random.randn(1000, 3)

기본 히스토그램 플롯

Matplotlib 의 hist 함수를 사용하여 기본 히스토그램을 생성할 수 있습니다. 이 함수는 플롯하려는 데이터와 사용할 빈 (bin) 수를 입력으로 받습니다.

plt.hist(x, n_bins)
plt.show()

레이블 및 제목 추가

xlabel, ylabel, 그리고 title 함수를 사용하여 x 축과 y 축에 레이블을 추가하고 플롯에 제목을 추가할 수 있습니다.

plt.hist(x, n_bins)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

히스토그램 사용자 정의

color, alpha, 그리고 edgecolor 매개변수를 사용하여 막대의 색상, 투명도 및 테두리 색상을 변경하여 히스토그램을 사용자 정의할 수 있습니다.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black')
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.show()

여러 히스토그램 플롯

hist 함수에 데이터 배열을 전달하여 동일한 플롯에 여러 히스토그램을 플롯할 수 있습니다.

plt.hist(x, n_bins, color='green', alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Histogram of Random Data')
plt.legend()
plt.show()

스택 히스토그램 플롯

stacked 매개변수를 True로 설정하여 스택 히스토그램을 플롯할 수 있습니다.

plt.hist(x, n_bins, color=['green', 'blue', 'red'], alpha=0.5, edgecolor='black', label=['Sample 1', 'Sample 2', 'Sample 3'], stacked=True)
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Stacked Histogram of Random Data')
plt.legend()
plt.show()

스텝 히스토그램 플롯

histtype 매개변수를 'step'으로 설정하여 스텝 히스토그램을 플롯할 수 있습니다.

plt.hist(x, n_bins, histtype='step', color=['green', 'blue', 'red'], label=['Sample 1', 'Sample 2', 'Sample 3'])
plt.xlabel('Value')
plt.ylabel('Frequency')
plt.title('Step Histogram of Random Data')
plt.legend()
plt.show()

요약

이 랩에서는 Matplotlib 을 사용하여 히스토그램을 만드는 방법을 배웠습니다. 막대의 색상, 투명도 및 테두리 색상 변경, 동일한 플롯에 여러 히스토그램 플롯, 히스토그램 스택, 스텝 히스토그램 플롯 등 다양한 사용자 정의 옵션을 살펴보았습니다. 이러한 도구는 데이터의 분포를 더 잘 이해하는 데 도움이 될 수 있습니다.