소개
이 단계별 랩은 Python 의 Matplotlib 라이브러리를 사용하여 시각화를 생성하는 과정을 안내합니다. Matplotlib 는 사용자가 선 그래프, 산점도, 히스토그램 등 다양한 시각화를 생성할 수 있도록 해주는 데이터 시각화 라이브러리입니다. 이 랩에서는 Matplotlib 를 사용하여 간단한 산점도를 생성해 보겠습니다.
VM 팁
VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.
학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.
라이브러리 임포트
시각화를 생성하기 전에 필요한 라이브러리를 임포트해야 합니다. 이 예제에서는 numpy 와 matplotlib.pyplot 을 사용합니다.
import matplotlib.pyplot as plt
import numpy as np
데이터 생성
다음으로, 시각화에 사용할 임의의 데이터를 생성합니다. 이 예제에서는 numpy 를 사용하여 두 개의 임의 데이터 배열을 생성합니다.
## Fixing random state for reproducibility
np.random.seed(19680801)
x = np.random.rand(20)
y = 1e7 * np.random.rand(20)
플롯 생성
이제 데이터를 갖추었으므로 Matplotlib 을 사용하여 플롯을 생성할 수 있습니다. 이 예제에서는 plot() 함수를 사용하여 산점도 (scatter plot) 를 생성합니다.
fig, ax = plt.subplots()
plt.plot(x, y, 'o')
플롯 형식 지정
플롯의 가독성을 높이기 위해 Matplotlib 의 형식 지정 함수를 사용하여 형식을 지정할 수 있습니다. 이 예제에서는 y 축 레이블이 백만 단위로 값을 표시하도록 형식을 지정합니다.
def millions(x):
return '$%1.1fM' % (x * 1e-6)
ax.fmt_ydata = millions
플롯 표시
마지막으로, Matplotlib 의 show() 함수를 사용하여 플롯을 표시할 수 있습니다.
plt.show()
요약
이 랩에서는 Matplotlib 을 사용하여 산점도 (scatter plot) 를 만드는 방법을 배웠습니다. 또한 플롯의 형식을 지정하고 표시하는 방법도 배웠습니다. Matplotlib 은 광범위한 시각화를 생성하는 데 사용할 수 있는 강력한 라이브러리입니다.