Python Matplotlib 산점도 (Scatter Plot) 생성

Beginner

This tutorial is from open-source community. Access the source code

소개

이 단계별 랩은 Python 의 Matplotlib 라이브러리를 사용하여 시각화를 생성하는 과정을 안내합니다. Matplotlib 는 사용자가 선 그래프, 산점도, 히스토그램 등 다양한 시각화를 생성할 수 있도록 해주는 데이터 시각화 라이브러리입니다. 이 랩에서는 Matplotlib 를 사용하여 간단한 산점도를 생성해 보겠습니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

라이브러리 임포트

시각화를 생성하기 전에 필요한 라이브러리를 임포트해야 합니다. 이 예제에서는 numpy 와 matplotlib.pyplot 을 사용합니다.

import matplotlib.pyplot as plt
import numpy as np

데이터 생성

다음으로, 시각화에 사용할 임의의 데이터를 생성합니다. 이 예제에서는 numpy 를 사용하여 두 개의 임의 데이터 배열을 생성합니다.

## Fixing random state for reproducibility
np.random.seed(19680801)

x = np.random.rand(20)
y = 1e7 * np.random.rand(20)

플롯 생성

이제 데이터를 갖추었으므로 Matplotlib 을 사용하여 플롯을 생성할 수 있습니다. 이 예제에서는 plot() 함수를 사용하여 산점도 (scatter plot) 를 생성합니다.

fig, ax = plt.subplots()
plt.plot(x, y, 'o')

플롯 형식 지정

플롯의 가독성을 높이기 위해 Matplotlib 의 형식 지정 함수를 사용하여 형식을 지정할 수 있습니다. 이 예제에서는 y 축 레이블이 백만 단위로 값을 표시하도록 형식을 지정합니다.

def millions(x):
    return '$%1.1fM' % (x * 1e-6)

ax.fmt_ydata = millions

플롯 표시

마지막으로, Matplotlib 의 show() 함수를 사용하여 플롯을 표시할 수 있습니다.

plt.show()

요약

이 랩에서는 Matplotlib 을 사용하여 산점도 (scatter plot) 를 만드는 방법을 배웠습니다. 또한 플롯의 형식을 지정하고 표시하는 방법도 배웠습니다. Matplotlib 은 광범위한 시각화를 생성하는 데 사용할 수 있는 강력한 라이브러리입니다.