변수 관계 시각화

Beginner

This tutorial is from open-source community. Access the source code

소개

이 랩에서는 Python 의 Matplotlib 라이브러리를 사용하여 간단한 산점도 (scatter plot) 를 만드는 방법을 배웁니다. 산점도는 두 변수의 값을 점의 모음으로 표시하는 그래프 유형입니다. 각 점은 두 변수의 값을 나타내며, 점의 위치는 두 변수의 값을 나타냅니다. 산점도는 변수 간의 관계를 식별하고 이상치 (outlier) 를 식별하는 데 유용합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

필요한 라이브러리 가져오기

이 단계에서는 산점도를 만드는 데 필요한 라이브러리를 가져오겠습니다. 그래프를 만들기 위해 Matplotlib 라이브러리를 사용하고, 임의의 데이터를 생성하기 위해 NumPy 라이브러리를 사용합니다.

import matplotlib.pyplot as plt
import numpy as np

임의 데이터 생성

이 단계에서는 산점도에 사용할 임의 데이터를 생성합니다. NumPy 라이브러리를 사용하여 각 변수에 대해 50 개의 데이터 포인트를 생성합니다.

np.random.seed(19680801)

N = 50
x = np.random.rand(N)
y = np.random.rand(N)

점의 크기와 색상 정의

이 단계에서는 산점도의 점 크기와 색상을 정의합니다. NumPy 라이브러리를 사용하여 점의 크기와 색상에 대한 임의의 값을 생성합니다.

colors = np.random.rand(N)
area = (30 * np.random.rand(N))**2

산점도 생성

이 단계에서는 Matplotlib 라이브러리를 사용하여 산점도를 생성합니다. scatter 함수를 사용하여 플롯을 생성하고 점의 크기와 색상을 지정합니다.

plt.scatter(x, y, s=area, c=colors, alpha=0.5)
plt.show()

요약

이 랩에서는 Python 의 Matplotlib 라이브러리를 사용하여 간단한 산점도를 만드는 방법을 배웠습니다. NumPy 라이브러리를 사용하여 플롯에 대한 임의 데이터를 생성하고, 점의 크기와 색상을 정의했으며, Matplotlib 라이브러리의 scatter 함수를 사용하여 플롯을 생성했습니다. 산점도는 변수 간의 관계를 식별하고 이상치를 식별하는 데 유용합니다.