Matplotlib 을 이용한 바이올린 플롯 시각화 사용자 정의

Beginner

This tutorial is from open-source community. Access the source code

소개

이 랩에서는 Matplotlib 을 사용하여 바이올린 플롯을 사용자 정의하는 방법을 배웁니다. 바이올린 플롯은 데이터의 분포와 밀도를 시각화하는 강력한 도구입니다. 플롯의 모양을 사용자 정의함으로써 더 유익하고 시각적으로 매력적인 시각화를 만들 수 있습니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

테스트 데이터 생성

먼저, 바이올린 플롯에 사용할 테스트 데이터를 생성합니다. NumPy 를 사용하여 표준 편차가 증가하는 100 개의 정규 분포 값을 가진 네 개의 배열을 생성합니다.

import matplotlib.pyplot as plt
import numpy as np

## create test data
np.random.seed(19680801)
data = [sorted(np.random.normal(0, std, 100)) for std in range(1, 5)]

기본 바이올린 플롯 생성

다음으로, Matplotlib 의 violinplot 함수를 사용하여 기본 바이올린 플롯을 생성합니다. 이는 이후 단계에서 플롯을 사용자 정의할 때 비교를 위한 기준선을 제공합니다.

## create default violin plot
fig, ax1 = plt.subplots()
ax1.set_title('Default Violin Plot')
ax1.set_ylabel('Observed Values')
ax1.violinplot(data)

바이올린 플롯 모양 사용자 정의

이제 바이올린 플롯의 모양을 사용자 정의합니다. 먼저, showmeans, showmedians, 및 showextrema 인수를 False로 설정하여 Matplotlib 가 그리는 내용을 제한합니다. 그런 다음, set_facecolorset_alpha 메서드를 사용하여 바이올린 몸체의 색상과 불투명도를 변경합니다. 마지막으로, NumPy 의 percentile 함수를 사용하여 사분위수, 중앙값, 및 수염 (whiskers) 을 계산하여 바이올린 플롯 위에 상자 그림 (box plot) 의 단순화된 표현을 추가합니다.

## customize violin plot appearance
fig, ax2 = plt.subplots()
ax2.set_title('Customized Violin Plot')
ax2.set_ylabel('Observed Values')

## create violin plot
parts = ax2.violinplot(
        data, showmeans=False, showmedians=False,
        showextrema=False)

## customize violin bodies
for pc in parts['bodies']:
    pc.set_facecolor('#D43F3A')
    pc.set_edgecolor('black')
    pc.set_alpha(1)

## add box plot
quartile1, medians, quartile3 = np.percentile(data, [25, 50, 75], axis=1)
whiskers = np.array([
    adjacent_values(sorted_array, q1, q3)
    for sorted_array, q1, q3 in zip(data, quartile1, quartile3)])
whiskers_min, whiskers_max = whiskers[:, 0], whiskers[:, 1]

inds = np.arange(1, len(medians) + 1)
ax2.scatter(inds, medians, marker='o', color='white', s=30, zorder=3)
ax2.vlines(inds, quartile1, quartile3, color='k', linestyle='-', lw=5)
ax2.vlines(inds, whiskers_min, whiskers_max, color='k', linestyle='-', lw=1)

축 스타일 설정

마지막으로, 눈금 레이블과 제한을 지정하여 x 축의 스타일을 설정합니다. 이를 수행하기 위해 헬퍼 함수 set_axis_style을 정의합니다.

## set style for the axes
labels = ['A', 'B', 'C', 'D']
set_axis_style(ax2, labels)

def set_axis_style(ax, labels):
    ax.set_xticks(np.arange(1, len(labels) + 1))
    ax.set_xticklabels(labels)
    ax.set_xlim(0.25, len(labels) + 0.75)
    ax.set_xlabel('Sample Name')

요약

이 랩에서는 Matplotlib 을 사용하여 바이올린 플롯의 모양을 사용자 정의하는 방법을 배웠습니다. 기본 바이올린 플롯을 생성한 다음, 바이올린 몸체의 색상과 불투명도를 변경하고, 상단에 단순화된 상자 그림 표현을 추가하여 수정했습니다. 또한 x 축 눈금 레이블과 제한에 대한 스타일을 설정했습니다. 플롯의 모양을 사용자 정의함으로써, 더 유익하고 시각적으로 매력적인 시각화를 만들 수 있습니다.