소개
이 랩에서는 Python 의 강력한 데이터 조작 라이브러리인 Pandas 를 사용하여 플롯을 만드는 방법을 배웁니다. 실제 대기 질 데이터를 사용하여 실질적인 예시를 보여드리겠습니다. 이 랩을 마치면 Pandas 를 사용하여 선 그래프, 산점도, 상자 그림을 만들고 플롯을 사용자 정의할 수 있게 됩니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.
학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.
필요한 라이브러리 가져오기
먼저, 필요한 라이브러리를 가져와야 합니다. 데이터 조작을 위해 Pandas 를 사용하고, 데이터 시각화를 위해 Matplotlib 를 사용합니다.
## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt
데이터 로드
이 튜토리얼에서는 대기 질 데이터를 사용합니다. 데이터는 CSV 파일에서 Pandas DataFrame 으로 로드됩니다.
## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()
선 그래프 생성
Pandas 는 기본적으로 숫자 데이터가 있는 각 열에 대한 선 그래프를 생성합니다. 이를 통해 데이터에 대한 빠른 시각적 개요를 얻을 수 있습니다.
## Creating a line plot
air_quality.plot()
plt.show()
특정 열에 대한 플롯 생성
특정 열을 플롯하려면 선택 방법과 plot 메서드를 함께 사용할 수 있습니다.
## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()
산점도 생성
런던과 파리에서 측정된 NO2 값을 시각적으로 비교하기 위해 산점도 (scatter plot) 를 생성할 수 있습니다.
## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()
박스 플롯 생성
박스 플롯은 데이터 분포에 대한 좋은 개요를 제공합니다. 우리는 대기 질 데이터에 대한 박스 플롯을 생성할 수 있습니다.
## Creating a box plot
air_quality.plot.box()
plt.show()
각 열에 대한 서브플롯 생성
subplots 인수를 사용하여 각 데이터 열에 대한 개별 서브플롯 (subplot) 을 생성할 수 있습니다.
## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()
플롯 사용자 정의 및 저장
Matplotlib 의 사용자 정의 옵션을 사용하여 플롯을 추가로 사용자 정의할 수 있습니다. 또한 플롯을 파일로 저장할 수도 있습니다.
## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()
요약
이 랩에서는 Pandas 를 사용하여 다양한 유형의 플롯을 생성하는 방법을 배웠습니다. 또한 이러한 플롯을 사용자 정의하고 저장하는 방법도 배웠습니다. 이 지식은 데이터 분석 및 시각화 작업에 매우 유용할 것입니다.