Pandas 를 이용한 대기 질 분석 플로팅

Beginner

This tutorial is from open-source community. Access the source code

소개

이 랩에서는 Python 의 강력한 데이터 조작 라이브러리인 Pandas 를 사용하여 플롯을 만드는 방법을 배웁니다. 실제 대기 질 데이터를 사용하여 실질적인 예시를 보여드리겠습니다. 이 랩을 마치면 Pandas 를 사용하여 선 그래프, 산점도, 상자 그림을 만들고 플롯을 사용자 정의할 수 있게 됩니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

이것은 가이드 실험입니다. 학습과 실습을 돕기 위한 단계별 지침을 제공합니다.각 단계를 완료하고 실무 경험을 쌓기 위해 지침을 주의 깊게 따르세요. 과거 데이터에 따르면, 이것은 초급 레벨의 실험이며 완료율은 93%입니다.학습자들로부터 93%의 긍정적인 리뷰율을 받았습니다.

필요한 라이브러리 가져오기

먼저, 필요한 라이브러리를 가져와야 합니다. 데이터 조작을 위해 Pandas 를 사용하고, 데이터 시각화를 위해 Matplotlib 를 사용합니다.

## Importing necessary libraries
import pandas as pd
import matplotlib.pyplot as plt

데이터 로드

이 튜토리얼에서는 대기 질 데이터를 사용합니다. 데이터는 CSV 파일에서 Pandas DataFrame 으로 로드됩니다.

## Loading the data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
air_quality.head()

선 그래프 생성

Pandas 는 기본적으로 숫자 데이터가 있는 각 열에 대한 선 그래프를 생성합니다. 이를 통해 데이터에 대한 빠른 시각적 개요를 얻을 수 있습니다.

## Creating a line plot
air_quality.plot()
plt.show()

특정 열에 대한 플롯 생성

특정 열을 플롯하려면 선택 방법과 plot 메서드를 함께 사용할 수 있습니다.

## Creating a plot for a specific column
air_quality["station_paris"].plot()
plt.show()

산점도 생성

런던과 파리에서 측정된 NO2 값을 시각적으로 비교하기 위해 산점도 (scatter plot) 를 생성할 수 있습니다.

## Creating a scatter plot
air_quality.plot.scatter(x="station_london", y="station_paris", alpha=0.5)
plt.show()

박스 플롯 생성

박스 플롯은 데이터 분포에 대한 좋은 개요를 제공합니다. 우리는 대기 질 데이터에 대한 박스 플롯을 생성할 수 있습니다.

## Creating a box plot
air_quality.plot.box()
plt.show()

각 열에 대한 서브플롯 생성

subplots 인수를 사용하여 각 데이터 열에 대한 개별 서브플롯 (subplot) 을 생성할 수 있습니다.

## Creating subplots for each column
axs = air_quality.plot.area(figsize=(12, 4), subplots=True)
plt.show()

플롯 사용자 정의 및 저장

Matplotlib 의 사용자 정의 옵션을 사용하여 플롯을 추가로 사용자 정의할 수 있습니다. 또한 플롯을 파일로 저장할 수도 있습니다.

## Customizing and saving the plot
fig, axs = plt.subplots(figsize=(12, 4))
air_quality.plot.area(ax=axs)
axs.set_ylabel("NO$_2$ concentration")
fig.savefig("no2_concentrations.png")
plt.show()

요약

이 랩에서는 Pandas 를 사용하여 다양한 유형의 플롯을 생성하는 방법을 배웠습니다. 또한 이러한 플롯을 사용자 정의하고 저장하는 방법도 배웠습니다. 이 지식은 데이터 분석 및 시각화 작업에 매우 유용할 것입니다.