소개
이 랩에서는 Pandas 에서 열 (column) 을 다루는 방법을 배우겠습니다. 기존 열에서 파생된 새로운 열을 생성하고, 열에 수학적 및 논리적 연산을 적용하며, 열 레이블의 이름을 변경하고, apply 메서드를 사용하여 열별 연산을 수행하는 방법을 살펴보겠습니다.
VM 팁
VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 연산의 유효성 검사는 자동화될 수 없습니다.
학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.
Pandas 임포트 및 데이터 로드
먼저, pandas 라이브러리를 임포트하고 CSV 파일에서 대기 질 데이터를 로드합니다.
## Import pandas library
import pandas as pd
## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)
새로운 열 생성
"station_london" 열에 변환 계수를 곱하여 새로운 열 "london_mg_per_cubic"을 생성합니다.
## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882
두 열의 값 비율 확인
다음으로, "station_paris" 및 "station_antwerp" 열의 값 비율을 확인하고 결과를 새로운 열에 저장합니다.
## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]
열 레이블 이름 변경
OpenAQ 에서 사용하는 스테이션 식별자와 일치하도록 열 레이블의 이름을 변경합니다.
## Rename column labels
air_quality_renamed = air_quality.rename(
columns={
"station_antwerp": "BETR801",
"station_paris": "FR04014",
"station_london": "London Westminster",
}
)
열 레이블을 소문자로 변환
마지막으로, 함수를 사용하여 열 레이블을 소문자로 변환합니다.
## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)
요약
이 Lab 에서는 기존 열에서 파생된 새로운 열을 생성하고, 열에 대한 수학적 및 논리적 연산을 수행하며, 열 레이블의 이름을 변경하고, 열 레이블을 소문자로 변환하는 방법을 배웠습니다. 이러한 기술을 통해 pandas 에서 데이터를 보다 효과적으로 조작하고 변환할 수 있습니다.