Pandas 열 다루기

Beginner

This tutorial is from open-source community. Access the source code

소개

이 랩에서는 Pandas 에서 열 (column) 을 다루는 방법을 배우겠습니다. 기존 열에서 파생된 새로운 열을 생성하고, 열에 수학적 및 논리적 연산을 적용하며, 열 레이블의 이름을 변경하고, apply 메서드를 사용하여 열별 연산을 수행하는 방법을 살펴보겠습니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 연산의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

이것은 가이드 실험입니다. 학습과 실습을 돕기 위한 단계별 지침을 제공합니다.각 단계를 완료하고 실무 경험을 쌓기 위해 지침을 주의 깊게 따르세요. 과거 데이터에 따르면, 이것은 초급 레벨의 실험이며 완료율은 98%입니다.학습자들로부터 100%의 긍정적인 리뷰율을 받았습니다.

Pandas 임포트 및 데이터 로드

먼저, pandas 라이브러리를 임포트하고 CSV 파일에서 대기 질 데이터를 로드합니다.

## Import pandas library
import pandas as pd

## Load air quality data
air_quality = pd.read_csv("data/air_quality_no2.csv", index_col=0, parse_dates=True)

새로운 열 생성

"station_london" 열에 변환 계수를 곱하여 새로운 열 "london_mg_per_cubic"을 생성합니다.

## Create new column by multiplying "station_london" by conversion factor
air_quality["london_mg_per_cubic"] = air_quality["station_london"] * 1.882

두 열의 값 비율 확인

다음으로, "station_paris" 및 "station_antwerp" 열의 값 비율을 확인하고 결과를 새로운 열에 저장합니다.

## Create new column by dividing "station_paris" by "station_antwerp"
air_quality["ratio_paris_antwerp"] = air_quality["station_paris"] / air_quality["station_antwerp"]

열 레이블 이름 변경

OpenAQ 에서 사용하는 스테이션 식별자와 일치하도록 열 레이블의 이름을 변경합니다.

## Rename column labels
air_quality_renamed = air_quality.rename(
    columns={
        "station_antwerp": "BETR801",
        "station_paris": "FR04014",
        "station_london": "London Westminster",
    }
)

열 레이블을 소문자로 변환

마지막으로, 함수를 사용하여 열 레이블을 소문자로 변환합니다.

## Convert column labels to lowercase
air_quality_renamed = air_quality_renamed.rename(columns=str.lower)

요약

이 Lab 에서는 기존 열에서 파생된 새로운 열을 생성하고, 열에 대한 수학적 및 논리적 연산을 수행하며, 열 레이블의 이름을 변경하고, 열 레이블을 소문자로 변환하는 방법을 배웠습니다. 이러한 기술을 통해 pandas 에서 데이터를 보다 효과적으로 조작하고 변환할 수 있습니다.