소개
이 랩에서는 Python 의 인기 있는 데이터 분석 및 조작 라이브러리인 Pandas 를 사용하여 DataFrame 에서 특정 데이터를 선택하는 방법을 배우겠습니다. 이 튜토리얼에서는 Titanic 데이터 세트를 사용합니다.
VM 팁
VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.
때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.
학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.
필요한 라이브러리 및 데이터 가져오기
먼저 Pandas 라이브러리와 Titanic 데이터 세트를 가져와야 합니다.
## Import pandas library
import pandas as pd
## Load the Titanic dataset
titanic = pd.read_csv("data/titanic.csv")
titanic.head()
단일 열 선택
단일 열을 선택하려면 관심 있는 열 이름을 사용하여 대괄호 []를 사용합니다.
## Select the 'Age' column
ages = titanic["Age"]
## Display the first 5 rows
ages.head()
여러 열 선택
여러 열을 선택하려면 선택 대괄호 [] 안에 열 이름 목록을 사용합니다.
## Select the 'Age' and 'Sex' columns
age_sex = titanic[["Age", "Sex"]]
## Display the first 5 rows
age_sex.head()
특정 행 필터링
조건식에 따라 행을 선택하려면 선택 대괄호 [] 안에 조건을 사용합니다.
## Filter rows where 'Age' is greater than 35
above_35 = titanic[titanic["Age"] > 35]
## Display the first 5 rows
above_35.head()
특정 행과 열 선택
한 번에 행과 열을 모두 선택하려면 loc 또는 iloc 연산자를 사용합니다.
## Select 'Name' of passengers older than 35
adult_names = titanic.loc[titanic["Age"] > 35, "Name"]
## Display the first 5 rows
adult_names.head()
요약
이 랩에서는 Pandas 에서 DataFrame 의 데이터를 선택하고 필터링하는 방법을 배웠습니다. 단일 또는 여러 열을 선택하고, 특정 조건에 따라 행을 필터링하며, 특정 행과 열을 선택하는 방법을 배웠습니다. 이러한 작업은 Pandas 를 사용한 데이터 분석 및 조작의 기본입니다.