Pandas 데이터 선택

Beginner

This tutorial is from open-source community. Access the source code

소개

이 랩에서는 Python 의 인기 있는 데이터 분석 및 조작 라이브러리인 Pandas 를 사용하여 DataFrame 에서 특정 데이터를 선택하는 방법을 배우겠습니다. 이 튜토리얼에서는 Titanic 데이터 세트를 사용합니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

이것은 가이드 실험입니다. 학습과 실습을 돕기 위한 단계별 지침을 제공합니다.각 단계를 완료하고 실무 경험을 쌓기 위해 지침을 주의 깊게 따르세요. 과거 데이터에 따르면, 이것은 초급 레벨의 실험이며 완료율은 98%입니다.학습자들로부터 100%의 긍정적인 리뷰율을 받았습니다.

필요한 라이브러리 및 데이터 가져오기

먼저 Pandas 라이브러리와 Titanic 데이터 세트를 가져와야 합니다.

## Import pandas library
import pandas as pd

## Load the Titanic dataset
titanic = pd.read_csv("data/titanic.csv")
titanic.head()

단일 열 선택

단일 열을 선택하려면 관심 있는 열 이름을 사용하여 대괄호 []를 사용합니다.

## Select the 'Age' column
ages = titanic["Age"]

## Display the first 5 rows
ages.head()

여러 열 선택

여러 열을 선택하려면 선택 대괄호 [] 안에 열 이름 목록을 사용합니다.

## Select the 'Age' and 'Sex' columns
age_sex = titanic[["Age", "Sex"]]

## Display the first 5 rows
age_sex.head()

특정 행 필터링

조건식에 따라 행을 선택하려면 선택 대괄호 [] 안에 조건을 사용합니다.

## Filter rows where 'Age' is greater than 35
above_35 = titanic[titanic["Age"] > 35]

## Display the first 5 rows
above_35.head()

특정 행과 열 선택

한 번에 행과 열을 모두 선택하려면 loc 또는 iloc 연산자를 사용합니다.

## Select 'Name' of passengers older than 35
adult_names = titanic.loc[titanic["Age"] > 35, "Name"]

## Display the first 5 rows
adult_names.head()

요약

이 랩에서는 Pandas 에서 DataFrame 의 데이터를 선택하고 필터링하는 방법을 배웠습니다. 단일 또는 여러 열을 선택하고, 특정 조건에 따라 행을 필터링하며, 특정 행과 열을 선택하는 방법을 배웠습니다. 이러한 작업은 Pandas 를 사용한 데이터 분석 및 조작의 기본입니다.