Pandas DataFrame 필터 메서드

Beginner

소개

이 랩에서는 Pandas DataFrame 에서 filter() 메서드를 사용하는 방법을 배우겠습니다. filter() 메서드를 사용하면 지정된 인덱스 레이블을 기반으로 DataFrame 의 행 또는 열을 부분 집합으로 만들 수 있습니다. 이 메서드는 DataFrame 의 내용이 아닌 인덱스의 레이블을 기반으로 DataFrame 을 필터링한다는 점에 유의해야 합니다.

VM 팁

VM 이 시작된 후, 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 신속하게 해결해 드리겠습니다.

DataFrame 생성

먼저, 작업할 샘플 DataFrame 을 생성해 보겠습니다.

#import pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({
    "Name":["Navya","Vindya","Sinchana","Amrutha","Akshatha"],
    "Age":[25,24,25,25,26],
    "Education":["M.Tech","M.Tech","M.Tech","Ph.d","Ph.d"],
    "YOP":[2019,2020,2018,None,None]},
    index=["Group_1", "Group_1","Group_1","Group_2","Group_2"])

#printing DataFrame
print("-------DataFrame is----------")
print(df)

filter() 메서드를 사용하여 열 이름으로 필터링

filter() 메서드의 items 매개변수를 사용하여 특정 열을 기준으로 DataFrame 을 필터링할 수 있습니다.

#filter by column names
filtered_df = df.filter(items=["Name","Education"])

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

filter() 메서드를 사용하여 행 이름으로 필터링

filter() 메서드의 like 매개변수를 사용하여 특정 행을 기준으로 DataFrame 을 필터링할 수 있습니다.

#filter by row names
filtered_df = df.filter(like='Group_2', axis=0)

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

regex 매개변수를 사용하여 열 이름으로 필터링

filter() 메서드의 regex 매개변수를 사용하여 정규 표현식 (regular expression) 을 기반으로 특정 열을 기준으로 DataFrame 을 필터링할 수 있습니다.

#filter by column names with regex
filtered_df = df.filter(regex ='[g]')

#printing filtered DataFrame
print("---------Filtered DataFrame---------")
print(filtered_df)

요약

이 랩에서는 Pandas DataFrame 에서 filter() 메서드를 사용하는 방법을 배웠습니다. 열 이름과 행 이름을 기준으로 DataFrame 을 필터링하는 방법과 정규 표현식을 기반으로 필터링하는 방법을 다루었습니다. 이 메서드는 특정 인덱스 레이블을 기반으로 DataFrame 의 부분 집합을 만드는 데 유용합니다.