Pandas DataFrame iterrows 메서드

Beginner

소개

이 랩에서는 Python Pandas 의 DataFrame.iterrows() 메서드를 살펴봅니다. 이 메서드는 Pandas DataFrame 의 행을 반복하여 각 행의 인덱스와 데이터를 반환합니다.

VM 팁

VM 시작이 완료되면, 왼쪽 상단 모서리를 클릭하여 Notebook 탭으로 전환하여 실습을 위한 Jupyter Notebook에 접근하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 즉시 문제를 해결해 드리겠습니다.

DataFrame 생성

먼저, 작업할 DataFrame 을 생성해야 합니다. Pandas 라이브러리를 사용하여 간단한 DataFrame 을 만들어 보겠습니다.

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

iterrows() 메서드를 사용하여 행 반복

DataFrame 의 행을 반복하려면 iterrows() 메서드를 사용할 수 있습니다. 이 메서드는 각 행의 인덱스와 데이터의 튜플을 포함하는 제너레이터 객체를 반환합니다.

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

for 루프를 사용하여 행에 접근

각 행의 인덱스와 데이터에 접근하기 위해 for 루프를 사용할 수 있습니다. 행 데이터는 row_data 변수를 사용하여 접근할 수 있으며, 인덱스는 row_index 변수를 사용하여 접근할 수 있습니다.

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

행에서 특정 데이터 접근

인덱스 번호를 지정하여 행에서 특정 데이터에 접근할 수도 있습니다. 각 행의 "Name" 열의 값을 출력해 보겠습니다.

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

요약

이 랩에서는 Pandas 의 iterrows() 메서드를 사용하여 DataFrame 의 행을 반복하는 방법을 배웠습니다. for 루프를 사용하여 각 행의 인덱스와 데이터에 접근하는 방법과 행에서 특정 데이터에 접근하는 방법을 살펴보았습니다. iterrows() 메서드는 DataFrame 에서 데이터를 분석하고 조작하는 데 유용한 도구입니다.