Pandas DataFrame iteruples 메서드

Beginner

소개

이 랩에서는 Python Pandas 의 DataFrame.iteruples() 메서드에 대해 배우겠습니다. Pandas 의 iteruples() 메서드는 DataFrame 의 행을 반복하며 각 행을 명명된 튜플 (named tuple) 로 반환합니다. DataFrame 의 행을 반복하고 작업하는 데 유용한 메서드입니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한 사항으로 인해 작업의 유효성 검사는 자동화할 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

구문 이해

iteruples() 메서드의 구문은 다음과 같습니다.

DataFrame.iteruples(index=True, name='Pandas')
  • index: 튜플의 첫 번째 요소로 인덱스를 포함할지 여부를 나타내는 부울 값입니다. 기본값은 True입니다.
  • name: 반환된 명명된 튜플 (named tuples) 의 이름을 나타내는 문자열 값입니다. 기본값은 "Pandas"입니다. None으로 설정하면 명명된 튜플 대신 일반 튜플이 반환됩니다.

DataFrame 행 반복 처리

이 단계에서는 DataFrame 을 생성하고 iteruples() 메서드를 사용하여 행을 반복합니다. 이 메서드는 맵 객체 (map object) 를 반환하며, 이를 루프에서 사용하여 각 행을 명명된 튜플 (named tuple) 로 반복할 수 있습니다.

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

인덱스 및 튜플 이름 관리

이 단계에서는 반환된 튜플의 인덱스 및 이름을 제어하는 방법을 살펴보겠습니다. 기본적으로 인덱스는 튜플의 첫 번째 요소로 포함되며, 튜플의 이름은 "Pandas"입니다. iteruples() 메서드에 인수를 전달하여 이러한 설정을 수정할 수 있습니다.

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

요약

이 랩에서는 Pandas 의 DataFrame.iteruples() 메서드에 대해 배웠습니다. 이 메서드는 DataFrame 의 행을 반복하고 각 행의 값에 접근하는 데 유용합니다. 메서드를 사용하는 방법, 인덱스 포함을 제어하는 방법, 반환된 튜플의 이름을 사용자 정의하는 방법을 살펴보았습니다. 이 메서드는 Pandas DataFrame 을 사용한 다양한 데이터 분석 및 조작 작업에 도움이 될 수 있습니다.