Pandas DataFrame の iterrows メソッド

Beginner

はじめに

この実験では、Python Pandas のDataFrame.iterrows()メソッドを調べます。このメソッドを使うと、Pandas DataFrame の行を 1 行ずつ反復処理して、各行のインデックスとデータを返すことができます。

VM のヒント

VM の起動が完了したら、画面の左上隅をクリックしてノートブックタブに切り替え、Jupyter Notebook を使って練習しましょう。

Jupyter Notebook が読み込み完了するまで数秒待つことがあります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。

学習中に問題があった場合は、Labby にお問い合わせください。セッション終了後にフィードバックを提供してください。すぐに問題を解決いたします。

DataFrame を作成する

まず、操作対象の DataFrame を作成する必要があります。Pandas ライブラリを使って簡単な DataFrame を作成しましょう。

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

iterrows() メソッドを使って行を反復処理する

DataFrame の行を反復処理するには、iterrows() メソッドを使うことができます。このメソッドは、各行のインデックスとデータのタプルを含むジェネレータオブジェクトを返します。

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

for ループを使って行にアクセスする

各行のインデックスとデータにアクセスするには、for ループを使うことができます。行データは row_data 変数を使ってアクセスし、インデックスは row_index 変数を使ってアクセスできます。

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

行から特定のデータにアクセスする

インデックス番号を指定することで、行から特定のデータにもアクセスできます。各行の「Name」列の値を表示しましょう。

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

まとめ

この実験では、Pandas のiterrows()メソッドを使って DataFrame の行を反復処理する方法を学びました。for ループを使って各行のインデックスとデータにアクセスする方法、および行から特定のデータにアクセスする方法を検討しました。iterrows()メソッドは、DataFrame 内のデータを分析および操作するための便利なツールです。