はじめに
この実験では、Python Pandas の DataFrame.iteruples() メソッドについて学びます。Pandas の iteruples() メソッドは、DataFrame の行を反復処理し、各行を名前付きタプルとして返します。DataFrame の行を反復処理して操作する際に便利なメソッドです。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使って練習しましょう。
Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題がある場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
構文を理解する
iteruples() メソッドの構文は以下の通りです。
DataFrame.iteruples(index=True, name='Pandas')
index:タプルの最初の要素としてインデックスを含めるかどうかを示すブール値です。既定値はTrueです。name:返される名前付きタプルの名前を表す文字列値です。既定値は "Pandas" です。Noneに設定すると、名前付きタプルの代わりに通常のタプルが返されます。
DataFrame の行を反復処理する
このステップでは、DataFrame を作成し、iteruples() メソッドを使ってその行を反復処理します。このメソッドはマップオブジェクトを返し、これをループで使って各行を名前付きタプルとして反復処理できます。
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows
for row in df.iteruples():
print(row)
インデックスとタプルの名前付けを制御する
このステップでは、返されるタプルのインデックスと名前付けをどのように制御するかを調べます。既定では、インデックスはタプルの最初の要素として含まれ、タプルは "Pandas" と名付けられます。iteruples() メソッドに引数を渡すことで、これらの設定を変更できます。
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
print(row)
まとめ
この実験では、Pandas の DataFrame.iteruples() メソッドについて学びました。このメソッドは、DataFrame の行を反復処理して各行の値にアクセスする際に便利です。このメソッドの使い方、インデックスの含め方の制御、および返されるタプルの名前付けのカスタマイズ方法を見ました。このメソッドは、Pandas DataFrame を使ったさまざまなデータ分析および操作タスクに役立ちます。