Pandas DataFrame Iterrows 方法：掌握行遍历技巧

介绍

在本实验中，我们将探索 Python Pandas 的 DataFrame.iterrows() 方法。该方法允许我们遍历 Pandas DataFrame 的行，返回每一行的索引和数据。

虚拟机提示

虚拟机启动完成后，点击左上角切换到 Notebook 标签页，以访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果你在学习过程中遇到问题，随时可以向 Labby 提问。实验结束后请提供反馈，我们将及时为你解决问题。

创建一个 DataFrame

首先，我们需要创建一个 DataFrame 来进行操作。让我们使用 Pandas 库创建一个简单的 DataFrame。

#importing pandas as pd
import pandas as pd

#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])

使用 iterrows() 方法遍历行

要遍历 DataFrame 的行，我们可以使用 iterrows() 方法。该方法返回一个生成器对象，其中包含每行的索引和数据的元组。

#print the DataFrame
print("The DataFrame is:")
print(df)

#print the generator object
print("Iterate over rows:")
print(df.iterrows())

使用 for 循环访问行

要访问每行的索引和数据，我们可以使用 for 循环。行数据可以通过 row_data 变量访问，索引可以通过 row_index 变量访问。

#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
    print("Index:", row_index)
    print("Data:", row_data)

从行中访问特定数据

我们还可以通过指定索引号来访问行中的特定数据。让我们打印每行中 "Name" 列的值。

#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
    print("Name:", row_data['Name'])

总结

在本实验中，我们学习了如何在 Pandas 中使用 iterrows() 方法来遍历 DataFrame 的行。我们探索了如何使用 for 循环访问每行的索引和数据，以及如何访问行中的特定数据。iterrows() 方法是分析和操作 DataFrame 中数据的有用工具。