介绍
在本实验中,我们将探索 Python Pandas 的 DataFrame.iterrows() 方法。该方法允许我们遍历 Pandas DataFrame 的行,返回每一行的索引和数据。
虚拟机提示
虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,随时可以向 Labby 提问。实验结束后请提供反馈,我们将及时为你解决问题。
创建一个 DataFrame
首先,我们需要创建一个 DataFrame 来进行操作。让我们使用 Pandas 库创建一个简单的 DataFrame。
#importing pandas as pd
import pandas as pd
#creating DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['id001', 'id002'])
使用 iterrows() 方法遍历行
要遍历 DataFrame 的行,我们可以使用 iterrows() 方法。该方法返回一个生成器对象,其中包含每行的索引和数据的元组。
#print the DataFrame
print("The DataFrame is:")
print(df)
#print the generator object
print("Iterate over rows:")
print(df.iterrows())
使用 for 循环访问行
要访问每行的索引和数据,我们可以使用 for 循环。行数据可以通过 row_data 变量访问,索引可以通过 row_index 变量访问。
#for loop to iterate over rows
print("Iterate over rows:")
for row_index, row_data in df.iterrows():
print("Index:", row_index)
print("Data:", row_data)
从行中访问特定数据
我们还可以通过指定索引号来访问行中的特定数据。让我们打印每行中 "Name" 列的值。
#for loop to access the "Name" column for each row
print("Accessing specific data:")
for row_index, row_data in df.iterrows():
print("Name:", row_data['Name'])
总结
在本实验中,我们学习了如何在 Pandas 中使用 iterrows() 方法来遍历 DataFrame 的行。我们探索了如何使用 for 循环访问每行的索引和数据,以及如何访问行中的特定数据。iterrows() 方法是分析和操作 DataFrame 中数据的有用工具。