介绍
在本实验中,我们将学习 Python Pandas 的 DataFrame.iteruples() 方法。Pandas 中的 iteruples() 方法用于遍历 DataFrame 的行,并将每一行作为命名元组返回。这是一个非常有用的方法,适用于遍历和处理 DataFrame 的行。
虚拟机使用提示
虚拟机启动完成后,点击左上角切换到 Notebook 选项卡,以访问 Jupyter Notebook 进行练习。
有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。
如果你在学习过程中遇到问题,可以随时向 Labby 寻求帮助。实验结束后请提供反馈,我们将及时为你解决问题。
理解语法
iteruples() 方法的语法如下:
DataFrame.iteruples(index=True, name='Pandas')
index:这是一个布尔值,表示是否将索引作为元组的第一个元素包含在内。默认值为True。name:这是一个字符串值,表示返回的命名元组的名称。默认值为 "Pandas"。如果设置为None,则返回常规元组而不是命名元组。
遍历 DataFrame 行
在这一步中,我们将创建一个 DataFrame 并使用 iteruples() 方法遍历其行。该方法返回一个 map 对象,可以在循环中使用,将每一行作为命名元组进行遍历。
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows
for row in df.iteruples():
print(row)
控制索引和元组命名
在这一步中,我们将探讨如何控制返回元组的索引和命名。默认情况下,索引会作为元组的第一个元素包含在内,并且元组的名称为 "Pandas"。我们可以通过向 iteruples() 方法传递参数来修改这些设置。
## import pandas
import pandas as pd
## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])
## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
print(row)
总结
在本实验中,我们学习了 Pandas 的 DataFrame.iteruples() 方法,该方法对于遍历 DataFrame 的行并访问每行的值非常有用。我们了解了如何使用该方法、控制索引的包含以及自定义返回元组的命名。此方法在 Pandas DataFrame 的各种数据分析和操作任务中非常有用。