Pandas DataFrame Itertuples 方法

PandasPandasBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

介绍

在本实验中,我们将学习 Python Pandas 的 DataFrame.iteruples() 方法。Pandas 中的 iteruples() 方法用于遍历 DataFrame 的行,并将每一行作为命名元组返回。这是一个非常有用的方法,适用于遍历和处理 DataFrame 的行。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 选项卡,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,可以随时向 Labby 寻求帮助。实验结束后请提供反馈,我们将及时为你解决问题。

理解语法

iteruples() 方法的语法如下:

DataFrame.iteruples(index=True, name='Pandas')
  • index:这是一个布尔值,表示是否将索引作为元组的第一个元素包含在内。默认值为 True
  • name:这是一个字符串值,表示返回的命名元组的名称。默认值为 "Pandas"。如果设置为 None,则返回常规元组而不是命名元组。

遍历 DataFrame 行

在这一步中,我们将创建一个 DataFrame 并使用 iteruples() 方法遍历其行。该方法返回一个 map 对象,可以在循环中使用,将每一行作为命名元组进行遍历。

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

控制索引和元组命名

在这一步中,我们将探讨如何控制返回元组的索引和命名。默认情况下,索引会作为元组的第一个元素包含在内,并且元组的名称为 "Pandas"。我们可以通过向 iteruples() 方法传递参数来修改这些设置。

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

总结

在本实验中,我们学习了 Pandas 的 DataFrame.iteruples() 方法,该方法对于遍历 DataFrame 的行并访问每行的值非常有用。我们了解了如何使用该方法、控制索引的包含以及自定义返回元组的命名。此方法在 Pandas DataFrame 的各种数据分析和操作任务中非常有用。