掌握 Pandas DataFrame Itertuples 方法

介绍

在本实验中，我们将学习 Python Pandas 的 DataFrame.iteruples() 方法。Pandas 中的 iteruples() 方法用于遍历 DataFrame 的行，并将每一行作为命名元组返回。这是一个非常有用的方法，适用于遍历和处理 DataFrame 的行。

虚拟机使用提示

虚拟机启动完成后，点击左上角切换到 Notebook 选项卡，以访问 Jupyter Notebook 进行练习。

有时，你可能需要等待几秒钟，直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制，操作验证无法自动化。

如果你在学习过程中遇到问题，可以随时向 Labby 寻求帮助。实验结束后请提供反馈，我们将及时为你解决问题。

理解语法

iteruples() 方法的语法如下：

DataFrame.iteruples(index=True, name='Pandas')

index：这是一个布尔值，表示是否将索引作为元组的第一个元素包含在内。默认值为 True。
name：这是一个字符串值，表示返回的命名元组的名称。默认值为 "Pandas"。如果设置为 None，则返回常规元组而不是命名元组。

遍历 DataFrame 行

在这一步中，我们将创建一个 DataFrame 并使用 iteruples() 方法遍历其行。该方法返回一个 map 对象，可以在循环中使用，将每一行作为命名元组进行遍历。

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows
for row in df.iteruples():
    print(row)

控制索引和元组命名

在这一步中，我们将探讨如何控制返回元组的索引和命名。默认情况下，索引会作为元组的第一个元素包含在内，并且元组的名称为 "Pandas"。我们可以通过向 iteruples() 方法传递参数来修改这些设置。

## import pandas
import pandas as pd

## create DataFrame
df=pd.DataFrame({"Name":["Navya","Vindya"],"Age":[25,24],"Education":["M.Tech","Ph.d"]},index=['index_1', 'index_2'])

## iterate over DataFrame rows without index and custom name
for row in df.iteruples(index=False, name='Rows'):
    print(row)

总结

在本实验中，我们学习了 Pandas 的 DataFrame.iteruples() 方法，该方法对于遍历 DataFrame 的行并访问每行的值非常有用。我们了解了如何使用该方法、控制索引的包含以及自定义返回元组的命名。此方法在 Pandas DataFrame 的各种数据分析和操作任务中非常有用。