Pandas DataFrame 的 items() 方法

Beginner

介绍

在本实验中,我们将学习如何使用 Pandas 库中的 items() 方法来遍历 DataFrame 的列。该方法返回一个生成器对象,其中包含列名及其对应的 Series 的元组。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以向 Labby 提问。实验结束后请提供反馈,我们将及时为你解决问题。

导入必要的库

首先,我们需要导入 pandas 库:

import pandas as pd

创建一个 DataFrame

接下来,让我们用一些示例数据创建一个 DataFrame:

df = pd.DataFrame({
    "Name": ["Navya", "Vindya"],
    "Age": [25, 24],
    "Education": ["M.Tech", "Ph.d"]
}, index=['id001', 'id002'])

遍历列名

要遍历 DataFrame 的列名,我们可以使用 items() 方法。该方法返回一个生成器对象。我们可以打印它或使用 for 循环遍历它:

print("Iterating over column names using items():")

for column_name, data in df.items():
    print('Column Name:', column_name)

遍历列值

要访问每列的值,我们可以结合使用 items() 方法和 for 循环。每次迭代将返回一个包含列名和对应 Series 的元组:

print("Iterating over column values using items():")

for column_name, data in df.items():
    print('Column Name:', column_name)
    print('Data:', data)

遍历特定行

要遍历特定行,我们可以使用索引号并通过 Series 对象访问该行:

print("Iterating over a specific row using items():")

for column_name, data in df.items():
    print('Column Name:', column_name)
    print('Data:', data[0])  ## 访问 Series 的第一个元素

遍历特定列

要遍历特定列,我们可以使用列名作为数据对象的索引:

print("Iterating over a specific column using items():")

for column_name, data in df.items():
    print('Column Name:', column_name)
    print('Data:', data['id001'])  ## 访问 'id001' 索引处的值

总结

在本实验中,我们学习了如何使用 Pandas 库中的 items() 方法来遍历 DataFrame 的列。我们了解了如何遍历列名、列值、特定行和特定列。items() 方法为探索和操作 DataFrame 中的数据提供了一种便捷的方式。