Pandas DataFrame 透视表方法

PythonPythonBeginner
立即练习

💡 本教程由 AI 辅助翻译自英文原版。如需查看原文,您可以 切换至英文原版

简介

在本实验中,我们将学习 Python pandas 库中的 pivot_table() 方法。pivot_table() 方法用于对 DataFrame 中的数据进行聚合和汇总。它返回一个类似电子表格的透视表作为新的 DataFrame。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以向 Labby 寻求帮助。实验结束后请提供反馈,我们将及时为你解决问题。


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL python(("Python")) -.-> python/ModulesandPackagesGroup(["Modules and Packages"]) pandas(("Pandas")) -.-> pandas/DataAnalysisGroup(["Data Analysis"]) python(("Python")) -.-> python/PythonStandardLibraryGroup(["Python Standard Library"]) python(("Python")) -.-> python/DataScienceandMachineLearningGroup(["Data Science and Machine Learning"]) pandas(("Pandas")) -.-> pandas/ReadingDataGroup(["Reading Data"]) pandas/ReadingDataGroup -.-> pandas/read_csv("Read CSV") python/ModulesandPackagesGroup -.-> python/importing_modules("Importing Modules") pandas/DataAnalysisGroup -.-> pandas/data_aggregation("Data Aggregation") pandas/DataAnalysisGroup -.-> pandas/pivot_tables("Pivot Tables") python/PythonStandardLibraryGroup -.-> python/data_collections("Data Collections") python/DataScienceandMachineLearningGroup -.-> python/data_analysis("Data Analysis") subgraph Lab Skills pandas/read_csv -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} python/importing_modules -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} pandas/data_aggregation -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} pandas/pivot_tables -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} python/data_collections -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} python/data_analysis -.-> lab-68694{{"Pandas DataFrame 透视表方法"}} end

导入所需的库并创建 DataFrame

首先,让我们导入 pandas 库并创建包含一些示例数据的 DataFrame。我们将创建一个包含 'Date'、'State'、'Temperature' 和 'Humidity' 列的 DataFrame。

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

使用 pivot_table() 方法聚合 DataFrame

要使用 pivot_table() 方法聚合 DataFrame 中的数据,我们需要指定要用作索引、列以及要聚合的值的列。

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

显示生成的 DataFrame

最后,让我们显示生成的透视表 DataFrame。

print(pivot_df)

总结

通过以上步骤,我们能够使用 pandas 库中的 pivot_table() 方法对 DataFrame 中的数据进行聚合和汇总。这种方法对于以表格形式分析和可视化数据非常有用。生成的透视表 DataFrame 提供了一种便捷的方式,可以基于不同的索引和列查看聚合后的值。