Pandas DataFrame Agg 方法

Beginner

介绍

在本实验中,你将学习如何在 pandas 库中使用 agg() 方法对 DataFrame 中的数据进行聚合。该方法允许你在指定的轴(如行或列)上执行一个或多个操作,并根据选择的函数返回标量、Series 或 DataFrame。

虚拟机使用提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以向 Labby 寻求帮助。请在实验结束后提供反馈,我们将及时为你解决问题。

导入 pandas 库

首先,你需要使用 import 语句导入 pandas 库:

import pandas as pd

创建一个 DataFrame

接下来,创建一个 DataFrame 对象以便进行操作。你可以使用 pd.DataFrame() 函数从列表或数组中创建 DataFrame。以下是一个示例:

df = pd.DataFrame([[1, 2, 3], [4, 5, 6], [7, 8, 9]], columns=['A', 'B', 'C'])

对行使用单一函数聚合 DataFrame

要对 DataFrame 使用单一函数进行聚合,可以使用 agg() 方法。通过指定字符串函数名称或函数对象来定义要应用于行的函数。以下是一个示例:

print("Printing the sum of values in DataFrame")
print(df.agg(["sum"]))

对列使用单一函数聚合 DataFrame

要对 DataFrame 使用单一函数对列进行聚合,将 axis 参数设置为 'columns'。这将使函数应用于每一列而不是每一行。以下是一个示例:

print("Printing the minimum value in DataFrame")
print(df.agg(["min"], axis='columns'))

对行和列使用函数列表聚合 DataFrame

你也可以使用函数列表对 DataFrame 进行聚合。这允许你对行或列执行多个操作。以下是一个示例:

print("Printing sum and min of the DataFrame with default axis")
print(df.agg(["sum", "min"]))

对列使用不同函数聚合 DataFrame

为了更灵活地操作,你可以将列名和对应函数的字典传递给 agg() 方法。这允许你对不同的列应用不同的函数。以下是一个示例:

print("Printing different aggregation functions over the columns")
print(df.agg({'A': ["sum"], 'B': ["min", "max"], 'C': ["count"]}))

总结

在本实验中,你学习了如何在 pandas 中使用 agg() 方法对 DataFrame 中的数据进行聚合。你现在已经掌握了如何对 DataFrame 的行和列应用单一或多个函数。此方法对于在数据上执行各种聚合操作非常有用。尝试使用不同的函数和轴来分析和总结你的 DataFrame。祝你分析愉快!