Pandas DataFrame Nsmallest 方法

Beginner

介绍

Python Pandas 的 DataFrame.nsmallest() 方法用于获取按指定列升序排列的 DataFrame 的前 n 行。该方法返回指定列中值最小的前 n 行,并按升序排列。未指定的列也会返回,但不用于排序。

虚拟机提示

虚拟机启动完成后,点击左上角切换到 Notebook 标签页,以访问 Jupyter Notebook 进行练习。

有时,你可能需要等待几秒钟,直到 Jupyter Notebook 完成加载。由于 Jupyter Notebook 的限制,操作验证无法自动化。

如果你在学习过程中遇到问题,随时可以询问 Labby。请在实验结束后提供反馈,我们将及时为你解决问题。

导入 Pandas 库

首先,我们需要使用 import 语句导入 Pandas 库。

import pandas as pd

创建 DataFrame

接下来,我们需要创建一个 DataFrame 来进行操作。我们可以使用 pd.DataFrame() 函数从字典中创建一个 DataFrame。

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

使用 nsmallest() 方法

现在,我们可以在 DataFrame 上使用 nsmallest() 方法来获取指定列中值最小的前 n 行。

df.nsmallest(n, columns, keep='first')

该方法接受三个参数:

  • n:要返回的行数。
  • columns:指定用于排序的列名或列名列表。
  • keep:包括 'first''last''all',默认值为 'first'
    • 'first':在出现重复值时优先选择第一次出现的值。
    • 'last':在出现重复值时优先选择最后一次出现的值。
    • 'all':不丢弃任何重复值,即使这意味着选择超过 n 个项目。

显示结果

最后,我们可以打印结果 DataFrame,以查看指定列中值最小的前 n 行。

print(df.nsmallest(n, columns, keep='first'))

总结

Python Pandas 中的 DataFrame.nsmallest() 方法是一种便捷的方式,用于检索 DataFrame 中指定列值最小的前 n 行。通过使用此方法,我们可以轻松找到并显示符合我们条件的记录。