Метод nsmallest для DataFrame в Pandas

Введение

Метод DataFrame.nsmallest() библиотеки Python Pandas используется для получения первых n строк DataFrame, отсортированных по столбцам в порядке возрастания. Этот метод возвращает первые n строк с наименьшими значениями в указанных столбцах, в порядке возрастания. Столбцы, которые не указаны, также возвращаются, но не используются для сортировки.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку Pandas

Во - первых, нам нужно импортировать библиотеку Pandas с помощью инструкции import.

import pandas as pd

Создаем DataFrame

Далее, нам нужно создать DataFrame, с которым будем работать. Мы можем использовать функцию pd.DataFrame() для создания DataFrame из словаря.

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],'Age':  [20,25,30,18,25,20],'Height': [155,160,175,145,155,165],'Weight': [75,60,75,45,55,65]})

Используем метод nsmallest()

Теперь мы можем использовать метод nsmallest() для DataFrame, чтобы получить первые n строк с наименьшими значениями в указанных столбцах.

df.nsmallest(n, columns, keep='first')

Метод принимает три параметра:

n: Количество строк для возврата.
columns: Метка или список меток, которые определяют имя столбцов для сортировки.
keep: Включает 'first', 'last', 'all', по умолчанию 'first'.
- 'first':优先考虑重复值中的首次出现。
- 'last':优先考虑重复值中的最后一次出现。
- 'all':不删除任何重复项，即使这意味着选择超过n个项目。

Отображаем результаты

Наконец, мы можем распечатать результирующий DataFrame, чтобы увидеть первые n строк с наименьшими значениями в указанных столбцах.

print(df.nsmallest(n, columns, keep='first'))

Резюме

Метод DataFrame.nsmallest() в Python Pandas представляет собой удобный способ получить первые n строк с наименьшими значениями в указанных столбцах DataFrame. Используя этот метод, мы можем легко найти и отобразить записи, соответствующие нашим критериям.