Метод nlargest() в DataFrame библиотеки Pandas | Анализ данных

Введение

В этом практическом занятии мы изучим метод nlargest() в DataFrame библиотеки Pandas. Этот метод позволяет получить первые N строк DataFrame на основе указанного столбца или столбцов, отсортированных по убыванию.

Советы по использованию ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Создать DataFrame

Начнем с создания примера DataFrame для работы. Мы будем использовать следующий код для создания DataFrame с колонками Name, Age, Height и Weight:

import pandas as pd

df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],
                   'Age':[20,25,30,18,25,20],
                   'Height':[155,160,175,145,155,165],
                   'Weight':[75,60,75,45,55,65]})

Этот код создает DataFrame с указанными колонками и данными.

Использовать метод nlargest()

Метод nlargest() позволяет получить первые N строк на основе указанного столбца. Синтаксис использования этого метода следующий:

df.nlargest(n, columns)

n - целое число, определяющее количество строк для возврата.
columns - метка или список меток, представляющих столбцы для сортировки.

Получить первые N строк

Используем метод nlargest(), чтобы получить первые 2 строки на основе столбца 'Height'. Будем использовать следующий код:

top_n_rows = df.nlargest(2, 'Height')
print(top_n_rows)

Этот код вернет новый DataFrame, состоящий из первых 2 строк, отсортированных по столбцу 'Height'.

Указать другой столбец

Мы также можем использовать метод nlargest(), чтобы получить первые N строк на основе другого столбца. Получим первые 3 строки на основе столбца 'Age', используя следующий код:

top_n_rows = df.nlargest(3, 'Age')
print(top_n_rows)

Этот код вернет новый DataFrame, состоящий из первых 3 строк, отсортированных по столбцу 'Age'.

Указать параметр keep

Мы можем указать параметр keep, чтобы приоритет был дан первому или последнему вхождению строк с дублирующимися значениями. По умолчанию параметр keep установлен на 'first'. Укажем keep='last', когда будем получать первые 2 строки на основе столбца 'Height':

top_n_rows = df.nlargest(2, 'Height', keep='last')
print(top_n_rows)

Этот код вернет новый DataFrame, состоящий из последних 2 строк с наибольшими значениями в столбце 'Height'.

Резюме

В этом практическом занятии мы узнали, как использовать метод nlargest() в DataFrame библиотеки Pandas. Мы можем использовать этот метод для получения первых N строк на основе одного или нескольких указанных столбцов, отсортированных по убыванию. Мы также можем указать параметр keep, чтобы приоритет был дан первому или последнему вхождению строк с дублирующимися значениями. Этот метод полезен для быстрого поиска наибольших или максимальных значений в DataFrame на основе конкретных критериев.

Метод nlargest в DataFrame библиотеки Pandas