Введение
В этом практическом занятии мы изучим метод nlargest() в DataFrame библиотеки Pandas. Этот метод позволяет получить первые N строк DataFrame на основе указанного столбца или столбцов, отсортированных по убыванию.
Советы по использованию ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Создать DataFrame
Начнем с создания примера DataFrame для работы. Мы будем использовать следующий код для создания DataFrame с колонками Name, Age, Height и Weight:
import pandas as pd
df = pd.DataFrame({'Name':['Chetan','yashas','yuvraj','Pooja','Sindu','Renuka'],
'Age':[20,25,30,18,25,20],
'Height':[155,160,175,145,155,165],
'Weight':[75,60,75,45,55,65]})
Этот код создает DataFrame с указанными колонками и данными.
Использовать метод nlargest()
Метод nlargest() позволяет получить первые N строк на основе указанного столбца. Синтаксис использования этого метода следующий:
df.nlargest(n, columns)
n- целое число, определяющее количество строк для возврата.columns- метка или список меток, представляющих столбцы для сортировки.
Получить первые N строк
Используем метод nlargest(), чтобы получить первые 2 строки на основе столбца 'Height'. Будем использовать следующий код:
top_n_rows = df.nlargest(2, 'Height')
print(top_n_rows)
Этот код вернет новый DataFrame, состоящий из первых 2 строк, отсортированных по столбцу 'Height'.
Указать другой столбец
Мы также можем использовать метод nlargest(), чтобы получить первые N строк на основе другого столбца. Получим первые 3 строки на основе столбца 'Age', используя следующий код:
top_n_rows = df.nlargest(3, 'Age')
print(top_n_rows)
Этот код вернет новый DataFrame, состоящий из первых 3 строк, отсортированных по столбцу 'Age'.
Указать параметр keep
Мы можем указать параметр keep, чтобы приоритет был дан первому или последнему вхождению строк с дублирующимися значениями. По умолчанию параметр keep установлен на 'first'. Укажем keep='last', когда будем получать первые 2 строки на основе столбца 'Height':
top_n_rows = df.nlargest(2, 'Height', keep='last')
print(top_n_rows)
Этот код вернет новый DataFrame, состоящий из последних 2 строк с наибольшими значениями в столбце 'Height'.
Резюме
В этом практическом занятии мы узнали, как использовать метод nlargest() в DataFrame библиотеки Pandas. Мы можем использовать этот метод для получения первых N строк на основе одного или нескольких указанных столбцов, отсортированных по убыванию. Мы также можем указать параметр keep, чтобы приоритет был дан первому или последнему вхождению строк с дублирующимися значениями. Этот метод полезен для быстрого поиска наибольших или максимальных значений в DataFrame на основе конкретных критериев.