Метод groupby() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии мы научимся использовать метод groupby() из библиотеки Pandas в Python. Метод groupby() позволяет разбить DataFrame на группы и выполнять вычисления или статистические анализы для каждой группы. Это мощный инструмент для анализа и обработки данных.

Советы по использованию ВМ

После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки и создаем DataFrame

Сначала нам нужно импортировать библиотеку Pandas и создать объект DataFrame. Вот пример:

import pandas as pd

data = {'Name': ['Avinash', 'Amrutha', 'Chetana', 'Kartik','Nikhil'],
        'Percentage': [72, 98, 81, 87,85],
        'Course': ['Arts','B.Com','M.Tech','B.SC','BE']}

df = pd.DataFrame(data)

Группировка DataFrame по одному столбцу

Для группировки DataFrame по одному столбцу используйте метод groupby() и укажите имя столбца в качестве аргумента. Вот пример:

grp = df.groupby('Course')

Доступ к группам

Для доступа к группам в сгруппированном DataFrame используйте атрибут groups. Он возвращает словарь, где ключи — имена групп, а значения — соответствующие индексы строк в каждой группе. Вот пример:

print(grp.groups)

Группировка DataFrame по нескольким столбцам

Для группировки DataFrame по нескольким столбцам передайте список имен столбцов в метод groupby(). Вот пример:

grp = df.groupby(['Course', 'Name'])

Выбор одной группы

Для выбора одной группы из сгруппированного DataFrame используйте метод get_group() и укажите имя группы в качестве аргумента. Вот пример:

print(grp.get_group(('Arts', 'Avinash')))

Выполнение агрегирующих операций

После того, как у вас есть сгруппированный DataFrame, вы можете выполнять агрегирующие операции над сгруппированными данными. Например, вы можете вычислить среднее значение числового столбца для каждой группы. Вот пример:

print(grp['Percentage'].mean())

Резюме

В этом практическом занятии мы узнали, как использовать метод groupby() в библиотеке Pandas для группировки DataFrame по одному или более столбцам. Мы также узнали, как получить доступ к группам, выбрать одну группу и выполнять агрегирующие операции над сгруппированными данными. Метод groupby() — это мощный инструмент для анализа и обработки данных, позволяющий получать представление о наших данных, анализируя их по группам.