Введение
В этом практическом занятии мы научимся использовать метод groupby() из библиотеки Pandas в Python. Метод groupby() позволяет разбить DataFrame на группы и выполнять вычисления или статистические анализы для каждой группы. Это мощный инструмент для анализа и обработки данных.
Советы по использованию ВМ
После запуска виртуальной машины кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать необходимые библиотеки и создать DataFrame
Сначала нам нужно импортировать библиотеку Pandas и создать объект DataFrame. Вот пример:
import pandas as pd
data = {'Name': ['Avinash', 'Amrutha', 'Chetana', 'Kartik','Nikhil'],
'Percentage': [72, 98, 81, 87,85],
'Course': ['Arts','B.Com','M.Tech','B.SC','BE']}
df = pd.DataFrame(data)
Группировать DataFrame по одному столбцу
Для группировки DataFrame по одному столбцу используйте метод groupby() и укажите имя столбца в качестве аргумента. Вот пример:
grp = df.groupby('Course')
Получить доступ к группам
Для доступа к группам в сгруппированном DataFrame используйте атрибут groups. Он возвращает словарь, где ключи — имена групп, а значения — соответствующие индексы строк в каждой группе. Вот пример:
print(grp.groups)
Группировать DataFrame по нескольким столбцам
Для группировки DataFrame по нескольким столбцам передайте список имен столбцов в метод groupby(). Вот пример:
grp = df.groupby(['Course', 'Name'])
Выбрать одну группу
Для выбора одной группы из сгруппированного DataFrame используйте метод get_group() и укажите имя группы в качестве аргумента. Вот пример:
print(grp.get_group(('Arts', 'Avinash')))
Выполнить операции агрегации
После того, как у вас есть сгруппированный DataFrame, вы можете выполнять агрегирующие операции над сгруппированными данными. Например, вы можете вычислить среднее значение числового столбца для каждой группы. Вот пример:
print(grp['Percentage'].mean())
Резюме
В этом практическом занятии мы узнали, как использовать метод groupby() в библиотеке Pandas для группировки DataFrame по одному или более столбцам. Мы также узнали, как получить доступ к группам, выбрать одну группу и выполнять агрегирующие операции над сгруппированными данными. Метод groupby() — это мощный инструмент для анализа и обработки данных, позволяющий получать представление о наших данных, анализируя их по группам.