Введение
В этом практическом занятии мы узнаем о методе pivot_table() из библиотеки pandas для Python. Метод pivot_table() используется для агрегации и суммирования данных в DataFrame. Он возвращает сводную таблицу в стиле электронной таблицы в виде нового DataFrame.
Советы по работе с ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортируем необходимые библиотеки и создаем DataFrame
Сначала импортируем библиотеку pandas и создадим DataFrame с некоторыми примерами данных. Создадим DataFrame с колонками 'Date' (Дата), 'State' (Регион), 'Temperature' (Температура) и 'Humidity' (Влажность).
import pandas as pd
df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})
Агрегируем DataFrame с использованием метода pivot_table()
Для агрегации данных в DataFrame с использованием метода pivot_table() необходимо указать колонки, которые мы хотим использовать в качестве индексов, колонок и значения, которые мы хотим агрегировать.
pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')
Отображаем полученный DataFrame
Наконец, давайте отобразим полученную сводную таблицу в виде DataFrame.
print(pivot_df)
Резюме
Следуя этим шагам, мы смогли использовать метод pivot_table() из библиотеки pandas для агрегации и суммирования данных в DataFrame. Этот метод полезен для анализа и визуализации данных в табличном формате. Полученная сводная таблица в виде DataFrame предоставляет удобный способ просмотра агрегированных значений на основе различных индексов и колонок.