Метод сводной таблицы в DataFrame библиотеки Pandas

Beginner

Введение

В этом практическом занятии мы узнаем о методе pivot_table() из библиотеки pandas для Python. Метод pivot_table() используется для агрегации и суммирования данных в DataFrame. Он возвращает сводную таблицу в стиле электронной таблицы в виде нового DataFrame.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки и создаем DataFrame

Сначала импортируем библиотеку pandas и создадим DataFrame с некоторыми примерами данных. Создадим DataFrame с колонками 'Date' (Дата), 'State' (Регион), 'Temperature' (Температура) и 'Humidity' (Влажность).

import pandas as pd

df = pd.DataFrame({'Date': ['1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021', '1/1/2021', '1/1/2021', '2/1/2021', '2/1/2021'],
                   'State': ['Karnataka', 'Karnataka', 'Karnataka', 'Karnataka', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu', 'Tamilnadu'],
                   'Temperature': [25, 29, 28, 31, 26, 27, 22, 32],
                   'Humidity': [46, 50, 52, 59, 42, 45, 46, 43]})

Агрегируем DataFrame с использованием метода pivot_table()

Для агрегации данных в DataFrame с использованием метода pivot_table() необходимо указать колонки, которые мы хотим использовать в качестве индексов, колонок и значения, которые мы хотим агрегировать.

pivot_df = df.pivot_table(index='Date', columns='State', aggfunc='mean')

Отображаем полученный DataFrame

Наконец, давайте отобразим полученную сводную таблицу в виде DataFrame.

print(pivot_df)

Резюме

Следуя этим шагам, мы смогли использовать метод pivot_table() из библиотеки pandas для агрегации и суммирования данных в DataFrame. Этот метод полезен для анализа и визуализации данных в табличном формате. Полученная сводная таблица в виде DataFrame предоставляет удобный способ просмотра агрегированных значений на основе различных индексов и колонок.