Метод boxplot() для DataFrame в Pandas

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом практическом занятии вы научитесь использовать метод boxplot() из библиотеки Pandas для создания диаграмм "ящик с усами" на основе столбцов DataFrame. Диаграмма "ящик с усами" (boxplot) — это графическое представление, которое показывает пять числовых характеристик набора данных: минимум, первый квартиль, медиану, третий квартиль и максимум.

Советы по работе с ВМ

После запуска виртуальной машины (VM) нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем необходимые библиотеки

Для начала вам нужно импортировать необходимые библиотеки. В данном случае вы будете использовать библиотеку Pandas.

import pandas as pd

Создаем DataFrame

Далее вы создадите DataFrame для работы. Это можно сделать, передав словарь или список списков в функцию pd.DataFrame(). Для примера создадим DataFrame с оценками студентов по разным предметам.

df = pd.DataFrame([
    ['Abhishek', 75, 80, 90],
    ['Anurag', 80, 90, 95],
    ['Bavya', 80, 82, 85],
    ['Bavana', 95, 92, 92],
    ['Chetan', 85, 90, 89]
], columns=['Name', 'Maths', 'Science', 'Social'])

Генерируем диаграмму "ящик с усами"

Теперь вы можете использовать метод boxplot() для генерации диаграммы "ящик с усами" по столбцам DataFrame. Это можно сделать, передав имена столбцов в виде списка в параметр column. Например, чтобы создать диаграмму "ящик с усами" для столбца 'Social':

boxplot = df.boxplot(column=['Social'])

Метод boxplot() возвращает объект Axes, который можно использовать для дальнейшего настройки графика, если необходимо.

Настраиваем диаграмму "ящик с усами"

Вы можете настроить внешний вид диаграммы "ящик с усами", используя различные параметры, доступные в методе boxplot(). Например, вы можете настроить размер шрифта меток делений с помощью параметра fontsize, повернуть метки с помощью параметра rot и отобразить или скрыть сетку с помощью параметра grid.

boxplot = df.boxplot(column=['Social'], fontsize=12, rot=45, grid=True)

Группируем данные и создаем несколько диаграмм "ящик с усами"

Если вы хотите сравнить данные по разным группам, вы можете использовать параметр by для группировки данных по определенному столбцу. Например, чтобы создать диаграмму "ящик с усами" для столбца 'Social', сгруппированного по столбцу 'DOB':

boxplot = df.boxplot(column=['Social'], by='DOB')

Это создаст отдельную диаграмму "ящик с усами" для каждого значения в столбце 'DOB'.

Резюме

В этом практическом занятии вы узнали, как использовать метод boxplot() из библиотеки Pandas для создания диаграмм "ящик с усами" по столбцам DataFrame. Вы узнали, как настраивать внешний вид диаграммы "ящик с усами" и как группировать данные для создания нескольких диаграмм "ящик с усами". Диаграммы "ящик с усами" - это полезный инструмент визуализации для понимания распределения и вариативности данных. Они предоставляют визуальное резюме, включающее информацию о медиане, квартилях и любых выбросах, присутствующих в наборе данных. Это может помочь в выявлении тенденций, паттернов и аномалий в данных.