Введение
В этом практическом занятии вы научитесь использовать метод boxplot() из библиотеки Pandas для создания диаграмм "ящик с усами" на основе столбцов DataFrame. Диаграмма "ящик с усами" (boxplot) — это графическое представление, которое показывает пять числовых характеристик набора данных: минимум, первый квартиль, медиану, третий квартиль и максимум.
Советы по работе с ВМ
После запуска виртуальной машины (VM) нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать необходимые библиотеки
Для начала вам нужно импортировать необходимые библиотеки. В данном случае вы будете использовать библиотеку Pandas.
import pandas as pd
Создать DataFrame
Далее вы создадите DataFrame для работы. Это можно сделать, передав словарь или список списков в функцию pd.DataFrame(). Для примера создадим DataFrame с оценками студентов по разным предметам.
df = pd.DataFrame([
['Abhishek', 75, 80, 90],
['Anurag', 80, 90, 95],
['Bavya', 80, 82, 85],
['Bavana', 95, 92, 92],
['Chetan', 85, 90, 89]
], columns=['Name', 'Maths', 'Science', 'Social'])
Сгенерировать диаграмму 'ящик с усами'
Теперь вы можете использовать метод boxplot() для генерации диаграммы "ящик с усами" по столбцам DataFrame. Это можно сделать, передав имена столбцов в виде списка в параметр column. Например, чтобы создать диаграмму "ящик с усами" для столбца 'Social':
boxplot = df.boxplot(column=['Social'])
Метод boxplot() возвращает объект Axes, который можно использовать для дальнейшего настройки графика, если необходимо.
Настроить диаграмму 'ящик с усами'
Вы можете настроить внешний вид диаграммы "ящик с усами", используя различные параметры, доступные в методе boxplot(). Например, вы можете настроить размер шрифта меток делений с помощью параметра fontsize, повернуть метки с помощью параметра rot и отобразить или скрыть сетку с помощью параметра grid.
boxplot = df.boxplot(column=['Social'], fontsize=12, rot=45, grid=True)
Группировать данные и создать несколько диаграмм 'ящик с усами'
Если вы хотите сравнить данные по разным группам, вы можете использовать параметр by для группировки данных по определенному столбцу. Например, чтобы создать диаграмму "ящик с усами" для столбца 'Social', сгруппированного по столбцу 'DOB':
boxplot = df.boxplot(column=['Social'], by='DOB')
Это создаст отдельную диаграмму "ящик с усами" для каждого значения в столбце 'DOB'.
Резюме
В этом практическом занятии вы узнали, как использовать метод boxplot() из библиотеки Pandas для создания диаграмм "ящик с усами" по столбцам DataFrame. Вы узнали, как настраивать внешний вид диаграммы "ящик с усами" и как группировать данные для создания нескольких диаграмм "ящик с усами". Диаграммы "ящик с усами" - это полезный инструмент визуализации для понимания распределения и вариативности данных. Они предоставляют визуальное резюме, включающее информацию о медиане, квартилях и любых выбросах, присутствующих в наборе данных. Это может помочь в выявлении тенденций, паттернов и аномалий в данных.