Построение поверхностей принятия решений с использованием методов ансамбля

Введение

В этом практическом занятии показано, как построить поверхности принятия решений лесов случайных деревьев на наборе данных iris с использованием библиотеки scikit-learn для Python. Набор данных iris - это часто используемый набор данных для задач классификации. В этом практическом занятии мы сравним поверхности принятия решений, изученные классификатором дерева решений, случайным лесом, классификатором "экстра-деревьев" и классификатором AdaBoost.

Советы по использованию ВМ

После запуска ВМ кликните в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импорт библиотек

В этом шаге мы импортируем необходимые библиотеки для построения поверхностей принятия решений на наборе данных iris.

import numpy as np
import matplotlib.pyplot as plt
from matplotlib.colors import ListedColormap

from sklearn.datasets import load_iris
from sklearn.ensemble import (
    RandomForestClassifier,
    ExtraTreesClassifier,
    AdaBoostClassifier,
)
from sklearn.tree import DecisionTreeClassifier

Определение параметров

В этом шаге мы определим параметры, необходимые для построения поверхностей принятия решений на наборе данных iris.

## Parameters
n_classes = 3
n_estimators = 30
cmap = plt.cm.RdYlBu
plot_step = 0.02  ## fine step width for decision surface contours
plot_step_coarser = 0.5  ## step widths for coarse classifier guesses
RANDOM_SEED = 13  ## fix the seed on each iteration

Загрузка данных

В этом шаге мы загрузим набор данных iris.

## Load data
iris = load_iris()

Определение моделей

В этом шаге мы определим модели, которые будут использоваться для построения поверхностей принятия решений на наборе данных iris.

models = [
    DecisionTreeClassifier(max_depth=None),
    RandomForestClassifier(n_estimators=n_estimators),
    ExtraTreesClassifier(n_estimators=n_estimators),
    AdaBoostClassifier(DecisionTreeClassifier(max_depth=3), n_estimators=n_estimators),
]