Введение
В этом практическом занятии мы научимся оценивать и визуализировать дисперсию метрики Receiver Operating Characteristic (ROC) с использованием кросс-валидации в Python. ROC-кривые используются в бинарной классификации для оценки качества модели путём построения отношения истинно-положительных случаев (TPR) к ложно-положительным (FPR). Мы будем использовать библиотеку Scikit-learn для загрузки датасета iris, создания шумовых признаков и классификации датасета с использованием Support Vector Machine (SVM). Затем мы построим ROC-кривые с использованием кросс-валидации и вычислим среднюю площадь под кривой (AUC), чтобы увидеть изменчивость выхода классификатора при разбиении обучающего набора на разные подмножества.
Советы по использованию ВМ
После запуска ВМ перейдите в левый верхний угол и переключитесь на вкладку Notebook, чтобы приступить к практике в Jupyter Notebook.
Иногда может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.