Введение
В этом практическом занятии показано, как использовать классификаторную цепочку на мультиметкированном наборе данных. Алгоритм классификаторной цепи представляет собой модификацию метода преобразования проблемы для мультиметкированной классификации. Этот метод использует корреляцию между классами, строя цепочку бинарных классификаторов. Каждая модель получает предсказания предыдущих моделей в цепи в качестве признаков. Мы будем использовать набор данных yeast
, в котором содержится 2417 точек данных, каждая из которых имеет 103 признака и 14 возможных меток. Каждая точка данных имеет по крайней мере одну метку. В качестве базовой линии мы сначала обучаем логистическую регрессию для каждой из 14 меток. Чтобы оценить производительность этих классификаторов, мы делаем предсказания на отложенной тестовой выборке и вычисляем показатель Джаккара для каждой выборки.
Советы по использованию ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.