Введение
В этом практическом занятии мы сравним производительность различных категориальных энкодеров на наборе данных с оценками вин. В качестве целевой переменной для прогнозирования мы будем использовать столбец 'points'. Мы сравним следующие энкодеры: TargetEncoder, OneHotEncoder, OrdinalEncoder и удаление категории. Также рассмотрим, как использовать встроенную поддержку категориальных признаков в HistGradientBoostingRegressor
.
Советы по работе с ВМ
После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.