Введение
В этом практическом занятии мы покажем, как с помощью алгоритма RANSAC в scikit-learn надежно подобрать линейную модель для ошибочных данных. Обычный линейный регрессор чувствителен к выбросам, и нарисованная прямая может легко отклониться от истинной взаимосвязи данных. Регурессор RANSAC автоматически разделяет данные на точки, принадлежащие модели (inliers), и выбросы (outliers), и нарисованная прямая определяется только точками, принадлежащими модели. Мы будем использовать набор данных make_regression из scikit-learn для генерации случайных данных с выбросами, а затем подбирать как линейную модель, так и регрессор RANSAC для этих данных.
Советы по использованию ВМ
После запуска ВМ кликните в верхнем левом углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook полностью загрузится. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы столкнетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.