Scikit - Learn: оценщики и конвейеры | Machine Learning

Введение

В этом лабораторном занятии мы узнаем о различных способах отображения оценщиков и конвейеров с использованием scikit - learn. Оценщики и конвейеры являются важной частью пакета scikit - learn, позволяя нам строить и оценивать модели машинного обучения.

Советы по работе с ВМ

После завершения запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из - за ограничений в Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Сжатая текстовая репрезентация

Первый способ отображения оценщиков - это сжатая текстовая репрезентация. При отображении в виде строки оценщики показывают только те параметры, которые были установлены в нестандартные значения. Это уменьшает визуальный шум и делает легче заметить различия при сравнении экземпляров.

from sklearn.linear_model import LogisticRegression

## Создайте экземпляр логистической регрессии с штрафом l1
lr = LogisticRegression(penalty="l1")

## Отобразите оценщик
print(lr)

Богатая HTML - репрезентация

Второй способ отображения оценщиков - это богатая HTML - репрезентация. В ноутбуках оценщики и конвейеры будут использовать богатую HTML - репрезентацию. Это особенно полезно для суммаризации структуры конвейеров и других составных оценщиков с возможностью интерактивного просмотра деталей.

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.impute import SimpleImputer
from sklearn.compose import make_column_transformer
from sklearn.linear_model import LogisticRegression

## Создайте конвейеры для числовых и категориальных данных
num_proc = make_pipeline(SimpleImputer(strategy="median"), StandardScaler())
cat_proc = make_pipeline(
    SimpleImputer(strategy="constant", fill_value="missing"),
    OneHotEncoder(handle_unknown="ignore"),
)

## Создайте препроцессор, который применяет числовой и категориальный конвейеры к определенным столбцам
preprocessor = make_column_transformer(
    (num_proc, ("feat1", "feat3")), (cat_proc, ("feat0", "feat2"))
)

## Создайте конвейер, который применяет препроцессор и логистическую регрессию
clf = make_pipeline(preprocessor, LogisticRegression())

## Отобразите конвейер
clf

Резюме

В этом лабораторном занятии мы узнали о двух способах отображения оценщиков и конвейеров с использованием scikit - learn: сжатой текстовой репрезентации и богатой HTML - репрезентации. Эти репрезентации могут быть полезны для суммаризации структуры конвейеров и других составных оценщиков и для сравнения различных экземпляров. Используя эти методы, мы можем улучшить наше понимание моделей машинного обучения и их производительности.