Estimateurs et pipelines de Scikit-Learn

Machine LearningMachine LearningBeginner
Pratiquer maintenant

This tutorial is from open-source community. Access the source code

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre les différentes façons d'afficher des estimateurs et des pipelines à l'aide de scikit-learn. Les estimateurs et les pipelines sont une partie essentielle du package scikit-learn, nous permettant de construire et d'évaluer des modèles d'apprentissage automatique.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous réglerons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"]) sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"]) sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models") sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization") sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline") sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/impute("Impute") sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/compose("Composite Estimators") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/linear_model -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} sklearn/preprocessing -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} sklearn/pipeline -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} sklearn/impute -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} sklearn/compose -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} ml/sklearn -.-> lab-49120{{"Estimateurs et pipelines de Scikit-Learn"}} end

Représentation textuelle compacte

La première façon dont nous pouvons afficher des estimateurs est à travers une représentation textuelle compacte. Les estimateurs ne montreront que les paramètres qui ont été définis sur des valeurs autres que les valeurs par défaut lorsqu'ils sont affichés sous forme de chaîne de caractères. Cela réduit le bruit visuel et facilite la détection des différences lors de la comparaison d'instances.

from sklearn.linear_model import LogisticRegression

## Créez une instance de Régression logistique avec une pénalité l1
lr = LogisticRegression(penalty="l1")

## Affichez l'estimateur
print(lr)

Représentation HTML riche

La deuxième façon dont nous pouvons afficher des estimateurs est à travers une représentation HTML riche. Dans les notebooks, les estimateurs et les pipelines utiliseront une représentation HTML riche. Cela est particulièrement utile pour résumer la structure des pipelines et d'autres estimateurs composites, avec une interaction pour fournir des détails.

from sklearn.pipeline import make_pipeline
from sklearn.preprocessing import OneHotEncoder, StandardScaler
from sklearn.impute import SimpleImputer
from sklearn.compose import make_column_transformer
from sklearn.linear_model import LogisticRegression

## Créez des pipelines pour les données numériques et catégorielles
num_proc = make_pipeline(SimpleImputer(strategy="median"), StandardScaler())
cat_proc = make_pipeline(
    SimpleImputer(strategy="constant", fill_value="missing"),
    OneHotEncoder(handle_unknown="ignore"),
)

## Créez un prétraiteur qui applique les pipelines numériques et catégorielles à des colonnes spécifiques
preprocessor = make_column_transformer(
    (num_proc, ("feat1", "feat3")), (cat_proc, ("feat0", "feat2"))
)

## Créez un pipeline qui applique le prétraiteur et la régression logistique
clf = make_pipeline(preprocessor, LogisticRegression())

## Affichez le pipeline
clf

Sommaire

Dans ce laboratoire, nous avons appris deux façons d'afficher des estimateurs et des pipelines à l'aide de scikit-learn : la représentation textuelle compacte et la représentation HTML riche. Ces représentations peuvent être utiles pour résumer la structure des pipelines et d'autres estimateurs composites et pour comparer différentes instances. En utilisant ces techniques, nous pouvons améliorer notre compréhension des modèles d'apprentissage automatique et de leur performance.