Clasificador de regresión logística en el conjunto de datos Iris

Machine LearningMachine LearningBeginner
Practicar Ahora

This tutorial is from open-source community. Access the source code

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este laboratorio, usaremos el clasificador de regresión logística para clasificar las primeras dos características del conjunto de datos Iris basadas en sus etiquetas. Usaremos la biblioteca scikit-learn para cargar y preprocesar el conjunto de datos, crear una instancia del clasificador de regresión logística y ajustar los datos. Finalmente, mostraremos los límites de decisión en el diagrama de dispersión.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"]) sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models") sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/inspection("Inspection") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/linear_model -.-> lab-49169{{"Clasificador de regresión logística en el conjunto de datos Iris"}} sklearn/inspection -.-> lab-49169{{"Clasificador de regresión logística en el conjunto de datos Iris"}} ml/sklearn -.-> lab-49169{{"Clasificador de regresión logística en el conjunto de datos Iris"}} end

Cargar el conjunto de datos y preprocesar

Usaremos la biblioteca scikit-learn para cargar el conjunto de datos Iris. El conjunto de datos contiene 3 clases de 50 instancias cada una, donde cada clase se refiere a un tipo de planta de iris. Cada instancia tiene 4 características: longitud del sépalo, ancho del sépalo, longitud del pétalo y ancho del pétalo.

import matplotlib.pyplot as plt
from sklearn.linear_model import LogisticRegression
from sklearn import datasets
from sklearn.inspection import DecisionBoundaryDisplay

## load the Iris dataset
iris = datasets.load_iris()
X = iris.data[:, :2]  ## we only take the first two features.
Y = iris.target

Crear una instancia del clasificador de regresión logística y ajustar los datos

Crearemos una instancia del clasificador de regresión logística y ajustaremos los datos.

## Create an instance of Logistic Regression Classifier and fit the data.
logreg = LogisticRegression(C=1e5)
logreg.fit(X, Y)

Mostrar los límites de decisión en el diagrama de dispersión

Mostraremos los límites de decisión en el diagrama de dispersión usando DecisionBoundaryDisplay de la biblioteca scikit-learn.

_, ax = plt.subplots(figsize=(4, 3))
DecisionBoundaryDisplay.from_estimator(
    logreg,
    X,
    cmap=plt.cm.Paired,
    ax=ax,
    response_method="predict",
    plot_method="pcolormesh",
    shading="auto",
    xlabel="Longitud del sépalo",
    ylabel="Ancho del sépalo",
    eps=0.5,
)

## Plot also the training points
plt.scatter(X[:, 0], X[:, 1], c=Y, edgecolors="k", cmap=plt.cm.Paired)

plt.xticks(())
plt.yticks(())

plt.show()

Resumen

En este laboratorio, usamos el clasificador de regresión logística para clasificar las primeras dos características del conjunto de datos Iris basadas en sus etiquetas. Cargamos y preprocesamos el conjunto de datos usando la biblioteca scikit-learn, creamos una instancia del clasificador de regresión logística y ajustamos los datos. Finalmente, mostramos los límites de decisión en el diagrama de dispersión.