Regresión lineal con sparse | Conjunto de datos de diabetes | Scikit-learn

Introducción

Esta práctica demuestra cómo realizar una regresión lineal con sparse usando el conjunto de datos de diabetes de scikit-learn. Vamos a ajustar solo dos características del conjunto de datos y graficar los resultados para ilustrar el concepto de sparse.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no puede automatizarse debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje comentarios después de la sesión y resolveremos el problema para usted de inmediato.

Cargar el conjunto de datos de diabetes

Primero, cargamos el conjunto de datos de diabetes de scikit-learn y lo dividimos en conjuntos de entrenamiento y prueba.

from sklearn import datasets
import numpy as np

X, y = datasets.load_diabetes(return_X_y=True)
indices = (0, 1)

X_train = X[:-20, indices]
X_test = X[-20:, indices]
y_train = y[:-20]
y_test = y[-20:]

Ajustar un modelo de regresión lineal

A continuación, ajustamos un modelo de regresión lineal al conjunto de entrenamiento.

from sklearn import linear_model

ols = linear_model.LinearRegression()
_ = ols.fit(X_train, y_train)

Graficar los resultados

Finalmente, graficamos los resultados desde tres vistas diferentes para ilustrar el concepto de sparse.

import matplotlib.pyplot as plt

## importación no utilizada pero requerida para hacer proyecciones 3d con matplotlib < 3.2
import mpl_toolkits.mplot3d  ## noqa: F401


def plot_figs(fig_num, elev, azim, X_train, clf):
    fig = plt.figure(fig_num, figsize=(4, 3))
    plt.clf()
    ax = fig.add_subplot(111, projection="3d", elev=elev, azim=azim)

    ax.scatter(X_train[:, 0], X_train[:, 1], y_train, c="k", marker="+")
    ax.plot_surface(
        np.array([[-0.1, -0.1], [0.15, 0.15]]),
        np.array([[-0.1, 0.15], [-0.1, 0.15]]),
        clf.predict(
            np.array([[-0.1, -0.1, 0.15, 0.15], [-0.1, 0.15, -0.1, 0.15]]).T
        ).reshape((2, 2)),
        alpha=0.5,
    )
    ax.set_xlabel("X_1")
    ax.set_ylabel("X_2")
    ax.set_zlabel("Y")
    ax.xaxis.set_ticklabels([])
    ax.yaxis.set_ticklabels([])
    ax.zaxis.set_ticklabels([])


## Generar las tres figuras diferentes desde diferentes vistas
elev = 43.5
azim = -110
plot_figs(1, elev, azim, X_train, ols)

elev = -0.5
azim = 0
plot_figs(2, elev, azim, X_train, ols)

elev = -0.5
azim = 90
plot_figs(3, elev, azim, X_train, ols)

plt.show()

Resumen

Esta práctica demostró cómo realizar una regresión lineal con sparse usando el conjunto de datos de diabetes de scikit-learn. Ajustamos solo dos características del conjunto de datos y graficamos los resultados para ilustrar el concepto de sparse.

Ejemplo de regresión lineal con sparse