Lasso y Elastic Net

Beginner

This tutorial is from open-source community. Access the source code

Introducción

En este tutorial, aprenderemos sobre Lasso y Elastic Net, que son técnicas utilizadas para la regresión lineal y se implementan utilizando un descenso coordenado. Aprenderemos cómo calcular las trayectorias de regularización utilizando Lasso y Elastic Net, y cómo mostrar los resultados utilizando matplotlib.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Cargar el conjunto de datos

En este paso, cargaremos el conjunto de datos de diabetes de la biblioteca scikit-learn y estandarizaremos los datos.

from sklearn import datasets

## Cargar el conjunto de datos de diabetes
X, y = datasets.load_diabetes(return_X_y=True)

## Estandarizar datos
X /= X.std(axis=0)

Calcular la trayectoria de regularización usando Lasso

En este paso, calcularemos la trayectoria de regularización usando la técnica de Lasso y mostraremos los resultados usando matplotlib.

from sklearn.linear_model import lasso_path
import numpy as np
import matplotlib.pyplot as plt

## Establece el valor de eps
eps = 5e-3

## Calcula la trayectoria de regularización usando Lasso
alphas_lasso, coefs_lasso, _ = lasso_path(X, y, eps=eps)

## Muestra los resultados usando matplotlib
plt.figure(1)
colors = cycle(["b", "r", "g", "c", "k"])
neg_log_alphas_lasso = -np.log10(alphas_lasso)
for coef_l, c in zip(coefs_lasso, colors):
    l1 = plt.plot(neg_log_alphas_lasso, coef_l, c=c)

plt.xlabel("-Log(alpha)")
plt.ylabel("coefficients")
plt.title("Lasso Path")
plt.axis("tight")
plt.show()

Calcular la trayectoria de regularización usando Lasso positivo

En este paso, calcularemos la trayectoria de regularización usando la técnica de Lasso positivo y mostraremos los resultados usando matplotlib.

## Calcular la trayectoria de regularización usando Lasso positivo
alphas_positive_lasso, coefs_positive_lasso, _ = lasso_path(X, y, eps=eps, positive=True)

## Mostrar los resultados usando matplotlib
plt.figure(2)
neg_log_alphas_positive_lasso = -np.log10(alphas_positive_lasso)
for coef_l, coef_pl, c in zip(coefs_lasso, coefs_positive_lasso, colors):
    l1 = plt.plot(neg_log_alphas_lasso, coef_l, c=c)
    l2 = plt.plot(neg_log_alphas_positive_lasso, coef_pl, linestyle="--", c=c)

plt.xlabel("-Log(alpha)")
plt.ylabel("coefficients")
plt.title("Lasso y Lasso positivo")
plt.legend((l1[-1], l2[-1]), ("Lasso", "Lasso positivo"), loc="lower left")
plt.axis("tight")
plt.show()

Calcular la trayectoria de regularización usando Elastic Net

En este paso, calcularemos la trayectoria de regularización usando la técnica de Elastic Net y mostraremos los resultados usando matplotlib.

from sklearn.linear_model import enet_path

## Calcular la trayectoria de regularización usando Elastic Net
alphas_enet, coefs_enet, _ = enet_path(X, y, eps=eps, l1_ratio=0.8)

## Mostrar los resultados usando matplotlib
plt.figure(3)
neg_log_alphas_enet = -np.log10(alphas_enet)
for coef_e, c in zip(coefs_enet, colors):
    l1 = plt.plot(neg_log_alphas_enet, coef_e, c=c)

plt.xlabel("-Log(alpha)")
plt.ylabel("coefficients")
plt.title("Trayectoria de Elastic Net")
plt.axis("tight")
plt.show()

Calcular la trayectoria de regularización usando Elastic Net positivo

En este paso, calcularemos la trayectoria de regularización usando la técnica de Elastic Net positivo y mostraremos los resultados usando matplotlib.

## Calcular la trayectoria de regularización usando Elastic Net positivo
alphas_positive_enet, coefs_positive_enet, _ = enet_path(X, y, eps=eps, l1_ratio=0.8, positive=True)

## Mostrar los resultados usando matplotlib
plt.figure(4)
neg_log_alphas_positive_enet = -np.log10(alphas_positive_enet)
for coef_e, coef_pe, c in zip(coefs_enet, coefs_positive_enet, colors):
    l1 = plt.plot(neg_log_alphas_enet, coef_e, c=c)
    l2 = plt.plot(neg_log_alphas_positive_enet, coef_pe, linestyle="--", c=c)

plt.xlabel("-Log(alpha)")
plt.ylabel("coefficients")
plt.title("Elastic Net y Elastic Net positivo")
plt.legend((l1[-1], l2[-1]), ("Elastic Net", "Elastic Net positivo"), loc="lower left")
plt.axis("tight")
plt.show()

Resumen

En este tutorial, aprendimos sobre Lasso y Elastic Net, que son técnicas utilizadas para la regresión lineal. Aprendimos cómo calcular las trayectorias de regularización usando Lasso y Elastic Net, y cómo mostrar los resultados usando matplotlib. También aprendimos cómo calcular la trayectoria de regularización usando las técnicas de Lasso positivo y Elastic Net positivo.