Введение
В этом практическом занятии показано, как выполнить линейную регрессию с учетом разреженности с использованием набора данных о диабете из scikit-learn. Мы будем использовать только два признака из набора данных и построить результаты, чтобы проиллюстрировать концепцию разреженности.
Советы по использованию ВМ
После запуска виртуальной машины щелкните в левом верхнем углу, чтобы переключиться на вкладку Ноутбук и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Проверка операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Загрузка набора данных о диабете
Сначала мы загружаем набор данных о диабете из scikit-learn и разделяем его на обучающую и тестовую выборки.
from sklearn import datasets
import numpy as np
X, y = datasets.load_diabetes(return_X_y=True)
indices = (0, 1)
X_train = X[:-20, indices]
X_test = X[-20:, indices]
y_train = y[:-20]
y_test = y[-20:]
Подгонка модели линейной регрессии
Далее мы подгоняем модель линейной регрессии к обучающей выборке.
from sklearn import linear_model
ols = linear_model.LinearRegression()
_ = ols.fit(X_train, y_train)
Построение графиков результатов
Наконец, мы строим графики результатов из трех разных видов, чтобы проиллюстрировать концепцию разреженности.
import matplotlib.pyplot as plt
## unused but required import for doing 3d projections with matplotlib < 3.2
import mpl_toolkits.mplot3d ## noqa: F401
def plot_figs(fig_num, elev, azim, X_train, clf):
fig = plt.figure(fig_num, figsize=(4, 3))
plt.clf()
ax = fig.add_subplot(111, projection="3d", elev=elev, azim=azim)
ax.scatter(X_train[:, 0], X_train[:, 1], y_train, c="k", marker="+")
ax.plot_surface(
np.array([[-0.1, -0.1], [0.15, 0.15]]),
np.array([[-0.1, 0.15], [-0.1, 0.15]]),
clf.predict(
np.array([[-0.1, -0.1, 0.15, 0.15], [-0.1, 0.15, -0.1, 0.15]]).T
).reshape((2, 2)),
alpha=0.5,
)
ax.set_xlabel("X_1")
ax.set_ylabel("X_2")
ax.set_zlabel("Y")
ax.xaxis.set_ticklabels([])
ax.yaxis.set_ticklabels([])
ax.zaxis.set_ticklabels([])
## Generate the three different figures from different views
elev = 43.5
azim = -110
plot_figs(1, elev, azim, X_train, ols)
elev = -0.5
azim = 0
plot_figs(2, elev, azim, X_train, ols)
elev = -0.5
azim = 90
plot_figs(3, elev, azim, X_train, ols)
plt.show()
Резюме
В этом практическом занятии показано, как выполнить линейную регрессию с учетом разреженности с использованием набора данных о диабете из scikit-learn. Мы использовали только два признака из набора данных и построили графики результатов, чтобы проиллюстрировать концепцию разреженности.