Diabetes-Vorhersage mit Voting Regressor

Machine LearningMachine LearningBeginner
Jetzt üben

This tutorial is from open-source community. Access the source code

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

In diesem Lab verwenden wir einen Voting Regressor, um die Progression der Diabeteserkrankung bei Patienten vorherzusagen. Wir werden drei verschiedene Regressoren verwenden, um die Daten vorherzusagen: Gradient Boosting Regressor, Random Forest Regressor und Lineare Regression. Anschließend werden die oben genannten 3 Regressoren für den Voting Regressor verwendet. Schließlich werden wir die Vorhersagen aller Modelle darstellen, um sie zu vergleichen.

Wir werden mit dem Diabetes-Datensatz arbeiten, der aus 10 Merkmalen besteht, die von einer Kohorte von Diabetes-Patienten gesammelt wurden. Das Ziel ist eine quantitative Messung der Krankheitsprogression ein Jahr nach der Grundlinie.

Tipps für die VM

Nachdem der Start der VM abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund der Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"]) sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models") sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/ensemble("Ensemble Methods") sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/linear_model -.-> lab-49330{{"Diabetes-Vorhersage mit Voting Regressor"}} sklearn/ensemble -.-> lab-49330{{"Diabetes-Vorhersage mit Voting Regressor"}} sklearn/datasets -.-> lab-49330{{"Diabetes-Vorhersage mit Voting Regressor"}} ml/sklearn -.-> lab-49330{{"Diabetes-Vorhersage mit Voting Regressor"}} end

Bibliotheken importieren

Lassen Sie uns die erforderlichen Bibliotheken importieren, um die Diabetes-Vorhersage mit dem Voting Regressor durchzuführen.

import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import VotingRegressor

Laden des Diabetes-Datensatzes

Als nächstes laden wir den Diabetes-Datensatz in unser Programm mit der Funktion load_diabetes(), die von scikit-learn bereitgestellt wird. Diese Funktion gibt den Datensatz als Tupel aus zwei Arrays zurück - eines enthält die Merkmalsdaten und das andere die Zielwerte. Wir werden diese Arrays jeweils X und y zuweisen.

## Load the diabetes dataset
X, y = load_diabetes(return_X_y=True)

Trainieren der Regressoren

Lassen Sie uns nun einen Gradient Boosting Regressor, einen Random Forest Regressor und eine Lineare Regression initialisieren. Anschließend werden wir die 3 Regressoren verwenden, um den Voting Regressor zu erstellen.

## Train classifiers
reg1 = GradientBoostingRegressor(random_state=1)
reg2 = RandomForestRegressor(random_state=1)
reg3 = LinearRegression()

reg1.fit(X, y)
reg2.fit(X, y)
reg3.fit(X, y)

ereg = VotingRegressor([("gb", reg1), ("rf", reg2), ("lr", reg3)])
ereg.fit(X, y)

Vorhersagen treffen

Jetzt werden wir jeden der Regressoren verwenden, um die ersten 20 Vorhersagen zu treffen.

## Make predictions
xt = X[:20]

pred1 = reg1.predict(xt)
pred2 = reg2.predict(xt)
pred3 = reg3.predict(xt)
pred4 = ereg.predict(xt)

Zeichnen der Ergebnisse

Schließlich werden wir die 20 Vorhersagen visualisieren. Die roten Sterne zeigen die durchschnittliche Vorhersage des Voting Regressors.

## Plot the results
plt.figure()
plt.plot(pred1, "gd", label="GradientBoostingRegressor")
plt.plot(pred2, "b^", label="RandomForestRegressor")
plt.plot(pred3, "ys", label="LinearRegression")
plt.plot(pred4, "r*", ms=10, label="VotingRegressor")

plt.tick_params(axis="x", which="both", bottom=False, top=False, labelbottom=False)
plt.ylabel("predicted")
plt.xlabel("training samples")
plt.legend(loc="best")
plt.title("Regressor predictions and their average")

plt.show()

Zusammenfassung

In diesem Lab haben wir den Voting Regressor verwendet, um die Progression der Diabeteserkrankung bei Patienten vorherzusagen. Wir haben drei verschiedene Regressoren verwendet, um die Daten vorherzusagen: Gradient Boosting Regressor, Random Forest Regressor und Lineare Regression. Wir haben auch die Vorhersagen aller Modelle visualisiert, um einen Vergleich durchzuführen.