Previsão de Diabetes Usando Regressor de Votação

Beginner

This tutorial is from open-source community. Access the source code

Introdução

Neste laboratório, utilizaremos um Regressor de Votação para prever a progressão do diabetes em pacientes. Usaremos três regressores diferentes para prever os dados: Regressor de Reforço Gradiente, Regressor de Floresta Aleatória e Regressão Linear. Em seguida, os três regressores acima serão usados para o Regressor de Votação. Finalmente, plotaremos as previsões feitas por todos os modelos para comparação.

Trabalharemos com o conjunto de dados de diabetes, que consiste em 10 características coletadas de um grupo de pacientes com diabetes. O alvo é uma medida quantitativa da progressão da doença um ano após a linha de base.

Dicas da Máquina Virtual

Após o início da VM, clique no canto superior esquerdo para mudar para a aba Notebook para acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você encontrar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão e resolveremos prontamente o problema para você.

Importar Bibliotecas

Vamos importar as bibliotecas necessárias para realizar a previsão de diabetes usando o Regressor de Votação.

import matplotlib.pyplot as plt
from sklearn.datasets import load_diabetes
from sklearn.ensemble import GradientBoostingRegressor
from sklearn.ensemble import RandomForestRegressor
from sklearn.linear_model import LinearRegression
from sklearn.ensemble import VotingRegressor

Carregar o Conjunto de Dados de Diabetes

Em seguida, carregaremos o conjunto de dados de diabetes em nosso programa usando a função load_diabetes() fornecida pelo scikit-learn. Esta função retorna o conjunto de dados como uma tupla de dois arrays - um contendo os dados das características e outro contendo os dados do alvo. Atribuiremos esses arrays a X e y, respectivamente.

## Carregar o conjunto de dados de diabetes
X, y = load_diabetes(return_X_y=True)

Treinar os Regressores

Agora, vamos iniciar um Regressor de Reforço Gradiente, um Regressor de Floresta Aleatória e uma Regressão Linear. Em seguida, usaremos os 3 regressores para construir o Regressor de Votação.

## Treinar classificadores
reg1 = GradientBoostingRegressor(random_state=1)
reg2 = RandomForestRegressor(random_state=1)
reg3 = LinearRegression()

reg1.fit(X, y)
reg2.fit(X, y)
reg3.fit(X, y)

ereg = VotingRegressor([("gb", reg1), ("rf", reg2), ("lr", reg3)])
ereg.fit(X, y)

Fazendo Previsões

Agora, usaremos cada um dos regressores para fazer as 20 primeiras previsões.

## Fazer previsões
xt = X[:20]

pred1 = reg1.predict(xt)
pred2 = reg2.predict(xt)
pred3 = reg3.predict(xt)
pred4 = ereg.predict(xt)

Plotar os Resultados

Finalmente, visualizaremos as 20 previsões. As estrelas vermelhas mostram a previsão média feita pelo Regressor de Votação.

## Plotar os resultados
plt.figure()
plt.plot(pred1, "gd", label="GradientBoostingRegressor")
plt.plot(pred2, "b^", label="RandomForestRegressor")
plt.plot(pred3, "ys", label="LinearRegression")
plt.plot(pred4, "r*", ms=10, label="VotingRegressor")

plt.tick_params(axis="x", which="both", bottom=False, top=False, labelbottom=False)
plt.ylabel("previsto")
plt.xlabel("amostras de treino")
plt.legend(loc="best")
plt.title("Previsões dos Regressores e sua média")

plt.show()

Resumo

Neste laboratório, utilizamos o Regressor de Votação para prever a progressão do diabetes em pacientes. Empregamos três regressores diferentes para prever os dados: Regressor de Reforço Gradiente, Regressor de Floresta Aleatória e Regressão Linear. Também visualizamos as previsões feitas por todos os modelos para comparação.