Ajuste e Plotagem de Regressão Linear

Machine LearningBeginner
Pratique Agora

Introdução

Neste projeto, você aprenderá como realizar regressão linear em um conjunto de pontos de dados e visualizar os resultados usando Matplotlib. Regressão linear é uma técnica fundamental de aprendizado de máquina usada para modelar a relação entre uma variável dependente (y) e uma ou mais variáveis independentes (x).

🎯 Tarefas

Neste projeto, você aprenderá:

  • Como converter os dados fornecidos em um array Numpy para facilitar a manipulação
  • Como calcular os coeficientes do modelo de regressão linear, incluindo a inclinação (w) e a interceptação (b)
  • Como plotar os pontos de dados em um gráfico de dispersão e desenhar a linha de regressão linear no mesmo gráfico

🏆 Conquistas

Após concluir este projeto, você será capaz de:

  • Preparar dados para análise de regressão linear
  • Usar funções Numpy para calcular os parâmetros da regressão linear
  • Criar um gráfico de dispersão e sobrepor a linha de regressão linear usando Matplotlib
  • Obter uma melhor compreensão da regressão linear e suas aplicações práticas em análise e visualização de dados

Converter Dados para Array NumPy

Nesta etapa, você aprenderá como converter os dados fornecidos em um array NumPy para facilitar a manipulação.

Abra o arquivo linear_regression_plot.py.

Localize a variável data no início da função linear_plot().

Converta a lista data em um array NumPy usando a função np.array().

data = np.array(data)

Agora, a variável data é um array NumPy, o que facilitará o trabalho nas próximas etapas.

✨ Verificar Solução e Praticar

Calcular os Parâmetros da Regressão Linear

Nesta etapa, você aprenderá como calcular os valores do coeficiente w e da interceptação b a partir dos dados.

Continue na função linear_plot(), extraia os valores x e y do array NumPy data.

x = data[:, 0]
y = data[:, 1]

Use a função np.polyfit() para calcular os parâmetros da regressão linear w e b.

w, b = np.polyfit(x, y, 1)

Arredonde os valores calculados de w e b para duas casas decimais usando a função round().

w = round(w, 2)
b = round(b, 2)

Agora, você tem os valores do coeficiente w e da interceptação b prontos para serem usados na próxima etapa.

✨ Verificar Solução e Praticar

Plotar a Linha de Regressão Linear

Nesta etapa, você aprenderá como plotar o gráfico de dispersão da amostra e desenhar a linha de ajuste no gráfico com base nos parâmetros calculados.

Continue na função linear_plot(), crie uma nova figura e um eixo Matplotlib usando plt.subplots().

fig, ax = plt.subplots()

Plote os pontos de dados usando a função ax.scatter().

ax.scatter(x, y, label="Data Points")

Plote a linha de regressão linear usando a função ax.plot() e os valores calculados de w e b.

ax.plot(x, w * x + b, color="red", label=f"Linear Fit: y = {w}x + {b}")

Adicione rótulos e uma legenda ao gráfico.

ax.set_xlabel("X")
ax.set_ylabel("Y")
ax.legend()

Finalmente, retorne os valores de w, b e o objeto fig.

return w, b, fig

Agora, você concluiu a função linear_plot(), que realiza a regressão linear nos dados fornecidos e retorna os coeficientes e o objeto de plotagem Matplotlib.

✨ Verificar Solução e Praticar

Executar o Gráfico de Regressão Linear

Nesta etapa final, você aprenderá como executar seu script para ver o gráfico de regressão linear em ação. Esta parte do código usará as funções definidas anteriormente em linear_plot() para exibir o gráfico de dispersão junto com a linha de regressão linear.

O trecho de código Python fornecido verificará se o script está sendo executado como o programa principal e, se estiver, chamará a função linear_plot() e exibirá o gráfico resultante.

if __name__ == "__main__":
    ## Call the linear_plot function to compute the regression parameters and generate the plot
    w, b, fig = linear_plot()
    ## Display the plot
    plt.show()

Aqui, if __name__ == "__main__": garante que a função linear_plot() seja chamada somente quando o script for executado diretamente, e não quando importado como um módulo. Após chamar linear_plot(), que retorna a inclinação w, a interceptação b e o objeto de figura fig, plt.show() é usado para exibir o gráfico em uma janela. Isso permite que você inspecione visualmente o ajuste da linha de regressão aos dados.

Agora você pode pressionar o botão "Run Cell" na parte superior da primeira linha de linear_regression_plot.py e ver o resultado.

Resultado do gráfico de regressão linear

Com esta configuração, você pode facilmente reexecutar o script com diferentes conjuntos de dados ou ajustes no cálculo da regressão para ver feedback visual imediato.

✨ Verificar Solução e Praticar

Resumo

Parabéns! Você concluiu este projeto. Você pode praticar mais laboratórios no LabEx para aprimorar suas habilidades.