Machine Learning com Python e Docker: Aprenda na Prática

Introdução

Neste laboratório, você será transportado para uma cidade subaquática futurista, onde assumirá o papel de um caçador de tesouros em águas profundas. Sua missão é usar suas habilidades de machine learning em Python para analisar dados subaquáticos e localizar tesouros escondidos. A cidade subaquática está repleta de artefatos misteriosos e tesouros valiosos esperando para serem descobertos. Seu objetivo é utilizar seu conhecimento de machine learning em Python para desvendar os segredos das profundezas do oceano.

Pré-processamento e Exploração de Dados

Nesta etapa, você começará carregando e pré-processando os dados subaquáticos coletados de vários sensores. Você explorará o conjunto de dados para obter insights sobre o ambiente subaquático e identificar padrões usando as bibliotecas pandas e numpy do Python.

Em ~/project/data_preprocessing.py:

## data_preprocessing.py

import pandas as pd
import numpy as np

## Carrega o conjunto de dados subaquáticos em um DataFrame pandas
underwater_data = pd.read_csv('/home/labex/project/underwater_data.csv')

## Realiza o pré-processamento e exploração de dados
print(underwater_data)

Execute o script:

python data_preprocessing.py

As informações abaixo devem ser exibidas no seu terminal:

   sensor1  sensor2  sensor3  sensor4
0      1.2      3.4      5.6      2.1
1      2.3      4.5      6.7      3.2
2      3.4      5.6      7.8      4.3

Treinamento e Avaliação do Modelo

Nesta etapa, você utilizará a biblioteca scikit-learn do Python para construir modelos de machine learning para prever as localizações de potenciais tesouros subaquáticos com base nos dados pré-processados. Você treinará e avaliará o desempenho de vários algoritmos de machine learning, como árvores de decisão, florestas aleatórias e máquinas de vetores de suporte (support vector machines).

Em ~/project/model_training.py:

## model_training.py

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

## Lê os dados do arquivo "underwater_data.csv"
data = pd.read_csv("/home/labex/project/underwater_data.csv")

## Converte os dados em um array NumPy
data = np.array(data)

## Extrai a matriz de características X e a variável alvo y
X = data[:, :-1]  ## Usa todas as linhas, exceto a última coluna, como a matriz de características X
y = data[:, -1]   ## Usa todas as linhas, a última coluna, como a variável alvo y

## Divide os dados pré-processados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Inicializa e treina um regressor de floresta aleatória
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

## Avalia o desempenho do modelo
predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"Mean Squared Error: {mse}")

Execute o script:

python model_training.py

As informações abaixo devem ser exibidas no seu terminal:

Mean Squared Error: 1.8009639999999907

Resumo

Neste laboratório, projetamos uma experiência prática para aspirantes a caçadores de tesouros aplicarem técnicas de machine learning em Python na futurística cidade subaquática. Ao pré-processar e explorar dados subaquáticos e treinar modelos de machine learning, você pode descobrir tesouros escondidos e obter insights valiosos sobre a aplicação de machine learning em cenários do mundo real.