Обучение и оценка модели
В этом шаге вы будете использовать библиотеку scikit - learn для Python для построения машинных learning моделей для предсказания местоположения потенциальных подводных сокровищ на основе предварительно обработанных данных. Вы будете обучать и оценивать производительность различных алгоритмов машинного обучения, таких как деревья решений, случайный лес и метод опорных векторов.
В ~/project/model_training.py:
## model_training.py
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
## Read the data from the "underwater_data.csv" file
data = pd.read_csv("/home/labex/project/underwater_data.csv")
## Convert data to a NumPy array
data = np.array(data)
## Extract feature matrix X and target variable y
X = data[:, :-1] ## Use all rows, except the last column as the feature matrix X
y = data[:, -1] ## Use all rows, the last column as the target variable y
## Split the preprocessed data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
## Initialize and train a random forest regressor
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
## Evaluate the model's performance
predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"Mean Squared Error: {mse}")
Запустите скрипт:
python model_training.py
На терминале должно быть отображено следующая информация:
Mean Squared Error: 1.8009639999999907