Введение
В этом лабораторном задании вы попадете в футуристический подводный город, где будете играть роль охотника за сокровищами глубоководья. Ваша миссия - использовать навыки машинного обучения на Python для анализа подводных данных и поиска скрытых сокровищ. В подводном городе полны загадочные артефакты и ценные сокровища, ждущие открытия. Ваша цель - использовать свои знания о машинном обучении на Python, чтобы раскрыть секреты глубин океана.
Предварительная обработка и исследование данных
В этом шаге вы начнете с загрузки и предварительной обработки подводных данных, собранных с различных датчиков. Вы изучите набор данных, чтобы получить представление о подводной среде и выявить закономерности с использованием библиотек pandas и numpy для Python.
В ~/project/data_preprocessing.py:
## data_preprocessing.py
import pandas as pd
import numpy as np
## Load the underwater dataset into a pandas DataFrame
underwater_data = pd.read_csv('/home/labex/project/underwater_data.csv')
## Perform data preprocessing and exploration
print(underwater_data)
Запустите скрипт:
python data_preprocessing.py
На терминале должно быть отображено следующая информация:
sensor1 sensor2 sensor3 sensor4
0 1.2 3.4 5.6 2.1
1 2.3 4.5 6.7 3.2
2 3.4 5.6 7.8 4.3
Обучение и оценка модели
В этом шаге вы будете использовать библиотеку scikit - learn для Python для построения машинных learning моделей для предсказания местоположения потенциальных подводных сокровищ на основе предварительно обработанных данных. Вы будете обучать и оценивать производительность различных алгоритмов машинного обучения, таких как деревья решений, случайный лес и метод опорных векторов.
В ~/project/model_training.py:
## model_training.py
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error
## Read the data from the "underwater_data.csv" file
data = pd.read_csv("/home/labex/project/underwater_data.csv")
## Convert data to a NumPy array
data = np.array(data)
## Extract feature matrix X and target variable y
X = data[:, :-1] ## Use all rows, except the last column as the feature matrix X
y = data[:, -1] ## Use all rows, the last column as the target variable y
## Split the preprocessed data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
## Initialize and train a random forest regressor
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)
## Evaluate the model's performance
predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"Mean Squared Error: {mse}")
Запустите скрипт:
python model_training.py
На терминале должно быть отображено следующая информация:
Mean Squared Error: 1.8009639999999907
Резюме
В этом лабораторном задании мы разработали практическое занятие для будущих охотников за сокровищами, чтобы они могли применить методы машинного обучения на Python в футуристическом подводном городе. Предварительной обработкой и исследованием подводных данных и обучением моделей машинного обучения вы можете обнаружить скрытые сокровища и получить ценные знания о применении машинного обучения в реальных сценариях.



