Машинное обучение на Python

Введение

В этом лабораторном задании вы попадете в футуристический подводный город, где будете играть роль охотника за сокровищами глубоководья. Ваша миссия - использовать навыки машинного обучения на Python для анализа подводных данных и поиска скрытых сокровищ. В подводном городе полны загадочные артефакты и ценные сокровища, ждущие открытия. Ваша цель - использовать свои знания о машинном обучении на Python, чтобы раскрыть секреты глубин океана.

Предварительная обработка и исследование данных

В этом шаге вы начнете с загрузки и предварительной обработки подводных данных, собранных с различных датчиков. Вы изучите набор данных, чтобы получить представление о подводной среде и выявить закономерности с использованием библиотек pandas и numpy для Python.

В ~/project/data_preprocessing.py:

## data_preprocessing.py

import pandas as pd
import numpy as np

## Load the underwater dataset into a pandas DataFrame
underwater_data = pd.read_csv('/home/labex/project/underwater_data.csv')

## Perform data preprocessing and exploration
print(underwater_data)

Запустите скрипт:

python data_preprocessing.py

На терминале должно быть отображено следующая информация:

   sensor1  sensor2  sensor3  sensor4
0      1.2      3.4      5.6      2.1
1      2.3      4.5      6.7      3.2
2      3.4      5.6      7.8      4.3

Обучение и оценка модели

В этом шаге вы будете использовать библиотеку scikit - learn для Python для построения машинных learning моделей для предсказания местоположения потенциальных подводных сокровищ на основе предварительно обработанных данных. Вы будете обучать и оценивать производительность различных алгоритмов машинного обучения, таких как деревья решений, случайный лес и метод опорных векторов.

В ~/project/model_training.py:

## model_training.py

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

## Read the data from the "underwater_data.csv" file
data = pd.read_csv("/home/labex/project/underwater_data.csv")

## Convert data to a NumPy array
data = np.array(data)

## Extract feature matrix X and target variable y
X = data[:, :-1]  ## Use all rows, except the last column as the feature matrix X
y = data[:, -1]   ## Use all rows, the last column as the target variable y

## Split the preprocessed data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Initialize and train a random forest regressor
model = RandomForestRegressor(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

## Evaluate the model's performance
predictions = model.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"Mean Squared Error: {mse}")

Запустите скрипт:

python model_training.py

На терминале должно быть отображено следующая информация:

Mean Squared Error: 1.8009639999999907

Резюме

В этом лабораторном задании мы разработали практическое занятие для будущих охотников за сокровищами, чтобы они могли применить методы машинного обучения на Python в футуристическом подводном городе. Предварительной обработкой и исследованием подводных данных и обучением моделей машинного обучения вы можете обнаружить скрытые сокровища и получить ценные знания о применении машинного обучения в реальных сценариях.