Apprentissage automatique en Python

Introduction

Dans ce laboratoire, vous vous retrouverez dans une ville sous-marine futuriste où vous assumerez le rôle de chasseur de trésors en mer profonde. Votre mission est d'utiliser les compétences en apprentissage automatique en Python pour analyser les données sous-marines et localiser les trésors cachés. La ville sous-marine est pleine d'artefacts mystérieux et de précieux trésors attendant d'être découverts. Votre objectif est d'utiliser vos connaissances en apprentissage automatique en Python pour découvrir les secrets des profondeurs océaniques.

Prétraitement et exploration des données

Dans cette étape, vous commencerez par charger et prétraiter les données sous-marines recueillies à partir de divers capteurs. Vous explorerez l'ensemble de données pour mieux comprendre l'environnement sous-marin et identifier des modèles à l'aide des bibliothèques pandas et numpy de Python.

Dans ~/projet/data_preprocessing.py :

## data_preprocessing.py

import pandas as pd
import numpy as np

## Chargez l'ensemble de données sous-marines dans un DataFrame pandas
donnees_sous_marines = pd.read_csv('/home/labex/projet/underwater_data.csv')

## Effectuez le prétraitement et l'exploration des données
print(donnees_sous_marines)

Exécutez le script :

python data_preprocessing.py

L'information ci-dessous devrait être affichée sur votre terminal :

   capteur1  capteur2  capteur3  capteur4
0      1.2      3.4      5.6      2.1
1      2.3      4.5      6.7      3.2
2      3.4      5.6      7.8      4.3

Entraînement et évaluation du modèle

Dans cette étape, vous utiliserez la bibliothèque scikit-learn de Python pour construire des modèles d'apprentissage automatique pour prédire les emplacements de trésors sous-marins potentiels à partir des données prétraitées. Vous entraînerez et évaluerez les performances de divers algorithmes d'apprentissage automatique tels que les arbres de décision, les forêts aléatoires et les machines à vecteurs de support.

Dans ~/projet/model_training.py :

## model_training.py

import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestRegressor
from sklearn.metrics import mean_squared_error

## Lire les données à partir du fichier "underwater_data.csv"
donnees = pd.read_csv("/home/labex/projet/underwater_data.csv")

## Convertir les données en un tableau NumPy
donnees = np.array(donnees)

## Extraire la matrice de caractéristiques X et la variable cible y
X = donnees[:, :-1]  ## Utiliser toutes les lignes, sauf la dernière colonne comme matrice de caractéristiques X
y = donnees[:, -1]   ## Utiliser toutes les lignes, la dernière colonne comme variable cible y

## Diviser les données prétraitées en ensembles d'entraînement et de test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Initialiser et entraîner un régresseur à forêt aléatoire
modele = RandomForestRegressor(n_estimators=100, random_state=42)
modele.fit(X_train, y_train)

## Évaluer les performances du modèle
predictions = modele.predict(X_test)
mse = mean_squared_error(y_test, predictions)
print(f"Mean Squared Error: {mse}")

Exécutez le script :

python model_training.py

L'information ci-dessous devrait être affichée sur votre terminal :

Mean Squared Error: 1.8009639999999907

Résumé

Dans ce laboratoire, nous avons conçu une expérience pratique pour les futurs chasseurs de trésors afin qu'ils appliquent des techniques d'apprentissage automatique en Python dans la ville sous-marine futuriste. En prétraitant et en explorant les données sous-marines et en entraînant des modèles d'apprentissage automatique, vous pouvez découvrir des trésors cachés et acquérir des connaissances précieuses sur l'application de l'apprentissage automatique dans des scénarios du monde réel.