Laboratoires pratiques Sklearn
Débutant
Ce cours contient de nombreux laboratoires pour Sklearn. Chaque laboratoire est un petit projet Sklearn avec des instructions détaillées et des solutions. Vous pouvez pratiquer vos compétences en Sklearn en complétant ces laboratoires, améliorer vos compétences en programmation et apprendre à écrire un code propre et efficace.
sklearnpythondata-science
💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici
- Introduction
- Programme
Comparaison de classifieurs dans Scikit-Learn
Classification de documents texte
Discrétisation des fonctionnalités pour la classification
Pipelines et estimateurs composites
La mise à l'échelle des fonctionnalités en apprentissage automatique
Construction de pipelines Scikit-Learn
Iterative Imputer de Scikit-Learn
Apprentissage de variétés sur des chiffres manuscrits
Classification de chiffres à l'aide de caractéristiques RBM
Column Transformer avec types mixtes
Utilisation de l'API set_output
Classification de texte semi-supervisée
Comparaison de l'étalonnage des classifieurs
Courbe de compromis entre les erreurs de détection
Réduction de la dimensionalité avec Pipeline et GridSearchCV
Courbes d'étalonnage de probabilité
Comparaison d'algorithmes de détection d'anomalies
Métrique Précision-Rappel pour la classification déséquilibrée
Sélection de caractéristiques univariées
Sélection de caractéristiques pour le SVC sur l'ensemble de données Iris
Voisins les plus proches approximatifs dans TSNE
Création de visualisations avec des objets d'affichage
Transformation de la cible pour la régression linéaire
Gradient Boosting avec des variables catégorielles
Construire des pipelines d'apprentissage automatique avec Scikit-Learn
Reconnaissance faciale avec eigenfaces et machines à vecteurs de support (SVM)
Concaténer plusieurs méthodes d'extraction de caractéristiques
Rapports de vraisemblance de classe pour mesurer les performances de classification
Tracer la PCR contre la PLS
Algorithmes multiclasse et multioutput
Imputer les données manquantes
Régression logistique multinomiale MNIST
Détection d'anomalies à l'aide d'algorithmes Scikit-Learn
Evaluation de la ROC multiclasse avec Scikit-Learn
Extraction et évaluation des caractéristiques textuelles
Transformations de caractéristiques avec des ensembles d'arbres
Régularisation du perceptron multicouche
Classification K-Means sur des chiffres manuscrits
Approximation du noyau polynomial avec Scikit-Learn
API de visualisation de Scikit-Learn
Classification des fleurs iris à l'aide du Voting Classifier
Tracer la classification NCA
Tracer le pipeline des chiffres
Estimateurs et pipelines de Scikit-Learn
Équilibrer la complexité du modèle et le score de validation croisée
Effet du seuil variable pour l'auto-formation
Classification de documents multi-étiquette
Classification de texte en utilisant l'apprentissage hors-mémoire
Comparer les régresseurs bayésiens linéaires
Sélection du modèle Lasso
Sélection de modèle pour la régression Lasso
Élimination Récursive de Caractéristiques avec Validation Croisée
Sélection de fonctionnalités avec Scikit-Learn
Algorithme de clustering DBSCAN
Document Biclustering à l'aide de l'algorithme de co-clustering spectral
Exploration des méthodes d'ensemble avec Scikit-Learn
Arbres de décision AdaBoost multi-classe
Tracer les courbes d'apprentissage
Transformation des données catégorielles à l'aide de TargetEncoder
Sous-ajustement et surajustement
Classification avec un arbre de décision simple AdaBoost
Tracer des prédictions avec la validation croisée
Ajustement d'estimateurs linéaires robustes
Évaluation de la qualité des modèles d'apprentissage automatique
Mise en cache des plus proches voisins
Optimiser les hyperparamètres du modèle avec GridSearchCV
Estimations hors-bag pour la Gradient Boosting
Dénuage d'images avec la PCA Kernel
Transformation de fonctionnalités par hachage
Tracer la probabilité de classification
Calibration des probabilités pour la classification à trois classes
Importance des caractéristiques avec la forêt aléatoire
AdaBoost discret vs réel
Estimation de densité par noyau
Arrêt précoce du Gradient Stochastique
Tracer Sgdocsvm vs Ocsvm
Régression logistique multiclasse sparse
Itérations par division successive
Classifier des chiffres manuscrits avec le classifieur MLP
Quantification de couleur à l'aide de K-Means
Sélection de fonctionnalités basée sur un modèle et sélection séquentielle
Discrétisation des caractéristiques continues avec KBinsDiscretizer
Élimination Récursive de Caractéristiques
Prédiction du diabète en utilisant le Voting Regressor
Tracer les forêts d'iris
Regroupement hiérarchique avec contraintes de connectivité
Optimisation d'hyperparamètres : Recherche aléatoire vs Recherche en grille
Courbes de validation : Tracer des scores pour évaluer les modèles
Tailler les arbres de décision après entraînement
Régression Ridge pour la modélisation linéaire
Comparer les solveurs en ligne pour la classification de chiffres manuscrits
Analyse d'arbre de décision
Probabilités de classes avec VotingClassifier
Comparer Random Forest et Histogramme Gradient Boosting
Analyse de regroupement avec la méthode de silhouette
Tracer la régression logistique multinomiale et One-vs-Rest
Comparer K-Means et MiniBatchKMeans
Algorithme de biclustering spectral
Algorithme de co-clustering spectral
Importance des caractéristiques de permutation
Arbres de décision sur l'ensemble de données Iris
Validation croisée imbriquée pour la sélection de modèle
Score de test de permutation pour la classification
Mise à l'échelle du paramètre de régularisation pour les SVM
Traçage des courbes de validation
Ajustement des hyperparamètres d'un estimateur
Classification de chiffres à l'aide de Scikit-Learn
Relever la structure de l'ensemble de données Iris par analyse factorielle
Tracer l'extraction de sujets avec NMF et LDA
Méthodes d'initialisation des modèles de mélange gaussien
Dépendance partielle et espérance conditionnelle individuelle
ROC avec validation croisée
Régression isotone non paramétrique avec Scikit-Learn
Régression de signaux creux avec des modèles basés sur L1
Régression linéaire non négative
Régression quantile avec Scikit-Learn
Détection d'anomalies dans les données sur les vins
Explorer les hypothèses de la classification par K-Means
Explorer le lemme de Johnson-Lindenstrauss avec des projections aléatoires
Analyse en composantes principales avec la PCA Kernel
Analyse de l'ensemble de données de chiffres
Tracer la recherche sur grille des chiffres
Détection d'anomalies avec l'Isolation Forest
Comparer GPR et KRR sur un graphique
Scikit-Learn MLPClassifier : Stratégies d'apprentissage stochastique
Analyse discriminante linéaire pour la classification
Tracer la régression ridge du noyau
Tracer la régression forestière aléatoire multi-sortie
Comparaison entre la Recherche en grille et la Décimation successive
Tracer la sélection de modèles PCA vs FA
Modélisation de la distribution d'espèces
Mise à l'échelle et transformation des données
Démonstration des stratégies de KBinsDiscretizer
Comparaison de FeatureHasher et DictVectorizer
Pré-calcul de la matrice de Gram pour ElasticNet
Tracer Huber vs Ridge
Régression Lasso de Scikit-Learn
Récupération de signal sparse avec la Recherche Orthogonale Itérative
Tracer l'hyperplan séparateur avec SGD
Régression logistique étape par étape
Evaluation empirique de l'initialisation de K-Means
Analyse des Composantes du Voisinage
Estimation de la densité de noyau des distributions d'espèces
Regroupement par affinité de propagation
Dendrogramme de regroupement hiérarchique
Comparer Birch et MiniBatchKMeans
Comparaison des performances de Bisecting K-Means et de K-Means classique
Comparer les algorithmes de clustering
Démonstration de l'algorithme de regroupement HDBSCAN
Algorithme de regroupement Mean-Shift
Classification non supervisée avec K-Means
Estimation de l'erreur hors-bag (OOB) pour les forêts aléatoires
Importances de pixels avec forêt aléatoire parallèle d'arbres
Segmentation d'image avec agglomération hiérarchique
Tracer les patches de visages du dictionnaire
Processus gaussiens sur des structures de données discrètes
Classification spectrale pour la segmentation d'images
Règlement des égalités dans l'algorithme SVM
Tracer la régression GPR pour le CO2
Régression par arbre de décision amélioré
Décomposition biais-variance avec bagging
Modèle de régression Elastic-Net de Scikit-Learn
Tracer l'agglomération hiérarchique
Mapper des données à une distribution normale
Validation croisée avec des modèles linéaires
SVM : Hyperplan séparateur à marge maximale
SVM pour les classes déséquilibrées
Techniques de prétraitement dans Scikit-Learn
Métriques de regroupement agglomératif
Classifieur de régression logistique sur l'ensemble de données Iris
Classifieur multi-classe SGD de Scikit-Learn
Analyse en composantes principales incrémentales sur l'ensemble de données Iris
Estimation de la covariance inverse sparse
Classification par centroïde le plus proche
Prédictions probabilistes avec la classification par processus gaussien
Contraintes monotones dans le gradient boosting
Matrice de confusion de Scikit-Learn
Reconnaissance de chiffres écrits à la main
Régularisation du Gradient Boosting
Apprentissage par propagation d'étiquettes
Algorithmes d'apprentissage semi-supervisé
Techniques de régression de données non linéaires
Prédiction du prix du Bitcoin
Estimation de covariance par rétrécissement
Visualiser les données à haute dimension avec l'analyse en composantes principales multi-dimensionnelles (MDS)
Covariances du modèle de mélange gaussien
Sélection de modèle de mélange gaussien
Classifieurs semi-supervisés sur l'ensemble de données Iris
Approximation explicite de la carte de caractéristiques pour les noyaux RBF
Tracer l'ACP vs l'ADA
Apprentissage à variété sur des données sphériques
Décompositions de l'ensemble de données de visages
Tracé d'ensembles de données de classification aléatoires
Génération d'un ensemble de données à étiquetage multiple avec Scikit-Learn
Réduction de la dimension Swiss Roll et Swiss-Hole
Scikit-Learn Libsvm GUI
Quantification vectorielle avec KBinsDiscretizer
Regroupement hiérarchique avec Scikit-Learn
Transformer la cible de prédiction
Agglomération de fonctionnalités pour les données à haute dimension
Extraction de caractéristiques avec Scikit-Learn
Comparaison du test F et de l'information mutuelle
Ajustement de courbe avec la régression de Ridge bayésienne
Lasso et Elastic Net
Modèle de régression logistique
Sélection de caractéristiques conjointe avec Lasso multi-tâches
Application de techniques de régularisation avec SGD
Régression Theil-Sen avec Python Scikit-Learn
Reconstruction d'image par compression de données
Régression par arbre de décision
Régression arborescente à sortie multiple
Estimation de la densité de noyau simple en 1D
Local Outlier Factor pour la détection de nouveauté
Détection d'anomalies avec LOF
Estimation de la densité en utilisant la densité à noyau
Explorer le regroupement K-Means avec Python
Regroupement agglomératif sur l'ensemble de données des chiffres
Algorithme de clustering OPTICS
Biclustering dans Scikit-Learn
Trajectoire de régularisation de la régression logistique L1
Régression vectorielle support
Regroupement basé sur le centroïde
Modèles de réseau de neurones
Classification par processus gaussien sur l'ensemble de données Iris
Classification par processus gaussien
Classification par processus gaussien sur l'ensemble de données XOR
Modélisation prédictive non linéaire utilisant le processus gaussien
Ajuster un modèle de régression par processus gaussien
Régression par processus gaussien : noyaux
Spectral Clustering and Other Clustering Methods
Techniques de reconnaissance de motifs non linéaires
Sélectionner rapidement des modèles avec la validation croisée
Validation croisée sur l'ensemble de données des chiffres
Arrêt précoce du gradient boosting
Validation croisée en apprentissage automatique avec Python
Exemple de régression linéaire
Mesures et noyaux entre paires dans Scikit-Learn
Comparer les méthodes de décomposition croisée
Classification des plus proches voisins
Classification SVM à l'aide d'un noyau personnalisé
Classifieur SVM sur le jeu de données Iris
Imputation des valeurs manquantes
Classification par arbre de décision avec Python
Techniques d'approximation de noyau dans Scikit-Learn
Classification probabiliste avec le Bayésien naïf
Séparation des sources cachées
Analyse en composantes indépendantes avec FastICA et PCA
Classification des fleurs Iris avec Scikit-learn
Analyse en composantes principales
Codage sparse avec dictionnaire pré-calculé
PageRank de Wikipédia avec SVD aléatoire
Découpage des signaux en composantes
Comparaison d'estimateurs de covariance
Estimation de covariance robuste et pertinence des distances de Mahalanobis
Estimation de covariance robuste en Python
Estimation de la matrice de covariance avec Scikit-Learn
Apprentissage sur variété avec Scikit-Learn
Algorithmes de classification par analyse discriminante
Tracer la loi a priori de concentration
Modèles mixtes gaussiens
Régression non linéaire avec isotonie
Apprentissage actif avec propagation de labels
Méthode Bagging et Boosting
Exploration du clustering hiérarchique pour le regroupement
Guide de TensorFlow
Réseau de neurones superficiel implémenté avec TensorFlow 2
Sauvegarde et restauration d'un modèle TensorFlow 2
Entraîner le réseau de neurones de reconnaissance de chiffres manuscrits
Calcul du coefficient de régression ridge
Fondamentals de la régression linéaire
Classification par régression logistique avec Scikit-Learn
Prédiction des prix des logements à Beijing
Clustering basé sur la densité
Compression d'image à l'aide de Mini Batch K Means
Application de la classification basée sur la densité
Algorithme des K plus proches voisins
Régression Ridge et Régression Lasso
Classification du jeu de données d'évaluation de la sécurité des voitures
Perceptron et Réseau de Neurones Artificiel
Enseignant
Labby
Labby is the LabEx teacher.
Partager sur Google Classroom
Rejoignez notre Discord et apprenez ensemble
Rejoindre maintenantAvis des Utilisateurs
" Excellent exercise for beginners"
— Himanshu
" I really like how Labby clearly explains what I need to do and helps me find and fix my mistakes"
— ANDREW GUTIERREZ-MINA
Recommandé pour vous

