Dendrogramme de regroupement hiérarchique

Machine LearningMachine LearningBeginner
Pratiquer maintenant

This tutorial is from open-source community. Access the source code

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans ce laboratoire, nous allons apprendre à tracer le dendrogramme correspondant à un regroupement hiérarchique en utilisant AgglomerativeClustering et la méthode dendrogramme disponible dans scipy.

Conseils sur la machine virtuelle

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez votre feedback après la session, et nous résoudrons rapidement le problème pour vous.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"]) sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"]) ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"]) sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/cluster("Clustering") sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets") ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn") subgraph Lab Skills sklearn/cluster -.-> lab-49063{{"Dendrogramme de regroupement hiérarchique"}} sklearn/datasets -.-> lab-49063{{"Dendrogramme de regroupement hiérarchique"}} ml/sklearn -.-> lab-49063{{"Dendrogramme de regroupement hiérarchique"}} end

Importez les bibliothèques nécessaires

Nous allons commencer par importer les bibliothèques nécessaires pour ce laboratoire.

import numpy as np
from matplotlib import pyplot as plt
from scipy.cluster.hierarchy import dendrogram
from sklearn.datasets import load_iris
from sklearn.cluster import AgglomerativeClustering

Chargez le jeu de données

Nous allons utiliser la fonction load_iris() du module sklearn.datasets pour charger le jeu de données iris.

iris = load_iris()
X = iris.data

Créez le modèle

Ensuite, nous allons créer le modèle de regroupement hiérarchique en utilisant la fonction AgglomerativeClustering() du module sklearn.cluster.

model = AgglomerativeClustering(distance_threshold=0, n_clusters=None)

Ajustez le modèle

Nous allons ajuster le modèle de regroupement hiérarchique en utilisant la méthode fit() de l'objet modèle.

model = model.fit(X)

Tracez le dendrogramme

Nous allons tracer le dendrogramme à l'aide de la fonction dendrogram() du module scipy.cluster.hierarchy et de la fonction plot_dendrogram() définie dans le code original.

plt.title("Hierarchical Clustering Dendrogram")
plot_dendrogram(model, truncate_mode="level", p=3)
plt.xlabel("Number of points in node (or index of point if no parenthesis).")
plt.show()

Sommaire

Dans ce laboratoire, nous avons appris à tracer le dendrogramme correspondant à un regroupement hiérarchique en utilisant AgglomerativeClustering et la méthode dendrogramme disponible dans scipy. Nous avons chargé le jeu de données iris, créé un modèle de regroupement hiérarchique et ajusté le modèle. Enfin, nous avons tracé le dendrogramme à l'aide de la fonction dendrogram() du module scipy.cluster.hierarchy et de la fonction plot_dendrogram() définie dans le code original.