Explorer le rôle du Gestionnaire de Nœuds
Dans cette étape, vous allez découvrir le rôle du Gestionnaire de Nœuds dans l'architecture Hadoop YARN.
Le Gestionnaire de Nœuds est un composant essentiel du framework Hadoop YARN (Yet Another Resource Negotiator). Il est responsable de la gestion des ressources des nœuds individuels au sein d'un cluster Hadoop. Chaque nœud du cluster exécute une instance de Gestionnaire de Nœuds, qui communique avec le Gestionnaire de Ressources pour recevoir et exécuter des tâches.
Voici comment le Gestionnaire de Nœuds fonctionne :
- Enregistrement du Nœud : Lorsque le Gestionnaire de Nœuds démarre, il s'enregistre auprès du Gestionnaire de Ressources, en fournissant des informations sur les ressources disponibles sur son nœud, telles que la CPU, la mémoire et l'espace disque.
- Gestion des Conteneurs : Le Gestionnaire de Nœuds est responsable de la création et de la gestion des conteneurs, qui sont des environnements d'exécution isolés pour les tâches. Chaque conteneur a une allocation de ressources spécifique définie par le Gestionnaire de Ressources.
- Exécution des Tâches : Lorsque le Gestionnaire de Ressources attribue une tâche à un nœud, le Gestionnaire de Nœuds crée un conteneur et lance la tâche à l'intérieur. Le Gestionnaire de Nœuds surveille l'exécution de la tâche et rapporte son statut au Gestionnaire de Ressources.
- Surveillance des Ressources : Le Gestionnaire de Nœuds surveille en permanence l'utilisation des ressources de chaque conteneur et de chaque nœud, pour s'assurer que les tâches ne consomment pas plus de ressources que celles allouées.
- Surveillance de la Santé : Le Gestionnaire de Nœuds surveille également la santé du nœud lui-même, en vérifiant s'il y a des problèmes tels que des défaillances de disque ou des problèmes de connectivité réseau. Si un nœud devient non sain, le Gestionnaire de Nœuds peut signaler cela au Gestionnaire de Ressources, qui peut alors prendre des mesures appropriées, telles que redémarrer ou reprogrammer les tâches.
Pour explorer le rôle du Gestionnaire de Nœuds, commençons par basculer sur l'utilisateur hadoop
:
su - hadoop
Ensuite, nous pouvons vérifier l'état du Gestionnaire de Nœuds en exécutant la commande suivante :
yarn node -status <Node-Id>
Astuces : vous pouvez trouver l'identifiant du nœud (Node-Id
) en utilisant la commande yarn node -list
.
Cette commande affichera des informations sur le Gestionnaire de Nœuds en cours d'exécution, y compris son adresse, les ressources disponibles sur le nœud et les conteneurs actuellement en cours d'exécution.
hadoop:~/ $ yarn node -status iZj6c4hvgdd6j6qljtbxoaZ:39885 [21:53:30]
2024-03-23 21:54:08,741 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-23 21:54:09,119 INFO conf.Configuration: resource-types.xml not found
2024-03-23 21:54:09,128 INFO resource.ResourceUtils: Unable to find'resource-types.xml'.
Node Report :
Node-Id : iZj6c4hvgdd6j6qljtbxoaZ:39885
Rack : /default-rack
Node-State : RUNNING
Node-Http-Address : iZj6c4hvgdd6j6qljtbxoaZ:8042
Last-Health-Update : Sat 23/Mar/24 09:52:56:762CST
...