La Quête du Gestionnaire de Nœuds dans les Bois Murmureux

HadoopHadoopBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Au cœur des enchanteurs Bois Murmureux, un royaume mystique où les arbres dansaient à la mélodie du vent, vivait une sorcière sage et bienveillante appelée Willow. Son cottage se trouvait au cœur de la forêt, un sanctuaire de savoir et de magie anciens. La mission de Willow était de maintenir l'équilibre délicat du royaume forestier et de guider ceux qui lui demandaient conseil.

Un jour, un jeune apprenti nommé Aiden tomba dans les Bois Murmureux, à la recherche de sagesse et de guidance. Aiden avait entendu parler des exploits de Willow sur le puissant cluster Hadoop, un système capable de traiter d'énormes quantités de données avec une efficacité inégalée. Décidé à apprendre les secrets de cette technologie remarquable, Aiden chercha le cottage de Willow, espérant devenir son élève et découvrir les mystères du Gestionnaire de Nœuds de Hadoop.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop(("Hadoop")) -.-> hadoop/HadoopYARNGroup(["Hadoop YARN"]) hadoop/HadoopHDFSGroup -.-> hadoop/node("DataNode and NameNode Management") hadoop/HadoopYARNGroup -.-> hadoop/yarn_setup("Hadoop YARN Basic Setup") hadoop/HadoopYARNGroup -.-> hadoop/yarn_log("Yarn Commands log") hadoop/HadoopYARNGroup -.-> hadoop/yarn_node("Yarn Commands node") hadoop/HadoopYARNGroup -.-> hadoop/node_manager("Node Manager") subgraph Lab Skills hadoop/node -.-> lab-288988{{"La Quête du Gestionnaire de Nœuds dans les Bois Murmureux"}} hadoop/yarn_setup -.-> lab-288988{{"La Quête du Gestionnaire de Nœuds dans les Bois Murmureux"}} hadoop/yarn_log -.-> lab-288988{{"La Quête du Gestionnaire de Nœuds dans les Bois Murmureux"}} hadoop/yarn_node -.-> lab-288988{{"La Quête du Gestionnaire de Nœuds dans les Bois Murmureux"}} hadoop/node_manager -.-> lab-288988{{"La Quête du Gestionnaire de Nœuds dans les Bois Murmureux"}} end

Explorer le rôle du Gestionnaire de Nœuds

Dans cette étape, vous allez découvrir le rôle du Gestionnaire de Nœuds dans l'architecture Hadoop YARN.

Le Gestionnaire de Nœuds est un composant essentiel du framework Hadoop YARN (Yet Another Resource Negotiator). Il est responsable de la gestion des ressources des nœuds individuels au sein d'un cluster Hadoop. Chaque nœud du cluster exécute une instance de Gestionnaire de Nœuds, qui communique avec le Gestionnaire de Ressources pour recevoir et exécuter des tâches.

Voici comment le Gestionnaire de Nœuds fonctionne :

  1. Enregistrement du Nœud : Lorsque le Gestionnaire de Nœuds démarre, il s'enregistre auprès du Gestionnaire de Ressources, en fournissant des informations sur les ressources disponibles sur son nœud, telles que la CPU, la mémoire et l'espace disque.
  2. Gestion des Conteneurs : Le Gestionnaire de Nœuds est responsable de la création et de la gestion des conteneurs, qui sont des environnements d'exécution isolés pour les tâches. Chaque conteneur a une allocation de ressources spécifique définie par le Gestionnaire de Ressources.
  3. Exécution des Tâches : Lorsque le Gestionnaire de Ressources attribue une tâche à un nœud, le Gestionnaire de Nœuds crée un conteneur et lance la tâche à l'intérieur. Le Gestionnaire de Nœuds surveille l'exécution de la tâche et rapporte son statut au Gestionnaire de Ressources.
  4. Surveillance des Ressources : Le Gestionnaire de Nœuds surveille en permanence l'utilisation des ressources de chaque conteneur et de chaque nœud, pour s'assurer que les tâches ne consomment pas plus de ressources que celles allouées.
  5. Surveillance de la Santé : Le Gestionnaire de Nœuds surveille également la santé du nœud lui-même, en vérifiant s'il y a des problèmes tels que des défaillances de disque ou des problèmes de connectivité réseau. Si un nœud devient non sain, le Gestionnaire de Nœuds peut signaler cela au Gestionnaire de Ressources, qui peut alors prendre des mesures appropriées, telles que redémarrer ou reprogrammer les tâches.

Pour explorer le rôle du Gestionnaire de Nœuds, commençons par basculer sur l'utilisateur hadoop :

su - hadoop

Ensuite, nous pouvons vérifier l'état du Gestionnaire de Nœuds en exécutant la commande suivante :

yarn node -status <Node-Id>

Astuces : vous pouvez trouver l'identifiant du nœud (Node-Id) en utilisant la commande yarn node -list.

Cette commande affichera des informations sur le Gestionnaire de Nœuds en cours d'exécution, y compris son adresse, les ressources disponibles sur le nœud et les conteneurs actuellement en cours d'exécution.

hadoop:~/ $ yarn node -status iZj6c4hvgdd6j6qljtbxoaZ:39885          [21:53:30]
2024-03-23 21:54:08,741 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-23 21:54:09,119 INFO conf.Configuration: resource-types.xml not found
2024-03-23 21:54:09,128 INFO resource.ResourceUtils: Unable to find'resource-types.xml'.
Node Report :
	Node-Id : iZj6c4hvgdd6j6qljtbxoaZ:39885
	Rack : /default-rack
	Node-State : RUNNING
	Node-Http-Address : iZj6c4hvgdd6j6qljtbxoaZ:8042
	Last-Health-Update : Sat 23/Mar/24 09:52:56:762CST
...

Examiner les fichiers de journal du Gestionnaire de Nœuds

Dans cette étape, vous allez apprendre à examiner les fichiers de journal générés par le Gestionnaire de Nœuds, qui peuvent fournir des informations précieuses sur ses opérations et tout problème potentiel.

Les fichiers de journal du Gestionnaire de Nœuds se trouvent dans le répertoire /home/hadoop/hadoop/logs. Voici comment vous pouvez accéder et visualiser ces journaux :

  1. Premièrement, accédez au répertoire de journal :
cd /home/hadoop/hadoop/logs
  1. Liste des fichiers de journal disponibles :
ls

Vous devriez voir des fichiers comme log et out concernant le 'nodemanager'.

  1. Pour visualiser le contenu du fichier de journal, vous pouvez utiliser un éditeur de texte comme nano ou un outil de ligne de commande comme tail ou less. Par exemple :
tail -n 100 hadoop-hadoop-nodemanager-iZj6c0nuyqgkz1limqj5htZ.log

Cette commande affichera les 100 dernières lignes du fichier de journal du Gestionnaire de Nœuds.

...
2024-03-04 13:39:01,626 INFO org.apache.hadoop.yarn.server.nodemanager.NodeStatusUpdaterImpl: Registered with ResourceManager as iZj6c0nuyqgkz1limqj5htZ:41069 with total resource of <memory:8192, vCores:8>
...

Les fichiers de journal contiennent différents types d'informations, notamment :

  • Les événements de démarrage et d'arrêt du Gestionnaire de Nœuds
  • Les allocations et les lancers de conteneurs
  • Les données d'utilisation et de surveillance des ressources
  • Les messages d'erreur et les avertissements

En examinant les fichiers de journal, vous pouvez résoudre les problèmes liés au Gestionnaire de Nœuds, tels que les lancers de conteneurs échoués, la contention pour les ressources ou les problèmes de santé des nœuds.

Configurer les propriétés du Gestionnaire de Nœuds

Dans cette étape, vous allez apprendre à configurer les propriétés du Gestionnaire de Nœuds pour personnaliser son comportement et son allocation de ressources.

Les propriétés du Gestionnaire de Nœuds sont définies dans le fichier de configuration yarn-site.xml, généralement situé dans le répertoire /home/hadoop/hadoop/etc/hadoop. Voici comment vous pouvez modifier ces propriétés :

  1. Accédez au répertoire de configuration Hadoop :
cd /home/hadoop/hadoop/etc/hadoop
  1. Ouvrez le fichier yarn-site.xml dans un éditeur de texte :
vim yarn-site.xml
  1. Localisez la propriété yarn.nodemanager.resource.memory-mb, qui spécifie la quantité maximale de mémoire physique (en mégaoctets) qui peut être allouée pour les conteneurs sur le nœud. Vous pouvez ajuster cette valeur selon les exigences de mémoire de votre cluster.
<property>
  <name>yarn.nodemanager.resource.memory-mb</name>
  <value>8192</value>
</property>
  1. Une autre propriété importante est yarn.nodemanager.resource.cpu-vcores, qui détermine le nombre de coeurs CPU qui peuvent être alloués pour les conteneurs sur le nœud.
<property>
  <name>yarn.nodemanager.resource.cpu-vcores</name>
  <value>8</value>
</property>
  1. Après avoir effectué vos modifications, enregistrez le fichier et quittez l'éditeur de texte.

  2. Pour que les modifications prennent effet, vous devez redémarrer le Gestionnaire de Nœuds :

stop-yarn.sh
start-yarn.sh

En ajustant ces propriétés, vous pouvez configurer le Gestionnaire de Nœuds pour allouer des ressources selon les exigences de votre cluster et les caractéristiques de la charge de travail.

Sommaire

Dans ce laboratoire, vous avez exploré le monde du Gestionnaire de Nœuds d'Hadoop, un composant essentiel du framework YARN. Vous avez parcouru les enchanteurs Bois Murmureux, guidé par la sage sorcière Willow, et appris le rôle du Gestionnaire de Nœuds dans la gestion des ressources, l'exécution des tâches et le maintien de la santé d'un cluster Hadoop.

Par des étapes pratiques, vous avez acquis une expérience pratique dans l'examen de l'état du Gestionnaire de Nœuds, l'analyse de ses fichiers de journal et la configuration de ses propriétés pour personnaliser l'allocation de ressources. En maîtrisant le Gestionnaire de Nœuds, vous avez libéré le pouvoir de traiter efficacement d'énormes quantités de données dans l'écosystème Hadoop.

Ce laboratoire vous a non seulement équipé de compétences techniques, mais également favorisé une appréciation plus profonde du royaume magique du traitement de données. Tout comme Willow maintenait l'équilibre délicat du royaume forestier, vous possédez désormais les connaissances pour exploiter le pouvoir du Gestionnaire de Nœuds et assurer la performance optimale et la stabilité de votre cluster Hadoop.