La búsqueda del Administrador de Nodos en los Bosques de Susurros

HadoopHadoopBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En lo profundo del encantado Bosque de Susurros, un reino místico donde los árboles bailaban al compás de la melodía del viento, vivía una sabia y benevolente hechicera llamada Sauce. Su cabaña se encontraba en el corazón del bosque, un santuario de conocimiento y magia antigua. La misión de Sauce era mantener el delicado equilibrio del reino del bosque y guiar a aquellos que buscaban su consejo.

Un día, un joven aprendiz llamado Aiden tropezó en el Bosque de Susurros, buscando sabiduría y orientación. Aiden había escuchado relatos de la maestría de Sauce sobre el poderoso clúster Hadoop, un sistema que podía procesar grandes cantidades de datos con una eficiencia inigualable. Determinado a aprender las maneras de esta tecnología notable, Aiden buscó la cabaña de Sauce, esperando convertirse en su estudiante y desentrañar los secretos del Administrador de Nodos de Hadoop.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop(("Hadoop")) -.-> hadoop/HadoopYARNGroup(["Hadoop YARN"]) hadoop/HadoopHDFSGroup -.-> hadoop/node("DataNode and NameNode Management") hadoop/HadoopYARNGroup -.-> hadoop/yarn_setup("Hadoop YARN Basic Setup") hadoop/HadoopYARNGroup -.-> hadoop/yarn_log("Yarn Commands log") hadoop/HadoopYARNGroup -.-> hadoop/yarn_node("Yarn Commands node") hadoop/HadoopYARNGroup -.-> hadoop/node_manager("Node Manager") subgraph Lab Skills hadoop/node -.-> lab-288988{{"La búsqueda del Administrador de Nodos en los Bosques de Susurros"}} hadoop/yarn_setup -.-> lab-288988{{"La búsqueda del Administrador de Nodos en los Bosques de Susurros"}} hadoop/yarn_log -.-> lab-288988{{"La búsqueda del Administrador de Nodos en los Bosques de Susurros"}} hadoop/yarn_node -.-> lab-288988{{"La búsqueda del Administrador de Nodos en los Bosques de Susurros"}} hadoop/node_manager -.-> lab-288988{{"La búsqueda del Administrador de Nodos en los Bosques de Susurros"}} end

Explorar el papel del Administrador de Nodos

En este paso, aprenderá sobre el papel del Administrador de Nodos en la arquitectura de Hadoop YARN.

El Administrador de Nodos es un componente esencial del marco de Hadoop YARN (Yet Another Resource Negotiator). Es responsable de administrar los recursos de los nodos individuales dentro de un clúster de Hadoop. Cada nodo en el clúster ejecuta una instancia del Administrador de Nodos, que se comunica con el Administrador de Recursos para recibir y ejecutar tareas.

Aquí está cómo funciona el Administrador de Nodos:

  1. Registro del nodo: Cuando un Administrador de Nodos se inicia, se registra con el Administrador de Recursos, proporcionando información sobre los recursos disponibles en su nodo, como CPU, memoria y espacio en disco.
  2. Gestión de contenedores: El Administrador de Nodos es responsable de crear y administrar contenedores, que son entornos de ejecución aislados para tareas. Cada contenedor tiene una asignación de recursos específica definida por el Administrador de Recursos.
  3. Ejecución de tareas: Cuando el Administrador de Recursos asigna una tarea a un nodo, el Administrador de Nodos crea un contenedor y lanza la tarea dentro de él. El Administrador de Nodos supervisa la ejecución de la tarea y le informa al Administrador de Recursos sobre su estado.
  4. Monitoreo de recursos: El Administrador de Nodos monitorea continuamente el uso de recursos de cada contenedor y nodo, asegurándose de que las tareas no consuman más recursos de los asignados.
  5. Monitoreo de salud: El Administrador de Nodos también monitorea la salud del propio nodo, comprobando problemas como fallos de disco o problemas de conectividad de red. Si un nodo se vuelve inestable, el Administrador de Nodos puede informarlo al Administrador de Recursos, que luego puede tomar medidas adecuadas, como reiniciar o reprogramar tareas.

Para explorar el papel del Administrador de Nodos, primero cambiemos al usuario hadoop:

su - hadoop

A continuación, podemos comprobar el estado del Administrador de Nodos ejecutando el siguiente comando:

yarn node -status <Node-Id>

Consejos: puede encontrar el 'Node-Id' con el comando yarn node -list.

Este comando mostrará información sobre el Administrador de Nodos en ejecución, incluyendo su dirección, los recursos disponibles en el nodo y los contenedores en ejecución actualmente.

hadoop:~/ $ yarn node -status iZj6c4hvgdd6j6qljtbxoaZ:39885          [21:53:30]
2024-03-23 21:54:08,741 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-23 21:54:09,119 INFO conf.Configuration: resource-types.xml not found
2024-03-23 21:54:09,128 INFO resource.ResourceUtils: Unable to find'resource-types.xml'.
Node Report :
	Node-Id : iZj6c4hvgdd6j6qljtbxoaZ:39885
	Rack : /default-rack
	Node-State : RUNNING
	Node-Http-Address : iZj6c4hvgdd6j6qljtbxoaZ:8042
	Last-Health-Update : Sat 23/Mar/24 09:52:56:762CST
...

Examinar los archivos de registro del Administrador de Nodos

En este paso, aprenderá a examinar los archivos de registro generados por el Administrador de Nodos, que pueden proporcionar información valiosa sobre sus operaciones y cualquier problema potencial.

Los archivos de registro del Administrador de Nodos se encuentran en el directorio /home/hadoop/hadoop/logs. Aquí está cómo puede acceder y ver estos registros:

  1. Primero, navegue hasta el directorio de registro:
cd /home/hadoop/hadoop/logs
  1. Liste los archivos de registro disponibles:
ls

Debería ver archivos como log y out relacionados con 'nodemanager'.

  1. Para ver el contenido del archivo de registro, puede usar un editor de texto como nano o una herramienta de línea de comandos como tail o less. Por ejemplo:
tail -n 100 hadoop-hadoop-nodemanager-iZj6c0nuyqgkz1limqj5htZ.log

Este comando mostrará las últimas 100 líneas del archivo de registro del Administrador de Nodos.

...
2024-03-04 13:39:01,626 INFO org.apache.hadoop.yarn.server.nodemanager.NodeStatusUpdaterImpl: Registered with ResourceManager as iZj6c0nuyqgkz1limqj5htZ:41069 with total resource of <memory:8192, vCores:8>
...

Los archivos de registro contienen varios tipos de información, incluyendo:

  • Eventos de inicio y cierre del Administrador de Nodos
  • Asignaciones y lanzamiento de contenedores
  • Uso de recursos y datos de monitoreo
  • Mensajes de error y advertencias

Al examinar los archivos de registro, puede solucionar problemas relacionados con el Administrador de Nodos, como lanzamiento de contenedores fallidos, conflicto de recursos o problemas de salud del nodo.

Configurar las propiedades del Administrador de Nodos

En este paso, aprenderá a configurar las propiedades del Administrador de Nodos para personalizar su comportamiento y la asignación de recursos.

Las propiedades del Administrador de Nodos se definen en el archivo de configuración yarn-site.xml, que generalmente se encuentra en el directorio /home/hadoop/hadoop/etc/hadoop. Aquí está cómo puede modificar estas propiedades:

  1. Navegue hasta el directorio de configuración de Hadoop:
cd /home/hadoop/hadoop/etc/hadoop
  1. Abra el archivo yarn-site.xml en un editor de texto:
vim yarn-site.xml
  1. Localice la propiedad yarn.nodemanager.resource.memory-mb, que especifica la cantidad máxima de memoria física (en megabytes) que se puede asignar para contenedores en el nodo. Puede ajustar este valor según los requisitos de memoria de su clúster.
<property>
  <name>yarn.nodemanager.resource.memory-mb</name>
  <value>8192</value>
</property>
  1. Otra propiedad importante es yarn.nodemanager.resource.cpu-vcores, que determina el número de núcleos de CPU que se pueden asignar para contenedores en el nodo.
<property>
  <name>yarn.nodemanager.resource.cpu-vcores</name>
  <value>8</value>
</property>
  1. Después de hacer sus cambios, guarde el archivo y salga del editor de texto.

  2. Para que los cambios surtan efecto, debe reiniciar el Administrador de Nodos:

stop-yarn.sh
start-yarn.sh

Al ajustar estas propiedades, puede configurar el Administrador de Nodos para asignar recursos según los requisitos de su clúster y las características de la carga de trabajo.

Resumen

En este laboratorio, exploró el mundo del Administrador de Nodos de Hadoop, un componente esencial del marco YARN. Emprendió un viaje por el encantado Bosque de Susurros, guiado por la sabia hechicera Sauce, y aprendió sobre el papel del Administrador de Nodos en la gestión de recursos, la ejecución de tareas y el mantenimiento de la salud de un clúster de Hadoop.

A través de pasos prácticos, adquirió experiencia práctica en examinar el estado del Administrador de Nodos, analizar sus archivos de registro y configurar sus propiedades para personalizar la asignación de recursos. Al dominar el Administrador de Nodos, desbloqueó el poder de procesar eficientemente grandes cantidades de datos dentro del ecosistema de Hadoop.

Este laboratorio no solo le equipó con habilidades técnicas, sino que también fomentó una mayor apreciación por el mundo mágico del procesamiento de datos. Al igual que Sauce mantenía el delicado equilibrio del reino del bosque, ahora posee el conocimiento para aprovechar el poder del Administrador de Nodos y garantizar el rendimiento óptimo y la estabilidad de su clúster de Hadoop.