Explorar el papel del Administrador de Nodos
En este paso, aprenderá sobre el papel del Administrador de Nodos en la arquitectura de Hadoop YARN.
El Administrador de Nodos es un componente esencial del marco de Hadoop YARN (Yet Another Resource Negotiator). Es responsable de administrar los recursos de los nodos individuales dentro de un clúster de Hadoop. Cada nodo en el clúster ejecuta una instancia del Administrador de Nodos, que se comunica con el Administrador de Recursos para recibir y ejecutar tareas.
Aquí está cómo funciona el Administrador de Nodos:
- Registro del nodo: Cuando un Administrador de Nodos se inicia, se registra con el Administrador de Recursos, proporcionando información sobre los recursos disponibles en su nodo, como CPU, memoria y espacio en disco.
- Gestión de contenedores: El Administrador de Nodos es responsable de crear y administrar contenedores, que son entornos de ejecución aislados para tareas. Cada contenedor tiene una asignación de recursos específica definida por el Administrador de Recursos.
- Ejecución de tareas: Cuando el Administrador de Recursos asigna una tarea a un nodo, el Administrador de Nodos crea un contenedor y lanza la tarea dentro de él. El Administrador de Nodos supervisa la ejecución de la tarea y le informa al Administrador de Recursos sobre su estado.
- Monitoreo de recursos: El Administrador de Nodos monitorea continuamente el uso de recursos de cada contenedor y nodo, asegurándose de que las tareas no consuman más recursos de los asignados.
- Monitoreo de salud: El Administrador de Nodos también monitorea la salud del propio nodo, comprobando problemas como fallos de disco o problemas de conectividad de red. Si un nodo se vuelve inestable, el Administrador de Nodos puede informarlo al Administrador de Recursos, que luego puede tomar medidas adecuadas, como reiniciar o reprogramar tareas.
Para explorar el papel del Administrador de Nodos, primero cambiemos al usuario hadoop
:
su - hadoop
A continuación, podemos comprobar el estado del Administrador de Nodos ejecutando el siguiente comando:
yarn node -status <Node-Id>
Consejos: puede encontrar el 'Node-Id' con el comando yarn node -list
.
Este comando mostrará información sobre el Administrador de Nodos en ejecución, incluyendo su dirección, los recursos disponibles en el nodo y los contenedores en ejecución actualmente.
hadoop:~/ $ yarn node -status iZj6c4hvgdd6j6qljtbxoaZ:39885 [21:53:30]
2024-03-23 21:54:08,741 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-23 21:54:09,119 INFO conf.Configuration: resource-types.xml not found
2024-03-23 21:54:09,128 INFO resource.ResourceUtils: Unable to find'resource-types.xml'.
Node Report :
Node-Id : iZj6c4hvgdd6j6qljtbxoaZ:39885
Rack : /default-rack
Node-State : RUNNING
Node-Http-Address : iZj6c4hvgdd6j6qljtbxoaZ:8042
Last-Health-Update : Sat 23/Mar/24 09:52:56:762CST
...