Explore o Papel do Node Manager
Nesta etapa, você aprenderá sobre a função do Node Manager na arquitetura Hadoop YARN.
O Node Manager é um componente vital do framework Hadoop YARN (Yet Another Resource Negotiator). Ele é responsável por gerenciar os recursos de nós individuais dentro de um cluster Hadoop. Cada nó no cluster executa uma instância do Node Manager, que se comunica com o Resource Manager para receber e executar tarefas.
Veja como o Node Manager funciona:
- Registro do Nó (Node Registration): Quando um Node Manager é iniciado, ele se registra no Resource Manager, fornecendo informações sobre os recursos disponíveis em seu nó, como CPU, memória e espaço em disco.
- Gerenciamento de Container (Container Management): O Node Manager é responsável por criar e gerenciar containers, que são ambientes de execução isolados para tarefas. Cada container tem uma alocação de recursos específica definida pelo Resource Manager.
- Execução de Tarefas (Task Execution): Quando o Resource Manager atribui uma tarefa a um nó, o Node Manager cria um container e inicia a tarefa dentro dele. O Node Manager monitora a execução da tarefa e relata seu status de volta ao Resource Manager.
- Monitoramento de Recursos (Resource Monitoring): O Node Manager monitora continuamente o uso de recursos de cada container e nó, garantindo que as tarefas não consumam mais recursos do que o alocado.
- Monitoramento de Saúde (Health Monitoring): O Node Manager também monitora a saúde do próprio nó, verificando problemas como falhas de disco ou problemas de conectividade de rede. Se um nó ficar com problemas, o Node Manager pode relatar isso ao Resource Manager, que pode então tomar as ações apropriadas, como reiniciar ou reagendar tarefas.
Para explorar a função do Node Manager, vamos primeiro mudar para o usuário hadoop:
su - hadoop
Em seguida, podemos verificar o status do Node Manager executando o seguinte comando:
yarn node -status <Node-Id>
Dicas: você pode encontrar o 'Node-Id' com o comando yarn node -list.
Este comando exibirá informações sobre o Node Manager em execução, incluindo seu endereço, os recursos disponíveis no nó e os containers atualmente em execução.
hadoop:~/ $ yarn node -status iZj6c4hvgdd6j6qljtbxoaZ:39885 [21:53:30]
2024-03-23 21:54:08,741 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-23 21:54:09,119 INFO conf.Configuration: resource-types.xml not found
2024-03-23 21:54:09,128 INFO resource.ResourceUtils: Unable to find 'resource-types.xml'.
Node Report :
Node-Id : iZj6c4hvgdd6j6qljtbxoaZ:39885
Rack : /default-rack
Node-State : RUNNING
Node-Http-Address : iZj6c4hvgdd6j6qljtbxoaZ:8042
Last-Health-Update : Sat 23/Mar/24 09:52:56:762CST
...