YARN 작업 제출
YARN 서비스가 실행 중이므로, YARN 의 리소스 할당 및 스케줄링 기능을 테스트하기 위해 샘플 작업을 제출해 보겠습니다.
먼저, 단어 수를 계산할 텍스트 내용이 포함된 input.txt라는 입력 텍스트 파일을 Hadoop 파일 시스템에 준비합니다.
echo -e "Hello World\nHello Hadoop\nYARN is cool" > input.txt
hadoop fs -put input.txt /input.txt
그런 다음, 예제 프로그램의 JAR 파일은 Hadoop 설치 디렉토리에서 찾을 수 있으며, 일반적으로 $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar에 위치합니다. 이 JAR 파일을 사용하여 Word Count 프로그램을 실행할 수 있습니다.
yarn jar /home/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /input.txt /output
이 명령은 MapReduce 작업을 YARN ResourceManager 에 제출하며, ResourceManager 는 사용 가능한 NodeManager 에서 리소스를 할당하고 작업을 예약합니다.
작업이 완료되면 /output 디렉토리에서 출력을 볼 수 있습니다.
hdfs dfs -cat /output/part-r-00000
이것은 단어 수 출력을 표시해야 합니다.
Hadoop 1
Hello 2
World 1
YARN 1
cool 1
is 1