ハドープ Yarn コマンド | Jar ファイル管理 | デートピアのデータ処理

はじめに

情報が純粋な知識の流れのように流れる空想的な国、デートピアに住んでいた奇妙な存在、デーティナがいました。デーティナの唯一の目的は、データの世界の複雑な仕組みを理解し、その可能性を引き出すことでした。ある日、デーティナは膨大な量のデータを処理することができる強力なツール、ハドープと呼ばれる神秘的な力に出会いました。しかし、その機能を最大限に引き出すには、デーティナは Yarn コマンドを実行し、jar ファイルを操作する技術を習得する必要がありました。

この実験の目的は、ハドープエコシステム内で Yarn コマンドと jar ファイルを利用するプロセスを通じてデーティナを案内することです。この実験を完了することで、デーティナは効率的にアプリケーションを管理して実行するために必要なスキルを身につけ、デートピアの国でハドープの真の可能性を解き放つことができます。

ハドープ環境の探索

このステップでは、ハドープ環境に慣れ親しみ、すべての必要なコンポーネントが適切に構成されていることを確認します。

まず、hadoop ユーザーに切り替えます。

su - hadoop

次に、ハドープのバージョンを確認します。

hadoop version

以下のような出力が表示されるはずです。

Hadoop 3.3.6
...

利用可能な jar ファイルの一覧表示

このステップでは、ハドープ環境において利用可能な jar ファイルを一覧表示する方法を学びます。これらの jar ファイルには、Yarn コマンドを使用して実行できる事前に構築されたアプリケーションとユーティリティが含まれています。

ls $HADOOP_HOME/share/hadoop/mapreduce/*.jar

出力には、$HADOOP_HOME/share/hadoop/mapreduce ディレクトリにある jar ファイルの一覧が表示されます。これらの jar ファイルは、Yarn コマンドとともに様々なアプリケーションとユーティリティを実行するために使用できます。

/home/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-app-3.3.6.jar
/home/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-common-3.3.6.jar
/home/hadoop/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-client-core-3.3.6.jar
...

Yarn を使って jar ファイルを実行する

このステップでは、yarn jar コマンドを使って jar ファイルを実行する方法を学びます。例として hadoop-mapreduce-examples jar ファイルを使用します。

さて、hadoop-mapreduce-examples jar から WordCount の例を実行します。

yarn jar $HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-examples-3.3.6.jar wordcount /home/hadoop/input /home/hadoop/output

ヒント：hadoop fs -cat /home/hadoop/input/* でファイルの内容を読むことができます。

入力ファイルの内容：

hello world
hello labex
hello Hadoop
hello Java

上記のコマンドでは、jar ファイル hadoop-mapreduce-examples-3.3.6.jar、実行するアプリケーション wordcount、入力および出力パス /home/hadoop/input および /home/hadoop/output をそれぞれ指定しています。

コマンドを実行した後、以下に似た出力が表示されるはずです。

hadoop:~/ $ hadoop fs -cat /home/hadoop/output/*                     [19:54:17]
Hadoop 1
Java 1
hello 4
labex 1
world 1

Yarn アプリケーションの監視

このステップでは、様々なコマンドを使って Yarn アプリケーションを監視および管理する方法を学びます。

実行中の Yarn アプリケーションを一覧表示する：

yarn application -list

端末の例の出力：

UBMITTED, ACCEPTED, RUNNING, FINISHED, FAILED, KILLED] and tags: []):1
                Application-Id     Application-Name     Application-Type       User      Queue              State        Final-State        Progress                        Tracking-URL
application_1711070937750_0001           word count            MAPREDUCE     hadoop    default           FINISHED          SUCCEEDED            100% http://iZj6cdxwclh8pms0k1vyyhZ:19888/jobhistory/job/job_1711070937750_0001

アプリケーションの状態を取得する

yarn application -status <application_id>

端末の例の出力：

hadoop:~/ $ yarn application -status application_1711070937750_0001   [9:31:46]
2024-03-22 09:33:12,186 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
2024-03-22 09:33:12,521 INFO conf.Configuration: resource-types.xml not found
2024-03-22 09:33:12,522 INFO resource.ResourceUtils: Unable to find'resource-types.xml'.
Application Report :
 Application-Id : application_1711070937750_0001
 Application-Name : word count
 Application-Type : MAPREDUCE
 User : hadoop
 Queue : default
 Application Priority : 0
 Start-Time : 1711071042168
 Finish-Time : 1711071057334

実行中のアプリケーションを終了する

yarn application -kill <application_id>

端末の例の出力：

hadoop:~/ $ yarn application -kill application_1711070937750_0001     [9:33:14]
2024-03-22 09:34:45,075 INFO client.DefaultNoHARMFailoverProxyProvider: Connecting to ResourceManager at /0.0.0.0:8032
Application application_1711070937750_0001 has already finished

ヒント：yarn application -list -appStates ALL ですべてのアプリケーションを一覧表示できます。

yarn application コマンドを使うと、Yarn アプリケーションを一覧表示、監視、管理できます。それぞれのサブコマンドを使って、アプリケーションの状態を取得したり、実行中のアプリケーションを終了させることもできます。

まとめ

この実験では、私たちはデータの世界であるデートピアを旅しました。好奇心旺盛な存在であるデーティナは、ハドープの Yarn コマンドと jar ファイルの真の可能性を解き明かそうとしました。この実験を完了することで、デーティナは利用可能な jar ファイルを一覧表示し、yarn jarコマンドを使ってアプリケーションを実行し、Yarn アプリケーションを監視および管理するという貴重なスキルを身につけました。

実践的な演習を通じて、デーティナはハドープ環境を操り、WordCount のような事前に構築されたアプリケーションを実行し、様々な Yarn コマンドを使って実行中のアプリケーションを監視する方法を学びました。これらのスキルは、デーティナにハドープの力を引き出す力を与えるだけでなく、データの世界のさらなる探求と習得のための基盤を築きます。

この実験は、私に技術的な概念を空想的な物語と融合させた魅力的で情報に富んだ学習体験を作り出すことを求めました。架空の世界と身近なキャラクターをデザインすることで、特に初心者にとって学習プロセスをより楽しくてアクセスしやすくすることを目指しました。また、スムーズな学習の旅を保証するために、明確な指示、サンプルコードの断片、詳細な説明を提供することに焦点を当てました。

ハドープ Yarn を使ったデートピア

はじめに

ハドープ環境の探索

利用可能な jar ファイルの一覧表示

Yarn を使って jar ファイルを実行する

Yarn アプリケーションの監視

まとめ