はじめに
Hadoop YARN (Yet Another Resource Negotiator) は、Hadoop エコシステムの重要なコンポーネントであり、Hadoop クラスタ内のリソースの管理と割り当てを担当します。このチュートリアルでは、Hadoop YARN サービスの起動と停止の手順を案内し、Hadoop クラスタがスムーズに動作するようにします。
💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください
Hadoop YARN (Yet Another Resource Negotiator) は、Hadoop エコシステムの重要なコンポーネントであり、Hadoop クラスタ内のリソースの管理と割り当てを担当します。このチュートリアルでは、Hadoop YARN サービスの起動と停止の手順を案内し、Hadoop クラスタがスムーズに動作するようにします。
Hadoop YARN (Yet Another Resource Negotiator) は、Apache Hadoop エコシステムのリソース管理およびジョブスケジューリングのコンポーネントです。これは、以前の MapReduce 1.0 (MRv1 とも呼ばれる) フレームワークの制限を解消するために Hadoop 2.0 で導入されました。
YARN は、Hadoop クラスタのコンピュートリソース (CPU、メモリ、ストレージなど) を管理し、それらのリソース上でユーザーアプリケーションの実行をスケジューリングする責任があります。MapReduce 1.0 のモノリシックな設計と比較して、より柔軟で拡張性の高いアーキテクチャを提供します。
Hadoop YARN の主なコンポーネントは次のとおりです。
YARN アプリケーションを実行する典型的なワークフローは次のとおりです。
リソース管理とジョブスケジューリングの関心事を実際のデータ処理から分離することで、YARN は Hadoop クラスタ上で大規模な分散アプリケーションを実行するためのより拡張性が高く耐障害性のあるアーキテクチャを提供します。
Hadoop YARN サービスを起動するには、Hadoop クラスタが適切に構成され、必要なデーモンが実行されていることを確認する必要があります。
core-site.xml
、hdfs-site.xml
、yarn-site.xml
) が適切に設定されていることを確認します。sudo /usr/local/hadoop/sbin/start-dfs.sh
sudo /usr/local/hadoop/sbin/start-yarn.sh
sudo /usr/local/hadoop/bin/yarn node -list
このコマンドは、すべてのアクティブな Node Manager とそのリソース使用状況を一覧表示します。
YARN の Web UI にアクセスします。
http://<resource-manager-host>:8088
http://<node-manager-host>:8042
これらの Web インターフェイスは、リソースの使用率、実行中のアプリケーションなど、YARN クラスタの視覚的な概要を提供します。
これらの手順に従うことで、Hadoop YARN サービスを正常に起動し、クラスタを分散アプリケーションの実行に備えることができます。
Hadoop YARN サービスをシャットダウンする必要がある場合、以下の手順に従って YARN コンポーネントを正常に停止することができます。
sudo /usr/local/hadoop/sbin/stop-yarn.sh
このコマンドは、クラスタノード上で実行されているすべての Node Manager デーモンを停止します。
sudo /usr/local/hadoop/bin/yarn rmadmin -shutdownRM
このコマンドは、Resource Manager デーモンを正常にシャットダウンします。
YARN サービスを停止した後、必要に応じて HDFS サービス (NameNode と DataNode) も停止することができます。
sudo /usr/local/hadoop/sbin/stop-dfs.sh
このコマンドは、クラスタ上で実行されている HDFS デーモンを停止します。
プロセスの状態を確認することで、YARN および HDFS サービスのシャットダウンを確認することができます。
sudo jps
このコマンドは、システム上で実行されているすべての Java プロセスを一覧表示します。サービスを停止した後は、Hadoop に関連するプロセスが表示されないはずです。
これらの手順に従うことで、Hadoop YARN サービスを正常に停止し、必要に応じて HDFS サービスも停止することができます。これは、メンテナンスを行う場合、クラスタをアップグレードする場合、または何らかの理由でシステムをシャットダウンする場合に役立ちます。
このチュートリアルでは、Hadoop YARN サービスを管理するための包括的なガイドを提供し、これらのサービスを効果的に起動および停止する手順をカバーしています。Hadoop YARN のライフサイクルを制御する方法を理解することで、Hadoop クラスタの最適なパフォーマンスと信頼性を確保し、データ処理のニーズにとって貴重なリソースにすることができます。