Hadoop FS Shell mkdir

HadoopBeginner

はじめに

遠い惑星にある地球外基地に駐在する通信担当官として自分自身を想像してみてください。あなたの任務は、Hadoop 分散ファイルシステム(HDFS)に格納された通信データを管理することです。今日は、Hadoop FS シェルのmkdirコマンドを使ってディレクトリを作成し、データを効果的に整理する方法を学びます。

新しいディレクトリを作成する

このステップでは、HDFS に新しいディレクトリ「communications」を作成します。

  1. hadoopユーザーに切り替えます。

    su - hadoop
    
  2. HDFS 内の現在のディレクトリを確認します。

    hdfs dfs -ls /
    

    この時点で上記のコマンドを実行すると、HDFS にはディレクトリが存在しないことがわかります。

  3. 新しいディレクトリ「communications」を作成します。

    hdfs dfs -mkdir /communications
    
  4. コマンドの目的を説明し、出力を解釈します。

    コマンドhdfs dfs -mkdir /communicationsは、Hadoop 分散ファイルシステム(HDFS)に新しいディレクトリ「communications」を作成するために使用されます。コマンドを分解してみましょう。

    • hdfs:HDFS と対話するために使用されるコマンドラインツールです。
    • dfs:「Distributed File System」を表し、hdfs ツールのサブコマンドです。
    • -mkdir:新しいディレクトリを作成することを指定するオプションです。
    • communications:作成したいディレクトリの名前です。
  5. ディレクトリが正常に作成されたことを確認します。

    hdfs dfs -ls /
    

このコマンドの後、「communications」という名前のディレクトリが見つかった場合、このステップは完了したことになります。

いくつかの新しいサブディレクトリを作成する

このステップでは、「communications」ディレクトリ内にサブディレクトリを作成して、通信データをさらに整理します。

  1. 「reports」という名前のサブディレクトリを作成します。

    hdfs dfs -mkdir /communications/reports
    
  2. 「messages」という名前の別のサブディレクトリを作成します。

    hdfs dfs -mkdir /communications/messages
    
  3. サブディレクトリが正常に作成されたことを確認します。

    hdfs dfs -ls /communications
    

このコマンドを実行した後、「communications」ディレクトリの下に「reports」と「messages」のサブディレクトリが表示される場合、実験が正常に完了したことを示します。

まとめ

この実験では、Hadoop FS シェルのmkdirコマンドを使って HDFS にディレクトリを作成する方法を学びました。データを構造化されたディレクトリに整理することで、Hadoop エコシステム内の通信ファイルを効率的に管理してアクセスできます。この実験は、Hadoop HDFS のファイル管理とディレクトリ構造の構築におけるあなたのスキルを向上させることを目的としています。

また、学習過程では、このコマンドと Linux のmkdirコマンドを類推することもできます。