パーティショニングされたテーブルにデータを読み込む
この手順では、前の手順で作成したパーティショニングされたテーブルにサンプルの飛行ログデータを読み込みます。
まず、いくつかのサンプルの飛行ログデータファイルを作成します。
cat > /home/hadoop/flight_logs_1.txt << EOF
FL001,Andromeda Explorer,2023-06-01 08:00:00,2023-06-02 12:30:00,Andromeda Galaxy
FL002,Milky Way Voyager,2023-06-15 10:15:00,2023-06-16 06:45:00,Milky Way Galaxy
EOF
cat > /home/hadoop/flight_logs_2.txt << EOF
FL003,Cygnus Cruiser,2023-07-20 14:30:00,2023-07-21 09:00:00,Cygnus Constellation
FL004,Orion Shuttle,2023-07-25 18:00:00,2023-07-26 03:15:00,Orion Nebula
EOF
次に、パーティショニングされたテーブルにデータを読み込みます。
hive -e "LOAD DATA LOCAL INPATH '/home/hadoop/flight_logs_1.txt' INTO TABLE spaceport.flight_logs PARTITION (year=2023, month=6);"
hive -e "LOAD DATA LOCAL INPATH '/home/hadoop/flight_logs_2.txt' INTO TABLE spaceport.flight_logs PARTITION (year=2023, month=7);"
上記のコードでは、まず4つの飛行レコードを持つサンプルの飛行ログデータファイル flight_logs_1.txt
と flight_logs_2.txt
を作成します。次に、Hiveの LOAD DATA
コマンドを使用して、データをパーティショニングされたテーブル flight_logs
に読み込みます。データを2回読み込みます。1回目は year=2023
かつ month=6
のパーティションに、2回目は year=2023
かつ month=7
のパーティションに読み込みます。