将数据加载到分区表中
在这一步中,你将把示例飞行日志数据加载到上一步创建的分区表中。
首先,创建一些示例飞行日志数据文件:
cat > /home/hadoop/flight_logs_1.txt << EOF
FL001,Andromeda Explorer,2023-06-01 08:00:00,2023-06-02 12:30:00,Andromeda Galaxy
FL002,Milky Way Voyager,2023-06-15 10:15:00,2023-06-16 06:45:00,Milky Way Galaxy
EOF
cat > /home/hadoop/flight_logs_2.txt << EOF
FL003,Cygnus Cruiser,2023-07-20 14:30:00,2023-07-21 09:00:00,Cygnus Constellation
FL004,Orion Shuttle,2023-07-25 18:00:00,2023-07-26 03:15:00,Orion Nebula
EOF
然后,将数据加载到分区表中:
hive -e "LOAD DATA LOCAL INPATH '/home/hadoop/flight_logs_1.txt' INTO TABLE spaceport.flight_logs PARTITION (year=2023, month=6);"
hive -e "LOAD DATA LOCAL INPATH '/home/hadoop/flight_logs_2.txt' INTO TABLE spaceport.flight_logs PARTITION (year=2023, month=7);"
在上述代码中,我们首先创建了一些示例飞行日志数据文件 flight_logs_1.txt
和 flight_logs_2.txt
,其中包含四条飞行记录。然后,我们使用 Hive 中的 LOAD DATA
命令将数据加载到分区表 flight_logs
中。我们分别加载了两次数据,一次针对 year=2023
和 month=6
的分区,另一次针对 year=2023
和 month=7
的分区。