Экспорт данных в Галактическую Торговую Сеть
В этом шаге вы научитесь экспортировать обработанные данные из Hadoop в Галактическую Торговую Сеть, обеспечивая доступность информации о грузе для всех участников системы.
Во - первых, создайте новую директорию в HDFS по адресу /home/hadoop/exports
:
hdfs dfs -mkdir /home/hadoop/exports
Теперь запустите Hive shell, выполнив следующую команду:
hive
Запустите запрос Hive для обработки файла orion_manifest.csv
и генерации сводного отчета:
CREATE TABLE orion_manifest(
item STRING,
quantity INT,
origin STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
LOAD DATA INPATH '/home/hadoop/imports/orion_manifest.csv' INTO TABLE orion_manifest;
INSERT OVERWRITE DIRECTORY '/home/hadoop/exports/orion_summary'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
SELECT origin, SUM(quantity) AS total_quantity
FROM orion_manifest
GROUP BY origin;
EXIT;
Этот запрос Hive создаст таблицу из файла orion_manifest.csv
, обработает данные и сохранит сводный отчет в директории /home/hadoop/exports/orion_summary
в HDFS.
Экспортируйте сводный отчет из HDFS в локальную файловую систему:
mkdir /home/hadoop/galactic_exports
hadoop fs -get /home/hadoop/exports/orion_summary/* /home/hadoop/galactic_exports/
Эта команда создаст директорию galactic_exports
в директории /home/hadoop
и скопирует файлы из директории /home/hadoop/exports/orion_summary
в HDFS в директорию galactic_exports
.
Наконец, загрузите сводный отчет в Галактическую Торговую Сеть с помощью команды scp
:
scp /home/hadoop/galactic_exports/* localhost:/home/hadoop/incoming/reports/
Эта команда безопасно скопирует файлы из директории galactic_exports
в директорию /incoming/reports/
на сервере localhost
, делая сводный отчет доступным для всех участников системы Галактической Торговой Сети. На практике вы можете заменить localhost
на реальный сервер, например, trade.network.com
.