Exportando datos a la Red de Comercio Galáctico
En este paso, aprenderá a exportar datos procesados de Hadoop a la Red de Comercio Galáctico, asegurando que la información de carga sea accesible a todos los sistemas miembros.
Primero, cree un nuevo directorio en HDFS llamado /home/hadoop/exports
:
hdfs dfs -mkdir /home/hadoop/exports
Ahora, lance la shell de Hive ejecutando el siguiente comando:
hive
Ejecute una consulta de Hive para procesar el archivo orion_manifest.csv
y generar un informe resumen:
CREATE TABLE orion_manifest(
item STRING,
quantity INT,
origin STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
STORED AS TEXTFILE;
LOAD DATA INPATH '/home/hadoop/imports/orion_manifest.csv' INTO TABLE orion_manifest;
INSERT OVERWRITE DIRECTORY '/home/hadoop/exports/orion_summary'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ','
SELECT origin, SUM(quantity) AS total_quantity
FROM orion_manifest
GROUP BY origin;
EXIT;
Esta consulta de Hive creará una tabla a partir del archivo orion_manifest.csv
, procesará los datos y almacenará el informe resumen en el directorio /home/hadoop/exports/orion_summary
en HDFS.
Exporte el informe resumen de HDFS al sistema de archivos local:
mkdir /home/hadoop/galactic_exports
hadoop fs -get /home/hadoop/exports/orion_summary/* /home/hadoop/galactic_exports/
Este comando creará un directorio galactic_exports
en el directorio /home/hadoop
y copiará los archivos del directorio /home/hadoop/exports/orion_summary
en HDFS al directorio galactic_exports
.
Finalmente, cargue el informe resumen a la Red de Comercio Galáctico usando el comando scp
:
scp /home/hadoop/galactic_exports/* localhost:/home/hadoop/incoming/reports/
Este comando copiará de manera segura los archivos del directorio galactic_exports
al directorio /incoming/reports/
en el servidor localhost
, haciendo disponible el informe resumen a todos los sistemas miembros de la Red de Comercio Galáctico. En la práctica, puede reemplazar localhost
con un servidor real, por ejemplo, trade.network.com
.