Hadoop FS Shell appendToFile

HadoopHadoopBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Bienvenido a nuestro laboratorio de Hadoop FS Shell situado en el Viejo Oeste! Eres un minero de oro llamado Jack que acaba de descubrir una rica veta de oro en una antigua mina. Tu desafío es utilizar la función appendToFile de Hadoop HDFS FS Shell para administrar y actualizar tus datos de minería de manera eficiente.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop/HadoopHDFSGroup -.-> hadoop/hdfs_setup("HDFS Setup") hadoop/HadoopHDFSGroup -.-> hadoop/fs_cat("FS Shell cat") hadoop/HadoopHDFSGroup -.-> hadoop/fs_mkdir("FS Shell mkdir") hadoop/HadoopHiveGroup -.-> hadoop/import_export_data("Importing and Exporting Data") subgraph Lab Skills hadoop/hdfs_setup -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_cat -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_mkdir -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/import_export_data -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} end

Creación y adición de datos a un archivo

En este paso, crearás un nuevo archivo en HDFS, escribirás algunos datos iniciales en él y luego agregarás más datos al archivo utilizando el comando appendToFile.

  1. Cambia al usuario hadoop en la terminal:

    su - hadoop
  2. Crea un nuevo archivo llamado mining_data.txt en el directorio /home/hadoop con el contenido inicial:

    echo "Initial data for mining analysis" > mining_data.txt
  3. Crea un nuevo archivo llamado mining_data.txt en el directorio / de HDFS:

    hdfs dfs -touchz /mining_data.txt
  4. Agrega más datos al archivo mining_data.txt:

    hdfs dfs -appendToFile /home/hadoop/mining_data.txt /mining_data.txt

A continuación, una explicación del comando y sus componentes:

  • hdfs: Este es el herramienta de línea de comandos para interactuar con HDFS.
  • dfs: Este es un subcomando de la herramienta hdfs, específicamente utilizado para trabajar con HDFS.
  • -appendToFile: Esta es una opción del comando hdfs dfs, que indica que los datos deben agregarse al archivo destino.
  • /home/hadoop/mining_data.txt: Esta es la ruta al archivo fuente que contiene los datos que se agregarán.
  • /mining_data.txt: Esta es la ruta al archivo destino en HDFS donde se agregarán los datos.

Cuando se ejecuta el comando hdfs dfs -appendToFile, lee los datos del archivo fuente especificado y los agrega al archivo destino en HDFS.

Visualización y actualización de datos anexados

En este paso, verás el contenido del archivo mining_data.txt, agregarás más datos a él y luego verificaremos los cambios.

  1. Ver el contenido actual del archivo mining_data.txt:

    hdfs dfs -cat /mining_data.txt
  2. Agregar datos adicionales al archivo:

    echo "New mining data for analysis" | hdfs dfs -appendToFile - /mining_data.txt
  3. Verificar el contenido actualizado del archivo:

    hdfs dfs -cat /mining_data.txt

Resumen

En este laboratorio, hemos explorado la operación appendToFile en Hadoop FS Shell para administrar y actualizar eficientemente los datos en HDFS. Siguiendo los pasos proporcionados, has aprendido cómo crear, anexar y actualizar archivos en HDFS utilizando los comandos de FS Shell. Esta experiencia práctica será valiosa en tu camino hacia el dominio de las operaciones de HDFS de Hadoop. ¡Que la minería te vaya bien!