Hadoop FS Shell appendToFile

HadoopBeginner
Практиковаться сейчас

Введение

Добро пожаловать в нашу лабораторию по Hadoop FS Shell, расположенную в Диком Западе! Вы - золотодобывающий Джек, который только что обнаружил богатую руду золота в старой шахте. Ваш вызов - использовать функцию appendToFile Hadoop HDFS FS Shell для эффективного управления и обновления ваших добывающих данных.

Создание и добавление данных в файл

В этом шаге вы создадите новый файл в HDFS, запишите в него некоторые начальные данные, а затем добавите в файл дополнительные данные с помощью команды appendToFile.

  1. Переключитесь на пользователя hadoop в терминале:

    su - hadoop
    
  2. Создайте новый файл с именем mining_data.txt в директории /home/hadoop с начальным содержимым:

    echo "Initial data for mining analysis" > mining_data.txt
    
  3. Создайте новый файл с именем mining_data.txt в директории / HDFS:

    hdfs dfs -touchz /mining_data.txt
    
  4. Добавьте в файл mining_data.txt дополнительные данные:

    hdfs dfs -appendToFile /home/hadoop/mining_data.txt /mining_data.txt
    

    Вот объяснение команды и ее компонентов:

  • hdfs: Это командная строка для взаимодействия с HDFS.
  • dfs: Это подкоманда инструмента hdfs, специально предназначенная для работы с HDFS.
  • -appendToFile: Это параметр команды hdfs dfs, указывающий, что данные должны быть добавлены в целевой файл.
  • /home/hadoop/mining_data.txt: Это путь к исходному файлу, содержащему данные, которые будут добавлены.
  • /mining_data.txt: Это путь к целевому файлу в HDFS, в который будут добавлены данные.

При выполнении команды hdfs dfs -appendToFile она считывает данные из указанного исходного файла и добавляет их в целевой файл в HDFS.

Просмотр и обновление добавленных данных

В этом шаге вы будете просматривать содержимое файла mining_data.txt, добавлять в него дополнительные данные и затем проверять изменения.

  1. Просмотрите текущее содержимое файла mining_data.txt:

    hdfs dfs -cat /mining_data.txt
    
  2. Добавьте дополнительные данные в файл:

    echo "New mining data for analysis" | hdfs dfs -appendToFile - /mining_data.txt
    
  3. Проверьте обновленное содержимое файла:

    hdfs dfs -cat /mining_data.txt
    

Резюме

В этой лабораторной работе мы изучили операцию appendToFile в Hadoop FS Shell для эффективного управления и обновления данных в HDFS. Следуя шагам, представленным в этом руководстве, вы узнали, как создавать, добавлять и обновлять файлы в HDFS с использованием команд FS Shell. Этот практический опыт будет полезен вам в пути к овладению операциями Hadoop HDFS. Удачи в добыче!