Hadoop FS Shell appendToFile

HadoopHadoopBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Добро пожаловать в нашу лабораторию по Hadoop FS Shell, расположенную в Диком Западе! Вы - золотодобывающий Джек, который только что обнаружил богатую руду золота в старой шахте. Ваш вызов - использовать функцию appendToFile Hadoop HDFS FS Shell для эффективного управления и обновления ваших добывающих данных.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop/HadoopHDFSGroup -.-> hadoop/hdfs_setup("HDFS Setup") hadoop/HadoopHDFSGroup -.-> hadoop/fs_cat("FS Shell cat") hadoop/HadoopHDFSGroup -.-> hadoop/fs_mkdir("FS Shell mkdir") hadoop/HadoopHiveGroup -.-> hadoop/import_export_data("Importing and Exporting Data") subgraph Lab Skills hadoop/hdfs_setup -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_cat -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_mkdir -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/import_export_data -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} end

Создание и добавление данных в файл

В этом шаге вы создадите новый файл в HDFS, запишите в него некоторые начальные данные, а затем добавите в файл дополнительные данные с помощью команды appendToFile.

  1. Переключитесь на пользователя hadoop в терминале:

    su - hadoop
  2. Создайте новый файл с именем mining_data.txt в директории /home/hadoop с начальным содержимым:

    echo "Initial data for mining analysis" > mining_data.txt
  3. Создайте новый файл с именем mining_data.txt в директории / HDFS:

    hdfs dfs -touchz /mining_data.txt
  4. Добавьте в файл mining_data.txt дополнительные данные:

    hdfs dfs -appendToFile /home/hadoop/mining_data.txt /mining_data.txt

    Вот объяснение команды и ее компонентов:

  • hdfs: Это командная строка для взаимодействия с HDFS.
  • dfs: Это подкоманда инструмента hdfs, специально предназначенная для работы с HDFS.
  • -appendToFile: Это параметр команды hdfs dfs, указывающий, что данные должны быть добавлены в целевой файл.
  • /home/hadoop/mining_data.txt: Это путь к исходному файлу, содержащему данные, которые будут добавлены.
  • /mining_data.txt: Это путь к целевому файлу в HDFS, в который будут добавлены данные.

При выполнении команды hdfs dfs -appendToFile она считывает данные из указанного исходного файла и добавляет их в целевой файл в HDFS.

Просмотр и обновление добавленных данных

В этом шаге вы будете просматривать содержимое файла mining_data.txt, добавлять в него дополнительные данные и затем проверять изменения.

  1. Просмотрите текущее содержимое файла mining_data.txt:

    hdfs dfs -cat /mining_data.txt
  2. Добавьте дополнительные данные в файл:

    echo "New mining data for analysis" | hdfs dfs -appendToFile - /mining_data.txt
  3. Проверьте обновленное содержимое файла:

    hdfs dfs -cat /mining_data.txt

Резюме

В этой лабораторной работе мы изучили операцию appendToFile в Hadoop FS Shell для эффективного управления и обновления данных в HDFS. Следуя шагам, представленным в этом руководстве, вы узнали, как создавать, добавлять и обновлять файлы в HDFS с использованием команд FS Shell. Этот практический опыт будет полезен вам в пути к овладению операциями Hadoop HDFS. Удачи в добыче!