Introdução
Bem-vindo ao nosso laboratório Hadoop FS Shell ambientado no Velho Oeste! Você é um garimpeiro chamado Jack que acabou de descobrir uma rica veia de ouro em uma mina antiga. Seu desafio é usar o recurso appendToFile do Hadoop HDFS FS Shell para gerenciar e atualizar seus dados de mineração de forma eficiente.
Criando e Anexando Dados a um Arquivo
Nesta etapa, você criará um novo arquivo no HDFS, escreverá alguns dados iniciais nele e, em seguida, anexará mais dados ao arquivo usando o comando appendToFile.
Mude para o usuário
hadoopno terminal:su - hadoopCrie um novo arquivo chamado
mining_data.txtno diretório/home/hadoopcom o conteúdo inicial:echo "Initial data for mining analysis" > mining_data.txtCrie um novo arquivo chamado
mining_data.txtno diretório/do HDFS:hdfs dfs -touchz /mining_data.txtAnexe mais dados ao arquivo
mining_data.txt:hdfs dfs -appendToFile /home/hadoop/mining_data.txt /mining_data.txtAqui está uma explicação do comando e seus componentes:
- hdfs: Esta é a ferramenta de linha de comando para interagir com o HDFS.
- dfs: Este é um subcomando da ferramenta hdfs, usado especificamente para trabalhar com o HDFS.
- -appendToFile: Esta é uma opção do comando hdfs dfs, indicando que os dados devem ser anexados ao arquivo de destino.
- /home/hadoop/mining_data.txt: Este é o caminho para o arquivo de origem que contém os dados a serem anexados.
- /mining_data.txt: Este é o caminho para o arquivo de destino no HDFS onde os dados serão anexados.
Quando o comando hdfs dfs -appendToFile é executado, ele lê os dados do arquivo de origem especificado e os anexa ao arquivo de destino no HDFS.
Visualizando e Atualizando Dados Anexados
Nesta etapa, você visualizará o conteúdo do arquivo mining_data.txt, anexará mais dados a ele e, em seguida, verificará as alterações.
Visualize o conteúdo atual do arquivo
mining_data.txt:hdfs dfs -cat /mining_data.txtAnexe dados adicionais ao arquivo:
echo "New mining data for analysis" | hdfs dfs -appendToFile - /mining_data.txtVerifique o conteúdo atualizado do arquivo:
hdfs dfs -cat /mining_data.txt
Resumo
Neste laboratório, exploramos a operação appendToFile no Hadoop FS Shell para gerenciar e atualizar dados de forma eficiente no HDFS. Ao seguir as etapas fornecidas, você aprendeu como criar, anexar e atualizar arquivos no HDFS usando os comandos do FS Shell. Essa experiência prática será valiosa em sua jornada para dominar as operações do HDFS do Hadoop. Boa mineração!



