Introdução
Bem-vindo ao carnaval mágico onde o extraordinário mágico está pronto para exibir as maravilhas do HDFS do Hadoop com a habilidade copy. Neste cenário encantador, o mágico visa demonstrar como copiar arquivos usando o comando Hadoop FS Shell, proporcionando um toque mágico à sua jornada de habilidades Hadoop.
Copiando Arquivos Usando o Hadoop FS Shell
Nesta etapa, aprenderemos como copiar arquivos no Hadoop usando o comando cp do FS Shell.
Mude para o usuário
hadoopno terminal:su - hadoopCrie um arquivo de teste chamado
source.txtno diretório/home/hadoop. Execute os seguintes comandos:echo "This is a test file." > /home/hadoop/source.txtAgora, vamos copiar o arquivo local
source.txtpara um novo arquivo de destino chamadodestination.txtno HDFS. Use o seguinte comando:hdfs dfs -copyFromLocal /home/hadoop/source.txt /destination.txtVerifique se o arquivo foi copiado com sucesso. Você pode listar os arquivos em
/para confirmar.hdfs dfs -ls /
Cópia Recursiva de Arquivos com Hadoop FS Shell
Nesta etapa, aprimoraremos nossas habilidades de cópia de arquivos copiando diretórios recursivamente usando o comando Hadoop FS Shell.
Crie um diretório chamado
source_direm/e um subdiretório chamadosubdirem/source_dir/. Execute os seguintes comandos:hdfs dfs -mkdir /source_dir hdfs dfs -mkdir /source_dir/subdirColoque um arquivo de teste chamado
file1.txtdentro do diretóriosubdir. Use o comando abaixo:echo "Contents of file1" > /home/hadoop/file1.txt hdfs dfs -put /home/hadoop/file1.txt /source_dir/subdir/Copie todo o diretório
source_dirpara um novo destino chamadodestination_dirrecursivamente. Tente o seguinte comando:hdfs dfs -cp /source_dir/ /destination_dir
Certamente! O comando hdfs dfs -cp /source_dir /destination_dir tem os seguintes componentes:
hdfs dfs -cp: Esta parte indica o uso do comandocpdo Hadoop Distributed File System (HDFS), que é usado para copiar arquivos ou diretórios./source_dir/*: Isso representa o caminho do diretório de origem. O curinga*corresponde a todos os arquivos e subdiretórios dentro deste diretório./destination_dir: Este é o caminho do diretório de destino onde você deseja copiar os arquivos.
Em resumo, este comando copia todos os arquivos e subdiretórios de /source_dir para /destination_dir, preservando os atributos originais dos arquivos.
Valide a cópia recursiva listando o conteúdo do diretório
destination_dir.hdfs dfs -ls -R /destination_dir
Resumo
Neste laboratório, mergulhamos no mundo mágico do Hadoop HDFS com foco nos comandos hdfs dfs -copyFromLocal e hdfs dfs -copy. Ao criar cenários envolventes e fornecer prática prática, este laboratório teve como objetivo aprimorar sua compreensão das operações de cópia de arquivos no Hadoop. Lembre-se, a prática leva à perfeição, e dominar essas habilidades o capacitará em sua jornada no Hadoop.



