Gerenciamento de Políticas de Armazenamento Hadoop

HadoopBeginner
Pratique Agora

Introdução

Neste laboratório, você aprenderá a dominar as Políticas de Armazenamento do Hadoop, desvendando os segredos escondidos nas vastas areias douradas do Deserto da Arábia. Você embarcará em uma jornada onde um sábio feiticeiro o desafia a aproveitar o poder dessas políticas, permitindo o gerenciamento eficiente do armazenamento de dados no Hadoop. Adquira habilidades valiosas para armazenar e recuperar dados em diferentes camadas (tiers), otimizando tanto o desempenho quanto a relação custo-benefício.

Entendendo as Políticas de Armazenamento no Hadoop

Nesta etapa, você aprenderá sobre o conceito de políticas de armazenamento no Hadoop e como elas podem ser usadas para gerenciar o armazenamento de dados em diferentes camadas de armazenamento (storage tiers).

Altere o usuário para acessar o sistema de arquivos Hadoop usando o comando su - hadoop. Em seguida, liste as políticas de armazenamento disponíveis:

hdfs storagepolicies -listPolicies

A saída deve exibir as políticas de armazenamento padrão disponíveis no seu cluster Hadoop. Aqui está uma saída de exemplo:

Block Storage Policies:
BlockStoragePolicy{PROVIDED:...}
BlockStoragePolicy{COLD:...}
BlockStoragePolicy{WARM:...}
BlockStoragePolicy{HOT:...}

As políticas de armazenamento permitem que você defina diferentes camadas de armazenamento com base em padrões de acesso a dados, requisitos de desempenho e considerações de custo. Por exemplo, a política "HOT" pode ser usada para dados acessados com frequência, enquanto a política "COLD" pode ser usada para dados de arquivamento.

Definir e Obter a Política de Armazenamento do Diretório

Nesta etapa, você aprenderá como definir uma política de armazenamento específica para um diretório no Hadoop.

Primeiro, crie um novo diretório no HDFS:

hdfs dfs -mkdir /example

Em seguida, defina a política de armazenamento específica para o diretório /example como a política "WARM" que você criou na etapa anterior:

hdfs storagepolicies -setStoragePolicy -path /example -policy WARM

Este comando define a política de armazenamento "WARM" como a política específica para o diretório /example e todos os seus subdiretórios e arquivos.

Você pode verificar a política de armazenamento para o diretório usando o comando hdfs storagepolicies:

hdfs storagepolicies -getStoragePolicy -path /example

A saída deve exibir a política "WARM" como a política de armazenamento para o diretório /example.

Definir e Obter a Política de Armazenamento de Arquivos

Nesta etapa, você aprenderá como mover dados existentes no Hadoop para uma política de armazenamento específica.

Primeiro, crie um arquivo de exemplo no HDFS:

hdfs dfs -touchz /example/sample.txt

Em seguida, verifique a política de armazenamento atual para o arquivo:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

A saída deve exibir a política de armazenamento "WARM", que é a política padrão para o diretório /example.

Agora, vamos mover o arquivo sample.txt para a política de armazenamento "HOT":

hdfs storagepolicies -setStoragePolicy -path /example/sample.txt -policy HOT

Este comando altera a política de armazenamento para o arquivo sample.txt para a política de armazenamento "HOT".

Você pode verificar a nova política de armazenamento para o arquivo usando o comando hdfs storagepolicies:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

A saída agora deve exibir a política "HOT" para o arquivo sample.txt.

Remover Política de Armazenamento de um Arquivo

Nesta etapa, você aprenderá como remover a política de armazenamento para um arquivo específico no Hadoop.

Se você deseja remover a política de armazenamento para o arquivo /example/sample.txt, pode usar o comando hdfs storagepolicies:

hdfs storagepolicies -unsetStoragePolicy -path /example/sample.txt

Este comando remove a política de armazenamento para o arquivo /example/sample.txt, de modo que o arquivo não tenha mais uma política de armazenamento explícita, mas herda a política do diretório em que reside ou adota a política de armazenamento padrão do cluster.

Você pode então usar o comando hdfs para confirmar que a política de armazenamento do arquivo sample.txt foi removida:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

A saída agora deve mostrar a política "WARM" para o arquivo sample.txt, ou seja, a política para o diretório em que ele reside.

Resumo

Parabéns! Você dominou com sucesso as Políticas de Armazenamento do Hadoop, permitindo o gerenciamento eficaz do armazenamento de dados. Com suas novas habilidades, você pode otimizar o armazenamento e a recuperação de dados no Hadoop, garantindo eficiência e custo-benefício. Guiado pelo sábio feiticeiro, você desvendou os segredos das políticas de armazenamento, pronto para enfrentar quaisquer desafios de armazenamento de dados que surgirem.