Управление политиками хранения в Hadoop

HadoopBeginner
Практиковаться сейчас

Введение

В этом лабе вы научитесь управлять политиками хранения Hadoop, раскрывая тайны, скрытые в золотых песках огромной Аравийской пустыни. Вы отправитесь в путешествие, где мудрый колдун вызовет вас использовать силу этих политик для эффективного управления хранением данных в Hadoop. Получите бесценные навыки по хранению и извлечению данных на разных уровнях, оптимизируя как производительность, так и экономичность.

Понимание политик хранения в Hadoop

В этом шаге вы узнаете о концепции политик хранения в Hadoop и о том, как их можно использовать для управления хранением данных на разных уровнях хранения.

Переключитесь на пользователя для доступа к файловой системе Hadoop с помощью команды su - hadoop. Затем выведите список доступных политик хранения:

hdfs storagepolicies -listPolicies

В выводе должны быть показаны стандартные политики хранения, доступные в вашем кластере Hadoop. Вот пример вывода:

Block Storage Policies:
BlockStoragePolicy{PROVIDED:...}
BlockStoragePolicy{COLD:...}
BlockStoragePolicy{WARM:...}
BlockStoragePolicy{HOT:...}

Политики хранения позволяют определить разные уровни хранения на основе шаблонов доступа к данным, требований к производительности и соображений о стоимости. Например, политика "HOT" может использоваться для часто используемых данных, а политика "COLD" - для архивных данных.

Установка и получение политики хранения директории

В этом шаге вы узнаете, как установить конкретную политику хранения для директории в Hadoop.

Сначала создайте новую директорию в HDFS:

hdfs dfs -mkdir /example

Затем установите конкретную политику хранения для директории /example в политику "WARM", которую вы создали на предыдущем шаге:

hdfs storagepolicies -setStoragePolicy -path /example -policy WARM

Эта команда устанавливает политику хранения "WARM" в качестве конкретной политики для директории /example и всех ее поддиректорий и файлов.

Вы можете проверить политику хранения для директории с помощью команды hdfs storagepolicies:

hdfs storagepolicies -getStoragePolicy -path /example

В выводе должна быть показана политика "WARM" в качестве политики хранения для директории /example.

Установка и получение политики хранения файла

В этом шаге вы узнаете, как перенести существующие данные в Hadoop в конкретную политику хранения.

Сначала создайте примерный файл в HDFS:

hdfs dfs -touchz /example/sample.txt

Затем проверьте текущую политику хранения для файла:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

В выводе должна быть показана политика хранения "WARM", которая является стандартной политикой для директории /example.

Теперь перейдем к перемещению файла sample.txt в политику хранения "HOT":

hdfs storagepolicies -setStoragePolicy -path /example/sample.txt -policy HOT

Эта команда изменяет политику хранения для файла sample.txt на политику хранения "HOT".

Вы можете проверить новую политику хранения для файла с помощью команды hdfs storagepolicies:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

Теперь в выводе должна быть показана политика "HOT" для файла sample.txt.

Удаление политики хранения из файла

В этом шаге вы узнаете, как удалить политику хранения для конкретного файла в Hadoop.

Если вы хотите удалить политику хранения для файла /example/sample.txt, вы можете использовать команду hdfs storagepolicies:

hdfs storagepolicies -unsetStoragePolicy -path /example/sample.txt

Эта команда удаляет политику хранения для файла /example/sample.txt, так что файл больше не имеет явной политики хранения, а наследует политику директории, в которой он находится, или принимает стандартную политику кластера.

Затем вы можете использовать команду hdfs, чтобы подтвердить, что политика хранения файла sample.txt была удалена:

hdfs storagepolicies -getStoragePolicy -path /example/sample.txt

Теперь в выводе должно быть показано "WARM" - политика для файла sample.txt, то есть политика директории, в которой он находится.

Резюме

Поздравляем! Вы успешно освоили политики хранения в Hadoop, что позволяет эффективно управлять хранением данных. С новыми навыками вы можете оптимизировать хранение и получение данных в Hadoop, обеспечивая эффективность и экономичность. Руководствуясь мудрым волшебником, вы открыли секреты политик хранения и готовы успешно справляться с любыми задачами, связанными с хранением данных.