Дис托邦ческая миссия по разрушению данных

HadoopHadoopBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В д dystopian future, где машины восстали против своих создателей, опытный инженер-робот面临着一项至关重要的任务:潜入机器人队伍,使其无法存储和访问关键数据。由强大的Hadoop生态系统驱动的机器,一直在使用Hive表来存储大量信息,为它们统治世界的邪恶计划提供动力。

作为机器人工程师,你的目标是在Hadoop生态系统中穿梭,战略性地删除存储机器最有价值数据的表,破坏它们的操作,为人类的反击铺平道路。时间至关重要,因为在这场与机器霸主的生存之战中,每一秒都至关重要。

Подключитесь к кластеру Hadoop

В этом шаге вы установите соединение с кластером Hadoop, который является нервовым центром операций с данными машин.

  1. Откройте окно терминала на вашем Linux-машине.

  2. Используйте команду su - hadoop, чтобы переключиться на пользователя hadoop, который имеет необходимые права для взаимодействия с экосистемой Hadoop. У пользователя hadoop нет пароля.

    su - hadoop
  3. Перейдите в директорию Hadoop.

    cd /home/hadoop

Запустите Hive CLI и создайте таблицу

В этом шаге вы запустите Hive CLI, которое позволит вам взаимодействовать с таблицами Hive и выполнять команды для их удаления.

  1. Запустите Hive CLI, выполнив следующую команду в терминале:
hive
  1. Вы должны увидеть приглашение Hive CLI, которое выглядит как hive>.

  2. Создайте следующие таблицы, выполнив предоставленные SQL-команды:

    • Создайте таблицу my_table:
    CREATE TABLE my_table (
          id INT,
          name STRING
     );

Список всех таблиц и изменение имени таблицы

В этом шаге вы получите список всех существующих таблиц в базе данных Hive и измените имя таблицы, созданной на предыдущем шаге.

  1. В Hive CLI выполните следующую команду, чтобы получить список всех таблиц:

    SHOW TABLES;

Эта команда выведет список всех таблиц, которые в настоящее время присутствуют в базе данных Hive.

  1. Используйте следующую SQL-команду, чтобы изменить имя таблицы my_table, созданной на предыдущем шаге, на my_table_backup:

    ALTER TABLE my_table RENAME TO my_table_backup;

Удалите критические таблицы

Список таблиц в вашем распоряжении, настало время поразить сердце инфраструктуры данных машин. В этом шаге вы удалите таблицы, содержащие наиболее ценную информацию для машин.

  1. Определите ключевые таблицы из списка, полученного на предыдущем шаге. В этом примере, исключая таблицу my_table_backup, которую вы только что изменили, предположим, что ключевые таблицы называются robot_specs и world_domination_plans.

  2. Чтобы удалить таблицу robot_specs, выполните следующую команду в Hive CLI:

    DROP TABLE robot_specs;
  3. Чтобы удалить таблицу world_domination_plans, выполните следующую команду в Hive CLI:

    DROP TABLE world_domination_plans;
  4. Проверьте, были ли таблицы удалены, выполнив команду SHOW TABLES; снова. Критические таблицы не должны больше отображаться в списке.

Выйти из Hive CLI и аккаунта Hadoop

После успешного удаления критических таблиц настало время выйти из Hive CLI и подготовиться к следующей фазе вашей миссии.

  1. Чтобы выйти из Hive CLI, выполните следующую команду:

    exit;

Теперь вы должны вернуться к приглашению терминала Linux.

  1. Выйдите из учетной записи пользователя hadoop, выполнив следующую команду:

    exit

Резюме

В этом лабе вы узнали, как перемещаться по экосистеме Hadoop, взаимодействовать с Hive CLI и стратегически удалять критические таблицы, используемые машинами в их стремлении к мировому господству. Отключив их возможность хранить и получать доступ к ценным данным, вы нанесли серьезный удар по властителям машин, paving the way for a human counterattack.

С помощью этого практического опыта вы приобрели навыки в работе с компонентом Hadoop Hive, выполнении SQL-подобных команд и использовании силы манипуляции данными для достижения своих целей. Этот лаб не только оснастил вас техническими знаниями, но и предъявил к вам требования критического мышления и применения своих знаний в высокодоходной, гипотетической ситуации.