Магия создания таблиц в Hadoop

HadoopBeginner
Практиковаться сейчас

Введение

Добро пожаловать на загадочный остров Баннистер, где обычное и необычное переплетаются. Здесь живет загадочный колдун Адриан, мастер аранских искусств. Его последнее предприятие - раскрыть секреты древних рукописей Hadoop, которые обладают силой разгадать тайны организации и манипуляции данными.

Ваша задача, если вы решите принять ее, - помочь колдуну Адриану создать таблицы в рамках Hadoop Hive. Это мощный инструмент позволяет структурировать и хранить огромные объемы данных, что позволяет извлекать ценные выводы и выявлять скрытые закономерности. Во время этого практикума вы изучите сложности создания таблиц, заложив основы для более глубокого понимания возможностей Hadoop.

Перемещение в среду Hadoop

В этом шаге мы подготовим среду для ваших будущих задач, перейдя в домашний каталог пользователя Hadoop.

Сначала откройте окно терминала и переключитесь на пользователя hadoop, выполнив следующую команду:

su - hadoop

Вам не будет предложено ввести пароль. После успешного переключения на пользователя hadoop текущим каталогом работы должно стать /home/hadoop.

Создание базы данных

Прежде чем мы сможем создать таблицы, нам нужно иметь базу данных для их хранения. В этом шаге мы создадим новую базу данных под названием magic_realm.

В терминале выполните следующую команду, чтобы запустить Hive CLI:

hive

После запуска Hive CLI выполните следующую команду для создания базы данных magic_realm:

CREATE DATABASE magic_realm;

Вы должны увидеть сообщение об успехе, которое свидетельствует о том, что база данных создана.

Создание таблицы

Теперь, когда у нас есть база данных, создадим в ней первую таблицу. Эта таблица будет хранить информацию о различных магических существах, обитающих на острове Баннистер.

Сначала переключитесь на базу данных magic_realm, выполнив следующую команду в Hive CLI:

USE magic_realm;

Далее создайте таблицу под названием creatures со следующей структурой:

CREATE TABLE creatures (
  id INT,
  name STRING,
  species STRING,
  habitat STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

Эта команда создает таблицу creatures с четырьмя столбцами:

  • id: целочисленное значение, представляющее уникальный идентификатор существа.
  • name: строковое значение, представляющее имя существа.
  • species: строковое значение, представляющее вид существа.
  • habitat: строковое значение, представляющее место обитания существа.

Кlause ROW FORMAT DELIMITED задает, что данные в таблице будут разделены запятыми (,).

Загрузка данных в таблицу

После создания таблицы creatures настало время заполнить ее данными. Мы будем использовать примерный файл данных, содержащий информацию о различных магических существах.

Сначала создайте новую директорию под названием data в директории /home/hadoop:

mkdir /home/hadoop/data

Далее создайте файл под названием creatures.csv в директории /home/hadoop/data с следующим содержанием:

1,Unicorn,Equine,Forest
2,Phoenix,Avian,Volcanic Regions
3,Mermaid,Aquatic,Oceans
4,Griffon,Hybrid,Mountains

Сохраните файл и выйдите из текстового редактора.

Затем убедитесь, что вы находитесь в Hive shell. Если нет, запустите его, выполнив следующую команду:

hive

Переключитесь на базу данных magic_realm с помощью следующей команды:

USE magic_realm;

Теперь мы можем загрузить данные из creatures.csv в таблицу creatures с помощью следующей команды в Hive CLI:

LOAD DATA LOCAL INPATH '/home/hadoop/data/creatures.csv' INTO TABLE creatures;

Эта команда загружает данные из локального файла /home/hadoop/data/creatures.csv в таблицу creatures.

Резюме

В этом практическом занятии вы помогла(ь) Магусу Адриану в освоении среды Hadoop Hive и овладении искусством создания таблиц. Вы узнали, как создавать базы данных, определять структуры таблиц и загружать данные в таблицы. Эти базовые навыки будут служить основой для вашего путешествия в мир обработки и анализа данных.

При дальнейшем изучении вы будете углубляться в сложности Hadoop Hive, раскрывая его полный потенциал для разгадания загадок, скрытых в огромных наборах данных. Помните, что путь к мастерству лежит в усердном практике и непоколебимой решимости. Встретите вызовы с张开双臂 и пусть мудрость древних рукописей проведет вас к тому, чтобы стать настоящим Магом данных.