## Установка Hive В этом шаге мы установим Apache Hive на нашем кластере Hadoop, что позволит нам обрабатывать и анализировать астрономические данные с использованием запросов, похожих на SQL. Сначала перейдите в пользователя `hadoop`, выполнив следующую команду в терминале: ```bash su - hadoop ``` Затем загрузите последнюю стабильную версию Apache Hive с официального сайта: ```bash wget https://downloads.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz ``` Распакуйте загруженный архив: ```bash tar -xzf apache-hive-3.1.3-bin.tar.gz ``` Далее задайте переменную окружения `HIVE_HOME`, добавив следующую строку в файл `~/.bashrc`: ```bash echo 'export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin' >> ~/.bashrc export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin ``` Настройте Hive для работы с кластером Hadoop, создав файл `hive-site.xml` в директории `$HIVE_HOME/conf` с следующим содержанием: ```xml javax.jdo.option.ConnectionURL jdbc:derby:;databaseName=/home/hadoop/metastore_db;create=true javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver hive.metastore.warehouse.dir /user/hive/warehouse ``` Этот файл конфигурации настраивает metastore Hive, который хранит метаданные для таблиц и разделов Hive. Наконец, инициализируйте метаданные с помощью следующей команды: ```bash $HIVE_HOME/bin/schematool -dbType derby -initSchema ```