## Installation von Hive In diesem Schritt installieren wir Apache Hive auf unserem Hadoop-Cluster, was uns ermöglichen wird, die astronomischen Daten mit SQL-ähnlichen Abfragen zu verarbeiten und zu analysieren. Stellen Sie zunächst die `hadoop`-Benutzerumgebung her, indem Sie folgenden Befehl in der Konsole ausführen: ```bash su - hadoop ``` Laden Sie dann die neueste stabile Version von Apache Hive von der offiziellen Website herunter: ```bash wget https://downloads.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz ``` Entpacken Sie das heruntergeladene Archiv: ```bash tar -xzf apache-hive-3.1.3-bin.tar.gz ``` Leiten Sie anschließend die `HIVE_HOME`-Umgebungsvariable ein, indem Sie die folgende Zeile zur `~/.bashrc`-Datei hinzufügen: ```bash echo 'export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin' >> ~/.bashrc export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin ``` Konfigurieren Sie Hive, um mit dem Hadoop-Cluster zu arbeiten, indem Sie eine `hive-site.xml`-Datei im `$HIVE_HOME/conf`-Verzeichnis mit dem folgenden Inhalt erstellen: ```xml javax.jdo.option.ConnectionURL jdbc:derby:;databaseName=/home/hadoop/metastore_db;create=true javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver hive.metastore.warehouse.dir /user/hive/warehouse ``` Diese Konfigurationsdatei konfiguriert den Hive-Metastore, der die Metadaten für die Hive-Tabellen und -Partitionen speichert. Initialisieren Sie abschließend die Metabase mit dem folgenden Befehl: ```bash $HIVE_HOME/bin/schematool -dbType derby -initSchema ```