## Installation d'Hive Dans cette étape, nous allons installer Apache Hive sur notre cluster Hadoop, ce qui nous permettra de traiter et d'analyser les données astronomiques à l'aide de requêtes ressemblant à SQL. Tout d'abord, basculez sur l'utilisateur `hadoop` en exécutant la commande suivante dans le terminal : ```bash su - hadoop ``` Ensuite, téléchargez la dernière version stable d'Apache Hive sur le site web officiel : ```bash wget https://downloads.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz ``` Extrait l'archive téléchargée : ```bash tar -xzf apache-hive-3.1.3-bin.tar.gz ``` Ensuite, définissez la variable d'environnement `HIVE_HOME` en ajoutant la ligne suivante au fichier `~/.bashrc` : ```bash echo 'export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin' >> ~/.bashrc export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin ``` Configurez Hive pour qu'il fonctionne avec le cluster Hadoop en créant un fichier `hive-site.xml` dans le répertoire `$HIVE_HOME/conf` avec le contenu suivant : ```xml javax.jdo.option.ConnectionURL jdbc:derby:;databaseName=/home/hadoop/metastore_db;create=true javax.jdo.option.ConnectionDriverName org.apache.derby.jdbc.EmbeddedDriver hive.metastore.warehouse.dir /user/hive/warehouse ``` Ce fichier de configuration configure le magasin de métadonnées Hive, qui stocke les métadonnées des tables et partitions Hive. Enfin, initialisez la métabase avec la commande suivante : ```bash $HIVE_HOME/bin/schematool -dbType derby -initSchema ```