Hive 설치
이 단계에서는 SQL 과 유사한 쿼리를 사용하여 천문 데이터를 처리하고 분석할 수 있도록 Apache Hive 를 Hadoop 클러스터에 설치합니다.
먼저, 터미널에서 다음 명령을 실행하여 hadoop 사용자로 전환합니다.
su - hadoop
그런 다음, 공식 웹사이트에서 최신 안정 버전의 Apache Hive 를 다운로드합니다.
wget https://downloads.apache.org/hive/hive-3.1.3/apache-hive-3.1.3-bin.tar.gz
다운로드한 아카이브를 압축 해제합니다.
tar -xzf apache-hive-3.1.3-bin.tar.gz
다음으로, ~/.bashrc 파일에 다음 줄을 추가하여 HIVE_HOME 환경 변수를 설정합니다.
echo 'export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin' >> ~/.bashrc
export HIVE_HOME=/home/hadoop/apache-hive-3.1.3-bin
다음 내용으로 $HIVE_HOME/conf 디렉토리에 hive-site.xml 파일을 생성하여 Hive 가 Hadoop 클러스터와 함께 작동하도록 구성합니다.
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:derby:;databaseName=/home/hadoop/metastore_db;create=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>org.apache.derby.jdbc.EmbeddedDriver</value>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
</configuration>
이 구성 파일은 Hive 테이블 및 파티션에 대한 메타데이터를 저장하는 Hive 메타스토어를 설정합니다.
마지막으로, 다음 명령을 사용하여 메타베이스를 초기화합니다.
$HIVE_HOME/bin/schematool -dbType derby -initSchema