サンプル データセットの作成
このステップでは、Hive での結合操作を練習するために 2 つのサンプル データセットを作成します。
- 次の内容の
employees.txt
という名前の新しいファイルを作成します。
101,John Doe,Sales
102,Jane Smith,Marketing
103,Michael Johnson,IT
104,Emily Davis,HR
105,Adam Wilson,Finance
106,Lisa Brown,Operations
- 次の内容の
departments.txt
という名前の別のファイルを作成します。
1,Sales,New York
2,Marketing,Los Angeles
3,IT,Chicago
4,HR,San Francisco
- 次のコマンドを実行して Hive シェルを起動します。
hive
- 次のコマンドを実行してデータセットを Hive に読み込みます。
CREATE TABLE employees (emp_id INT, name STRING, dept STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
LOAD DATA LOCAL INPATH '/home/hadoop/join_lab/employees.txt' OVERWRITE INTO TABLE employees;
CREATE TABLE departments (dept_id INT, dept_name STRING, location STRING)
ROW FORMAT DELIMITED FIELDS TERMINATED BY ',';
LOAD DATA LOCAL INPATH '/home/hadoop/join_lab/departments.txt' OVERWRITE INTO TABLE departments;
これらのコマンドでは、2 つの Hive テーブル employees
と departments
が作成され、それぞれのテキスト ファイルからデータが読み込まれます。