La creación de tablas místicas en Hadoop

HadoopHadoopBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Bienvenido a la mística Isla de la Barandilla, un lugar donde lo extraordinario y lo cotidiano se entremezclan. Aquí, reside el enigmático hechicero Adriano, un maestro de las artes arcánicas. Su último empeño es desentrañar los secretos de los antiguos rollos de Hadoop, que poseen el poder de desentrañar los misterios de la organización y manipulación de datos.

Tu misión, si decides aceptarla, es ayudar al hechicero Adriano a crear tablas en el dominio de Hadoop Hive. Esta herramienta poderosa te permite estructurar y almacenar grandes cantidades de datos, lo que te permite extraer información valiosa y descubrir patrones ocultos. A lo largo de este laboratorio, aprenderás las complejidades de la creación de tablas, lo que te servirá de base para una comprensión más profunda de las capacidades de Hadoop.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop(("Hadoop")) -.-> hadoop/HadoopYARNGroup(["Hadoop YARN"]) hadoop/HadoopHDFSGroup -.-> hadoop/hdfs_setup("HDFS Setup") hadoop/HadoopYARNGroup -.-> hadoop/yarn_setup("Hadoop YARN Basic Setup") hadoop/HadoopHiveGroup -.-> hadoop/hive_setup("Hive Setup") hadoop/HadoopHiveGroup -.-> hadoop/hive_shell("Hive Shell") hadoop/HadoopHiveGroup -.-> hadoop/manage_db("Managing Database") hadoop/HadoopHiveGroup -.-> hadoop/create_tables("Creating Tables") hadoop/HadoopHiveGroup -.-> hadoop/load_insert_data("Loading and Inserting Data") hadoop/HadoopHiveGroup -.-> hadoop/import_export_data("Importing and Exporting Data") hadoop/HadoopHiveGroup -.-> hadoop/schema_design("Schema Design") subgraph Lab Skills hadoop/hdfs_setup -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/yarn_setup -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/hive_setup -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/hive_shell -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/manage_db -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/create_tables -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/load_insert_data -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/import_export_data -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} hadoop/schema_design -.-> lab-288962{{"La creación de tablas místicas en Hadoop"}} end

En este paso, prepararemos el entorno para tus próximas tareas navegando hasta el directorio principal del usuario de Hadoop.

Primero, abre una ventana de terminal y cambia al usuario hadoop ejecutando el siguiente comando:

su - hadoop

No se te pedirá una contraseña. Una vez que hayas cambiado exitosamente al usuario hadoop, tu directorio de trabajo actual debería ser /home/hadoop.

Creando una base de datos

Antes de poder crear tablas, necesitamos tener una base de datos para almacenarlas. En este paso, crearemos una nueva base de datos llamada magic_realm.

En la terminal, ejecuta el siguiente comando para iniciar la interfaz de línea de comandos (CLI) de Hive:

hive

Una vez que la CLI de Hive esté en ejecución, ejecuta el siguiente comando para crear la base de datos magic_realm:

CREATE DATABASE magic_realm;

Deberías ver un mensaje de éxito indicando que la base de datos ha sido creada.

Creando una tabla

Ahora que tenemos una base de datos, creemos nuestra primera tabla dentro de ella. Esta tabla almacenará información sobre las diversas criaturas mágicas que habitan en la Isla de la Barandilla.

Primero, cambia a la base de datos magic_realm ejecutando el siguiente comando en la CLI de Hive:

USE magic_realm;

Luego, crea una tabla llamada creatures con la siguiente estructura:

CREATE TABLE creatures (
  id INT,
  name STRING,
  species STRING,
  habitat STRING
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY ',';

Este comando crea una tabla llamada creatures con cuatro columnas:

  • id: Un valor entero que representa el identificador único de la criatura.
  • name: Un valor de cadena que representa el nombre de la criatura.
  • species: Un valor de cadena que representa la especie de la criatura.
  • habitat: Un valor de cadena que representa el hábitat donde reside la criatura.

La cláusula ROW FORMAT DELIMITED especifica que los datos en la tabla estarán delimitados por comas (,).

Cargando datos en la tabla

Con nuestra tabla creatures creada, es hora de llenarla con datos. Usaremos un archivo de datos de muestra que contiene información sobre diversas criaturas mágicas.

Primero, crea un nuevo directorio llamado data en el directorio /home/hadoop:

mkdir /home/hadoop/data

Luego, crea un archivo llamado creatures.csv en el directorio /home/hadoop/data con el siguiente contenido:

1,Unicornio,Equino,Bosques
2,Fénix,Aviano,Regiones volcánicas
3,Sirena,Acuática,Océanos
4,Grifo,Híbrido,Montañas

Guarda el archivo y sale del editor de texto.

Luego, asegúrate de estar en la shell de Hive. Si no, lánzala ejecutando el siguiente comando:

hive

Cambia a la base de datos magic_realm usando el siguiente comando:

USE magic_realm;

Ahora, podemos cargar los datos de creatures.csv en la tabla creatures usando el siguiente comando en la CLI de Hive:

LOAD DATA LOCAL INPATH '/home/hadoop/data/creatures.csv' INTO TABLE creatures;

Este comando carga los datos del archivo local /home/hadoop/data/creatures.csv en la tabla creatures.

Resumen

En este laboratorio, ayudaste al hechicero Adriano a navegar por el reino de Hadoop Hive y a dominar el arte de la creación de tablas. Aprendiste cómo crear una base de datos, definir estructuras de tablas y cargar datos en tablas. Estas habilidades fundamentales servirán como la piedra angular de tu viaje al mundo de la manipulación y análisis de datos.

A medida que continúes tus estudios, profundizarás en las complejidades de Hadoop Hive, desbloqueando todo su potencial para desentrañar los misterios escondidos dentro de grandes conjuntos de datos. Recuerda, el camino hacia la maestría radica en la práctica diligente y la determinación inquebrantable. Abraza los retos, y déjate guiar por la sabiduría de los antiguos pergaminos hacia convertirse en un verdadero hechicero de datos.