La búsqueda del Updatium en el mundo mágico de Hadoop

HadoopHadoopBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En un mundo mágico y caprichoso donde los hongos brotan con propiedades mágicas, una valiente recolectora llamada Myca emprende una búsqueda para cosechar los raros hongos Updatium. Estos hongos raros poseen el poder extraordinario de actualizar datos en el ecosistema Hadoop, una habilidad deseada por todos los entusiastas de los datos.

La misión de Myca es navegar por los senderos tortuosos del bosque encantado, superando acertijos y obstáculos, para localizar y cosechar los hongos Updatium. Con cada cosecha exitosa, ella desbloqueará los secretos de la actualización de datos en Hive, un componente poderoso del ecosistema Hadoop, y finalmente se convertirá en una maestra de la manipulación de datos.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop/HadoopHiveGroup -.-> hadoop/manage_db("Managing Database") hadoop/HadoopHiveGroup -.-> hadoop/create_tables("Creating Tables") hadoop/HadoopHiveGroup -.-> hadoop/load_insert_data("Loading and Inserting Data") hadoop/HadoopHiveGroup -.-> hadoop/update_data("Updating Data") hadoop/HadoopHiveGroup -.-> hadoop/where("where Usage") hadoop/HadoopHiveGroup -.-> hadoop/storage_formats("Choosing Storage Formats") subgraph Lab Skills hadoop/manage_db -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} hadoop/create_tables -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} hadoop/load_insert_data -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} hadoop/update_data -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} hadoop/where -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} hadoop/storage_formats -.-> lab-289005{{"La búsqueda del Updatium en el mundo mágico de Hadoop"}} end

Configuración del entorno

En este paso, configuraremos el entorno para nuestra aventura de caza de hongos mágicos. Crearemos una nueva tabla en Hive para almacenar los datos sobre los hongos que encontremos.

Primero, asegúrese de estar registrado como el usuario hadoop ejecutando el siguiente comando en la terminal:

su - hadoop

Ahora, iniciemos la CLI de Hive:

hive

A continuación, crearemos una nueva base de datos llamada wonderland:

CREATE DATABASE wonderland;

Una vez creada la base de datos, la usaremos y crearemos una nueva tabla llamada mushrooms:

USE wonderland;

CREATE TABLE mushrooms (
    id INT,
    name STRING,
    type STRING,
    location STRING
)
CLUSTERED BY (id) INTO 2 BUCKETS
STORED AS ORC
TBLPROPERTIES ('transactional'='true');

Esta tabla almacenará el ID, el nombre, el tipo y la ubicación de cada hongo que encontremos en el mundo mágico.
Esta tabla puede admitir operaciones de UPDATE declarando la tabla como transactional y almacenándola en el formato ORC.

Cosechando los hongos Updatium

En este paso, cosecharemos los hongos Updatium e insertaremos sus datos en la tabla mushrooms que creamos anteriormente.

Primero, insertemos algunos datos de muestra en la tabla mushrooms:

INSERT INTO mushrooms VALUES
(1, 'Chanterelle', 'Edible', 'Forest'),
(2, 'Portobello', 'Edible', 'Field'),
(3, 'Amanita muscaria', 'Toxic', 'Forest'),
(4, 'Shiitake', 'Edible', 'Farm'),
(5, 'Oyster', 'Edible', 'Forest');

A continuación, actualizaremos la columna type para un hongo específico. Digamos que descubrimos que el hongo con ID 3 es en realidad un hongo Updatium:

UPDATE mushrooms SET type = 'Updatium' WHERE id = 3;

Este comando actualizará la columna type a 'Updatium' para la fila donde id es 3.

Puedes verificar la actualización consultando la tabla:

SELECT * FROM mushrooms WHERE id = 3;

Actualizando múltiples filas

En este paso, actualizaremos la columna location para todos los hongos Updatium para indicar que han sido cosechados.

Primero, veamos cuántos hongos Updatium tenemos en la tabla:

SELECT COUNT(*) FROM mushrooms WHERE type = 'Updatium';

Ahora, actualizaremos la columna location para todos los hongos Updatium:

UPDATE mushrooms SET location = 'Harvested' WHERE type = 'Updatium';

Este comando actualizará la columna location a 'Harvested' para todas las filas donde type es 'Updatium'.

Puedes verificar la actualización consultando la tabla nuevamente:

SELECT * FROM mushrooms WHERE type = 'Updatium';

Resumen

En este laboratorio, emprendimos una aventura mágica por el mundo mágico, aprendiendo cómo actualizar datos en Hive, un componente poderoso del ecosistema Hadoop. Creamos una nueva base de datos y tabla para almacenar datos sobre los hongos que encontramos, cargamos datos de muestra y practicamos la actualización de una y múltiples filas utilizando la instrucción UPDATE.

A través de esta experiencia práctica, no solo dominamos el arte de actualizar datos, sino que también adquirimos valiosos conocimientos sobre el mundo de Hadoop y Hive. Al completar este laboratorio, hemos desbloqueado los secretos de los hongos Updatium, convirtiéndonos en expertos en la manipulación de datos y consolidando nuestra comprensión del ecosistema Hadoop.