Ecosystème Hadoop | Récupération des champignons Updatium

Introduction

Dans un paysage magique où les champignons poussent avec des propriétés magiques, une brave cueilleuse appelée Myca entreprend une quête pour récolter les rares champignons Updatium. Ces champignons rares possèdent le pouvoir extraordinaire de mettre à jour les données dans l'écosystème Hadoop, une compétence convoitée par tous les amateurs de données.

La mission de Myca est de naviguer dans les chemins tortueux de la forêt enchantée, en surmontant des énigmes et des obstacles, pour localiser et récolter les champignons Updatium. Avec chaque récolte réussie, elle débloquera les secrets de la mise à jour des données dans Hive, un composant puissant de l'écosystème Hadoop, et deviendra finalement une maîtresse de la manipulation des données.

Configuration de l'environnement

Dans cette étape, nous allons configurer l'environnement pour notre aventure de chasse aux champignons magiques. Nous allons créer une nouvelle table Hive pour stocker les données sur les champignons que nous trouvons.

Tout d'abord, assurez-vous d'être connecté en tant qu'utilisateur hadoop en exécutant la commande suivante dans le terminal :

su - hadoop

Maintenant, lançons l'interface de ligne de commande Hive :

hive

Ensuite, nous allons créer une nouvelle base de données appelée wonderland :

CREATE DATABASE wonderland;

Une fois la base de données créée, nous allons l'utiliser et créer une nouvelle table appelée mushrooms :

USE wonderland;

CREATE TABLE mushrooms (
    id INT,
    name STRING,
    type STRING,
    location STRING
)
CLUSTERED BY (id) INTO 2 BUCKETS
STORED AS ORC
TBLPROPERTIES ('transactional'='true');

Cette table stockera l'ID, le nom, le type et l'emplacement de chaque champignon que nous trouverons dans le paysage magique. Cette table peut prendre en charge les opérations UPDATE en déclarant la table comme transactionnelle et en la stockant au format ORC.

Récolte des champignons Updatium

Dans cette étape, nous allons récolter les champignons Updatium et insérer leurs données dans la table mushrooms que nous avons créée précédemment.

Tout d'abord, insérons quelques données d'échantillonnage dans la table mushrooms :

INSERT INTO mushrooms VALUES
(1, 'Chanterelle', 'Edible', 'Forest'),
(2, 'Portobello', 'Edible', 'Field'),
(3, 'Amanita muscaria', 'Toxic', 'Forest'),
(4, 'Shiitake', 'Edible', 'Farm'),
(5, 'Oyster', 'Edible', 'Forest');

Ensuite, nous allons mettre à jour la colonne type pour un champignon spécifique. Disons que nous avons découvert que le champignon avec l'ID 3 est en fait un champignon Updatium :

UPDATE mushrooms SET type = 'Updatium' WHERE id = 3;

Cette commande mettra à jour la colonne type en 'Updatium' pour la ligne où id est égal à 3.

Vous pouvez vérifier la mise à jour en interrogeant la table :

SELECT * FROM mushrooms WHERE id = 3;

Mise à jour de plusieurs lignes

Dans cette étape, nous allons mettre à jour la colonne location pour tous les champignons Updatium afin d'indiquer qu'ils ont été récoltés.

Tout d'abord, vérifions combien de champignons Updatium nous avons dans la table :

SELECT COUNT(*) FROM mushrooms WHERE type = 'Updatium';

Maintenant, mettons à jour la colonne location pour tous les champignons Updatium :

UPDATE mushrooms SET location = 'Harvested' WHERE type = 'Updatium';

Cette commande mettra à jour la colonne location en 'Harvested' pour toutes les lignes où type est 'Updatium'.

Vous pouvez vérifier la mise à jour en interrogeant à nouveau la table :

SELECT * FROM mushrooms WHERE type = 'Updatium';

Résumé

Dans ce laboratoire, nous avons entrepris une aventure magique dans le paysage magique, apprenant à mettre à jour des données dans Hive, un composant puissant de l'écosystème Hadoop. Nous avons créé une nouvelle base de données et une table pour stocker les données sur les champignons que nous avons trouvés, chargé des données d'échantillonnage et pratiqué la mise à jour de lignes individuelles et multiples en utilisant l'instruction UPDATE.

Grâce à cette expérience pratique, nous avons non seulement maîtrisé l'art de la mise à jour de données, mais avons également acquis des connaissances précieuses sur le monde de Hadoop et Hive. En terminant ce laboratoire, nous avons débloqué les secrets des champignons Updatium, devenant compétents dans la manipulation des données et consolidant notre compréhension de l'écosystème Hadoop.

La quête des champignons Updatium dans le paysage magique de Hadoop

Introduction

Configuration de l'environnement

Récolte des champignons Updatium

Mise à jour de plusieurs lignes

Résumé