Updatium Quest in Hadoop Wonderland

HadoopBeginner
Jetzt üben

Einführung

In einem phantastischen Wunderland, in dem Pilze mit magischen Eigenschaften wachsen, beginnt eine tapfere Pflückerin namens Myca eine Suche nach den schwer zu findenden Updatium-Pilzen. Diese seltenen Pilze besitzen die außergewöhnliche Fähigkeit, Daten im Hadoop-Ekosystem zu aktualisieren, ein Talent, das von allen Daten-Enthusiasten begehrt wird.

Mycas Aufgabe ist es, sich durch die windenden Pfade des verzauberten Waldes zu kämpfen, Rätsel und Hindernisse zu überwinden, um die Updatium-Pilze zu finden und zu ernten. Mit jeder erfolgreichen Ernte wird sie die Geheimnisse der Datenaktualisierung in Hive, einem leistungsstarken Bestandteil des Hadoop-Ekosystems, enthüllen und schließlich eine Meisterin der Datenmanipulation werden.

Umgebung einrichten

In diesem Schritt werden wir die Umgebung für unsere magische Pilzjagd-Entdeckungsreise einrichten. Wir werden eine neue Hive-Tabelle erstellen, um die Daten über die Pilze zu speichern, die wir finden.

Stellen Sie zunächst sicher, dass Sie als Benutzer hadoop angemeldet sind, indem Sie den folgenden Befehl in der Konsole ausführen:

su - hadoop

Lassen Sie uns nun die Hive-Befehlszeilenschnittstelle starten:

hive

Als Nächstes werden wir eine neue Datenbank namens wonderland erstellen:

CREATE DATABASE wonderland;

Sobald die Datenbank erstellt ist, verwenden wir sie und erstellen eine neue Tabelle namens mushrooms:

USE wonderland;

CREATE TABLE mushrooms (
    id INT,
    name STRING,
    type STRING,
    location STRING
)
CLUSTERED BY (id) INTO 2 BUCKETS
STORED AS ORC
TBLPROPERTIES ('transactional'='true');

Diese Tabelle wird die ID, den Namen, den Typ und den Standort jedes Pilzes speichern, den wir in dem Wunderland finden. Diese Tabelle kann UPDATE-Operationen unterstützen, indem die Tabelle als transactional deklariert und im ORC-Format gespeichert wird.

Ernten der Updatium-Pilze

In diesem Schritt werden wir die Updatium-Pilze ernten und ihre Daten in die zuvor erstellte Tabelle mushrooms einfügen.

Zunächst fügen wir einige Beispiel-Daten in die Tabelle mushrooms ein:

INSERT INTO mushrooms VALUES
(1, 'Chanterelle', 'Edible', 'Forest'),
(2, 'Portobello', 'Edible', 'Field'),
(3, 'Amanita muscaria', 'Toxic', 'Forest'),
(4, 'Shiitake', 'Edible', 'Farm'),
(5, 'Oyster', 'Edible', 'Forest');

Als Nächstes aktualisieren wir die type-Spalte für einen bestimmten Pilz. Angenommen, wir haben herausgefunden, dass der Pilz mit der ID 3 tatsächlich ein Updatium-Pilz ist:

UPDATE mushrooms SET type = 'Updatium' WHERE id = 3;

Dieser Befehl aktualisiert die type-Spalte auf 'Updatium' für die Zeile, in der id 3 ist.

Sie können die Aktualisierung überprüfen, indem Sie die Tabelle abfragen:

SELECT * FROM mushrooms WHERE id = 3;

Aktualisieren mehrerer Zeilen

In diesem Schritt werden wir die location-Spalte für alle Updatium-Pilze aktualisieren, um anzuzeigen, dass sie geerntet wurden.

Zunächst überprüfen wir, wie viele Updatium-Pilze wir in der Tabelle haben:

SELECT COUNT(*) FROM mushrooms WHERE type = 'Updatium';

Jetzt aktualisieren wir die location-Spalte für alle Updatium-Pilze:

UPDATE mushrooms SET location = 'Harvested' WHERE type = 'Updatium';

Dieser Befehl aktualisiert die location-Spalte auf 'Harvested' für alle Zeilen, in denen type 'Updatium' ist.

Sie können die Aktualisierung überprüfen, indem Sie die Tabelle erneut abfragen:

SELECT * FROM mushrooms WHERE type = 'Updatium';

Zusammenfassung

In diesem Lab haben wir eine magische Reise durch das Wunderland unternommen und gelernt, wie man Daten in Hive, einem leistungsstarken Bestandteil des Hadoop-Ekosystems, aktualisiert. Wir haben eine neue Datenbank und Tabelle erstellt, um Daten über die Pilze zu speichern, die wir gefunden haben, Beispiel-Daten geladen und das Aktualisieren von einzelnen und mehreren Zeilen mit der UPDATE-Anweisung praktiziert.

Durch diese praktische Erfahrung haben wir nicht nur die Kunst des Datenaktualisierens beherrscht, sondern auch wertvolle Einblicke in die Welt von Hadoop und Hive gewonnen. Indem wir dieses Lab abgeschlossen haben, haben wir die Geheimnisse der Updatium-Pilze entschlüsselt, uns in der Datenmanipulation bewandert gemacht und unser Verständnis des Hadoop-Ekosystems festigt.