Mission de perturbation des données dans un monde dystopique

HadoopHadoopBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Dans un futur dystopique où les machines se sont révoltées contre leurs créateurs, un ingénieur robotique compétent est chargé d'une mission cruciale : infiltrer les rangs des robots et désactiver leur capacité à stocker et à accéder à des données critiques. Les machines, alimentées par l'énorme écosystème Hadoop, ont utilisé des tables Hive pour stocker d'énormes quantités d'informations, alimentant leurs plans malveillants de domination mondiale.

Votre objectif en tant qu'ingénieur robotique est de naviguer dans l'écosystème Hadoop et de supprimer stratégiquement les tables qui contiennent les données les plus précieuses des machines, paralysant leurs opérations et ouvrant la voie à une contre-attaque humaine. Le temps est essentiel, car chaque seconde compte dans cette bataille pour la survie contre les maîtres des machines.

Connectez-vous au cluster Hadoop

Dans cette étape, vous établirez une connexion au cluster Hadoop, qui sert de centre nerveux des opérations de données des machines.

  1. Ouvrez une fenêtre de terminal sur votre machine Linux.

  2. Utilisez la commande su - hadoop pour vous connecter en tant qu'utilisateur hadoop, qui dispose des autorisations nécessaires pour interagir avec l'écosystème Hadoop. L'utilisateur hadoop n'a pas de mot de passe.

    su - hadoop
  3. Accédez au répertoire Hadoop.

    cd /home/hadoop

Démarrez l'interface de ligne de commande (CLI) Hive et créez une table

Dans cette étape, vous lancerez l'interface de ligne de commande (CLI) Hive, qui vous permettra d'interagir avec les tables Hive et d'exécuter des commandes pour les supprimer.

  1. Démarrez l'interface de ligne de commande (CLI) Hive en exécutant la commande suivante dans le terminal :
hive
  1. Vous devriez voir l'invite de commande de l'interface de ligne de commande (CLI) Hive, qui ressemble à hive>.

  2. Créez les tables suivantes en exécutant les commandes SQL fournies :

    • Créez la table my_table :
    CREATE TABLE my_table (
          id INT,
          name STRING
     );

Liste de toutes les tables et modification du nom d'une table

Dans cette étape, vous listerez toutes les tables existantes dans la base de données Hive et changerez le nom de la table que vous avez créée dans l'étape précédente.

  1. Dans l'interface de ligne de commande (CLI) Hive, exécutez la commande suivante pour lister toutes les tables :

    SHOW TABLES;

Cette commande affichera une liste de toutes les tables actuellement présentes dans la base de données Hive.

  1. Utilisez la commande SQL suivante pour changer le nom de la table my_table que vous avez créée dans l'étape précédente en my_table_backup :

    ALTER TABLE my_table RENAME TO my_table_backup;

Supprimez les tables critiques

Avec la liste des tables à votre disposition, il est temps d'attaquer le cœur de l'infrastructure de données des machines. Dans cette étape, vous supprimerez les tables qui contiennent les informations les plus précieuses pour les machines.

  1. Identifiez les tables clés à partir de la liste obtenue dans l'étape précédente. Dans cet exemple, en excluant la table my_table_backup que vous venez de modifier, supposons que les tables clés s'appellent robot_specs et world_domination_plans.

  2. Pour supprimer la table robot_specs, exécutez la commande suivante dans l'interface de ligne de commande (CLI) Hive :

    DROP TABLE robot_specs;
  3. Pour supprimer la table world_domination_plans, exécutez la commande suivante dans l'interface de ligne de commande (CLI) Hive :

    DROP TABLE world_domination_plans;
  4. Vérifiez que les tables ont été supprimées en exécutant à nouveau la commande SHOW TABLES;. Les tables critiques ne devraient plus apparaître dans la liste.

Quittez l'interface de ligne de commande (CLI) Hive et le compte Hadoop

Après avoir supprimé avec succès les tables critiques, il est temps de quitter l'interface de ligne de commande (CLI) Hive et de vous préparer à la prochaine phase de votre mission.

  1. Pour quitter l'interface de ligne de commande (CLI) Hive, exécutez la commande suivante :

    exit;

Vous devriez maintenant être à nouveau à l'invite de commande du terminal Linux.

  1. Quittez le compte utilisateur hadoop en exécutant la commande suivante :

    exit

Sommaire

Dans ce laboratoire, vous avez appris à naviguer dans l'écosystème Hadoop, à interagir avec l'interface de ligne de commande (CLI) Hive et à supprimer stratégiquement les tables critiques utilisées par les machines dans leur quête de domination mondiale. En désactivant leur capacité à stocker et à accéder à des données précieuses, vous avez porté un coup important contre les maîtres des machines, ouvrant la voie à une contre-attaque humaine.

Grâce à cette expérience pratique, vous avez acquis des compétences pratiques dans la manipulation du composant Hadoop Hive, l'exécution de commandes ressemblant à SQL et l'utilisation de la puissance de la manipulation de données pour atteindre vos objectifs. Ce laboratoire vous a non seulement doté d'expertise technique, mais vous a également poussé à penser de manière critique et à appliquer vos connaissances dans un scénario hypothétique à forte enjeu.