Hadoop FS Shell appendToFile

HadoopHadoopBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Willkommen in unserem Hadoop FS Shell-Labor im Wilden Westen! Sie sind ein Goldgräber namens Jack, der gerade in einer alten Mine eine reiche Goldader entdeckt hat. Ihre Aufgabe besteht darin, die appendToFile-Funktion des Hadoop HDFS FS Shells zu nutzen, um Ihre Bergbaudaten effizient zu verwalten und zu aktualisieren.


Skills Graph

%%%%{init: {'theme':'neutral'}}%%%% flowchart RL hadoop(("Hadoop")) -.-> hadoop/HadoopHDFSGroup(["Hadoop HDFS"]) hadoop(("Hadoop")) -.-> hadoop/HadoopHiveGroup(["Hadoop Hive"]) hadoop/HadoopHDFSGroup -.-> hadoop/hdfs_setup("HDFS Setup") hadoop/HadoopHDFSGroup -.-> hadoop/fs_cat("FS Shell cat") hadoop/HadoopHDFSGroup -.-> hadoop/fs_mkdir("FS Shell mkdir") hadoop/HadoopHiveGroup -.-> hadoop/import_export_data("Importing and Exporting Data") subgraph Lab Skills hadoop/hdfs_setup -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_cat -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/fs_mkdir -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} hadoop/import_export_data -.-> lab-271861{{"Hadoop FS Shell appendToFile"}} end

Erstellen und Anhängen von Daten an eine Datei

In diesem Schritt erstellen Sie eine neue Datei im HDFS, schreiben einige Anfangsdaten hinein und fügen dann weitere Daten zur Datei hinzu, indem Sie den Befehl appendToFile verwenden.

  1. Wechseln Sie im Terminal zum Benutzer hadoop:

    su - hadoop
  2. Erstellen Sie eine neue Datei mit dem Namen mining_data.txt im Verzeichnis /home/hadoop mit Anfangsinhalt:

    echo "Initial data for mining analysis" > mining_data.txt
  3. Erstellen Sie eine neue Datei mit dem Namen mining_data.txt im HDFS-Verzeichnis /:

    hdfs dfs -touchz /mining_data.txt
  4. Fügen Sie weitere Daten zur Datei mining_data.txt hinzu:

    hdfs dfs -appendToFile /home/hadoop/mining_data.txt /mining_data.txt

Hier ist eine Erklärung des Befehls und seiner Komponenten:

  • hdfs: Dies ist das Befehlszeilentool zum Interagieren mit HDFS.
  • dfs: Dies ist ein Unterbefehl des hdfs-Tools und wird speziell zum Arbeiten mit HDFS verwendet.
  • -appendToFile: Dies ist eine Option des hdfs dfs-Befehls und gibt an, dass die Daten an die Zieldatei angehängt werden sollen.
  • /home/hadoop/mining_data.txt: Dies ist der Pfad zur Quelldatei, die die hinzuzufügenden Daten enthält.
  • /mining_data.txt: Dies ist der Pfad zur Zieldatei im HDFS, an die die Daten angehängt werden.

Wenn der Befehl hdfs dfs -appendToFile ausgeführt wird, liest er die Daten aus der angegebenen Quelldatei und fügt sie der Zieldatei im HDFS hinzu.

Anzeigen und Aktualisieren der angehängten Daten

In diesem Schritt werden Sie den Inhalt der Datei mining_data.txt anzeigen, ihr weitere Daten hinzufügen und dann die Änderungen überprüfen.

  1. Zeigen Sie den aktuellen Inhalt der Datei mining_data.txt an:

    hdfs dfs -cat /mining_data.txt
  2. Fügen Sie zusätzliche Daten zur Datei hinzu:

    echo "New mining data for analysis" | hdfs dfs -appendToFile - /mining_data.txt
  3. Überprüfen Sie den aktualisierten Inhalt der Datei:

    hdfs dfs -cat /mining_data.txt

Zusammenfassung

In diesem Labor haben wir die appendToFile-Operation im Hadoop FS Shell untersucht, um Daten im HDFS effizient zu verwalten und zu aktualisieren. Indem Sie den hier bereitgestellten Schritten folgen, haben Sie gelernt, wie Sie Dateien im HDFS erstellen, anhängen und aktualisieren, indem Sie die FS Shell-Befehle verwenden. Diese praktische Erfahrung wird Ihnen bei Ihrem Weg zur Beherrschung der HDFS-Operationen in Hadoop von Wert sein. Frohe Bergbauarbeiten!