Einführung
In diesem Lab werden wir uns der Welt von Hadoop HDFS widmen und uns auf den FS Shell find-Befehl konzentrieren. Stellen Sie sich vor, Sie wären ein Archäologe, der in einer alten Tempel sucht, um verborgene Schätze und Geheimnisse zu entdecken. Ihr Ziel ist es, den FS Shell find-Befehl zu nutzen, um durch das riesige Hadoop-Dateisystem zu navigieren, genauso wie man verborgene Artefakte in einem Tempel entdeckt.
Umgebung einrichten
In diesem Schritt stellen wir sicher, dass unsere Hadoop-Umgebung richtig eingerichtet ist, bevor wir den FS Shell find-Befehl verwenden.
Öffnen Sie das Terminal und folgen Sie den untenstehenden Schritten, um loszulegen.
Wechseln Sie zum Benutzer
hadoop:su - hadoopÜberprüfen Sie die Hadoop-Version:
hadoop versionErstellen Sie eine Datei
example.txtim Stammverzeichnis von HDFS:echo "This is an example file." | hdfs dfs -put - /example.txt
Dateiinformationen abrufen
In diesem Schritt werden wir demonstrieren, wie man den FS Shell find-Befehl verwendet, um bestimmte Dateien im Hadoop-Dateisystem zu finden.
Suchen Sie nach einer Datei namens
example.txtim Stammverzeichnis von HDFS:hdfs dfs -find / -name "example.txt"Rufen Sie Informationen über die Datei mithilfe des FS Shell stat-Befehls ab:
hdfs dfs -stat "%n %y %r" /example.txt > /home/hadoop/example_info.txt cat /home/hadoop/example_info.txt
Der hdfs dfs -stat-Befehl wird verwendet, um Statusinformationen über Dateien oder Verzeichnisse in HDFS abzurufen. Sie können verschiedene Formatierungsoptionen verwenden, um die Ausgabedaten zu personalisieren. Hier sind einige häufig verwendete Formatierungsoptionen und ihre Bedeutungen:
%b: Dateigröße in Bytes.%n: Dateiname.%o: Blockgröße.%r: Replikationsfaktor.%u: Benutzername.%g: Gruppenname.%y: Änderungszeit im Format yyyy-MM-dd HH:mm:ss.%F: Dateityp (Datei, Verzeichnis oder Symbolink).
Verzeichnisse analysieren
In diesem Schritt werden wir untersuchen, wie man den FS Shell find verwenden kann, um Verzeichnisse und deren Inhalte zu analysieren.
Listen Sie alle Verzeichnisse unter dem Verzeichnis
/userauf:hdfs dfs -ls /userErstellen Sie ein Verzeichnis namens
superDirectoryunter dem Verzeichnis/userund legen Sie seine Berechtigungen auf 777 (rwxrwxrwx) fest:hdfs dfs -mkdir /user/superDirectory hdfs dfs -chmod 777 /user/superDirectoryVerwenden Sie den FS Shell find, um das Verzeichnis
superDirectoryzu finden:hdfs dfs -find /user -name "superDirectory"Verwenden Sie den FS Shell, um Verzeichnisse mit bestimmten Berechtigungen zu identifizieren:
hdfs dfs -ls /user | grep '^drwxrwxrwx'
Zusammenfassung
In diesem Lab haben wir uns der Welt von Hadoop HDFS gewidmet und die Möglichkeiten des FS Shell find-Befehls untersucht. Indem wir eine archäologische Expedition in einem Tempel simuliert haben, haben wir gelernt, wie man effektiv nach Dateien und Verzeichnissen im Hadoop-Dateisystem suchen und analysieren kann. Diese praktische Erfahrung hat uns Einblicke in das Verwalten und Navigieren in komplexen Datenstrukturen in Hadoop gegeben und unser Verständnis von HDFS-Betrieb verbessert.



