Introduction
Bienvenue dans notre incroyable laboratoire situé dans une base interstellaire où vous incarnez le rôle d'un communicateur intergalactique compétent. Dans ce scénario, vous êtes chargé de gérer le Hadoop HDFS en utilisant la commande expunge de la FS Shell pour maintenir l'intégrité des données et optimiser l'utilisation de l'espace de stockage. Votre mission est d'assurer le nettoyage efficace des fichiers et répertoires inutiles pour libérer de l'espace de stockage et améliorer les performances du système.
Activation et configuration de la fonction de corbeille HDFS
Dans cette étape, commençons par accéder à la console FS Hadoop et examiner les fichiers et répertoires actuels dans le système de fichiers distribué Hadoop.
Ouvrez un terminal et basculez sur l'utilisateur
hadoop:su - hadoopModifiez
/home/hadoop/hadoop/etc/hadoop/core-site.xmlpour activer la fonction de corbeille :nano /home/hadoop/hadoop/etc/hadoop/core-site.xmlAjoutez la propriété suivante entre les balises
<configuration>:<property> <name>fs.trash.interval</name> <value>1440</value> </property> <property> <name>fs.trash.checkpoint.interval</name> <value>1440</value> </property>Enregistrez le fichier et quittez l'éditeur de texte.
Redémarrez le service HDFS :
Arrêtez le service HDFS :
/home/hadoop/hadoop/sbin/stop-dfs.shDémarrez le service HDFS :
/home/hadoop/hadoop/sbin/start-dfs.shCréez un fichier et supprimez-le dans le HDFS :
Créez un fichier dans le HDFS :
hdfs dfs -touchz /user/hadoop/test.txtSupprimez le fichier :
hdfs dfs -rm /user/hadoop/test.txtVérifiez si la fonction de corbeille est activée :
hdfs dfs -ls /user/hadoop/.Trash/Current/user/hadoop/Vous devriez voir le fichier que vous avez supprimé dans le répertoire de corbeille.
Supprimer les fichiers inutiles
Maintenant, passons à la suppression des fichiers et répertoires inutiles en utilisant la commande expunge de la FS Shell.
Supprimez tous les points de contrôle de la corbeille :
hdfs dfs -expunge -immediateVérifiez que les fichiers inutiles ont été supprimés avec succès :
hdfs dfs -ls /user/hadoop/.TrashAucun fichier ou répertoire ne devrait être listé.
Résumé
Dans ce laboratoire, nous avons exploré le pouvoir de la commande expunge de la FS Shell Hadoop pour gérer et optimiser le stockage de données dans le système de fichiers distribué Hadoop. En apprenant à lancer la FS Shell, à visualiser les fichiers actuels et à supprimer les données inutiles, vous avez acquis des connaissances précieuses sur le maintien de l'intégrité des données et l'amélioration des performances du système. La pratique de ces compétences vous permettra de gérer efficacement votre environnement Hadoop et d'assurer des opérations sans heurts.



