Introducción
Bienvenido a nuestro emocionante laboratorio ubicado en una base interestelar donde desempeñas el papel de un habilidoso comunicador interestelar. En este escenario, te encomiendan la gestión del Hadoop HDFS utilizando el comando expunge de la FS Shell para mantener la integridad de los datos y optimizar el uso del almacenamiento. Tu misión es garantizar la limpieza eficiente de archivos y directorios innecesarios para liberar espacio de almacenamiento y mejorar el rendimiento del sistema.
Habilitando y configurando la característica de Papelera de HDFS
En este paso, comenzaremos accediendo a la Shell de FS de Hadoop y examinando los archivos y directorios actuales en el Sistema de Archivos Distribuido de Hadoop.
Abra la terminal y cambie al usuario
hadoop:su - hadoopModifique
/home/hadoop/hadoop/etc/hadoop/core-site.xmlpara habilitar la característica de Papelera:nano /home/hadoop/hadoop/etc/hadoop/core-site.xmlAgregue la siguiente propiedad entre las etiquetas
<configuration>:<property> <name>fs.trash.interval</name> <value>1440</value> </property> <property> <name>fs.trash.checkpoint.interval</name> <value>1440</value> </property>Guarde el archivo y salga del editor de texto.
reinicie el servicio de HDFS:
Detenga el servicio de HDFS:
/home/hadoop/hadoop/sbin/stop-dfs.shInicie el servicio de HDFS:
/home/hadoop/hadoop/sbin/start-dfs.shCree un archivo y agréguelo a la Papelera en el HDFS:
Cree un archivo en el HDFS:
hdfs dfs -touchz /user/hadoop/test.txtElimine el archivo:
hdfs dfs -rm /user/hadoop/test.txtVerifique si la característica de Papelera está habilitada:
hdfs dfs -ls /user/hadoop/.Trash/Current/user/hadoop/Debería ver el archivo que eliminó en el directorio de la Papelera.
Eliminar archivos innecesarios
Ahora, procedamos a eliminar archivos y directorios innecesarios utilizando el comando expunge de la FS Shell.
Elimine todos los puntos de control de la Papelera:
hdfs dfs -expunge -immediateVerifique que los archivos innecesarios se hayan eliminado correctamente:
hdfs dfs -ls /user/hadoop/.TrashNo debería haber archivos o directorios listados.
Resumen
En este laboratorio, exploramos el poder del comando expunge de la Shell de FS de Hadoop para administrar y optimizar el almacenamiento de datos en el Sistema de Archivos Distribuido de Hadoop. Al aprender a iniciar la Shell de FS, visualizar archivos actuales y eliminar datos innecesarios, has adquirido valiosos conocimientos sobre cómo mantener la integridad de los datos y mejorar el rendimiento del sistema. La práctica de estas habilidades te habilitará para administrar eficientemente tu entorno de Hadoop y garantizar un funcionamiento sin problemas.



