Eliminación de archivos en Hadoop
La eliminación de archivos en el Hadoop Distributed File System (HDFS) es un proceso sencillo. El comando hadoop fs -rm
se utiliza para eliminar archivos o directorios de HDFS.
Eliminar un archivo
Para eliminar un archivo de HDFS, utilice el siguiente comando:
hadoop fs -rm <hdfs_file_path>
Por ejemplo, para eliminar el archivo example.txt
del directorio /user/hadoop
en HDFS, ejecutaría:
hadoop fs -rm /user/hadoop/example.txt
Eliminar un directorio
Para eliminar un directorio y su contenido de HDFS, puede utilizar la opción -r
(recursiva):
hadoop fs -rm -r <hdfs_directory_path>
Por ejemplo, para eliminar el directorio /user/hadoop/data
y todo su contenido, ejecutaría:
hadoop fs -rm -r /user/hadoop/data
Omitir la papelera
Por defecto, HDFS utiliza una función de papelera, lo que significa que los archivos eliminados no se eliminan inmediatamente del sistema de archivos. En lugar de eso, se mueven a un directorio de papelera, donde se pueden restaurar si es necesario. Sin embargo, en algunos casos, es posible que desee omitir la papelera y eliminar permanentemente un archivo.
Para eliminar permanentemente un archivo, omitiendo la papelera, puede utilizar la opción -skipTrash
:
hadoop fs -rm -skipTrash <hdfs_file_path>
Esto eliminará inmediatamente el archivo de HDFS sin moverlo al directorio de papelera.
Comprender las diversas opciones de eliminación de archivos en HDFS le ayudará a gestionar de manera efectiva sus datos almacenados en el ecosistema de Hadoop.