Analyser l'utilisation du disque dans le HDFS
Analyser l'utilisation du disque dans le HDFS est essentiel pour comprendre la consommation de stockage et gérer les ressources de votre cluster Hadoop. Le HDFS fournit plusieurs commandes et outils pour vous aider à analyser l'utilisation du disque.
Commandes d'utilisation du disque HDFS
La commande principale pour analyser l'utilisation du disque dans le HDFS est hdfs dfs -du
. Cette commande affiche l'utilisation du disque pour un chemin donné ou pour l'ensemble du système de fichiers.
## Display the disk usage for the entire HDFS file system
hdfs dfs -du /
## Display the disk usage for a specific directory
hdfs dfs -du /user/hadoop
La sortie de la commande hdfs dfs -du
montre la taille totale des fichiers et des répertoires dans le chemin spécifié.
1234567890 /user/hadoop/file1.txt
987654321 /user/hadoop/file2.txt
2222222222 /user/hadoop/directory/
Pour obtenir une vue plus détaillée de l'utilisation du disque, vous pouvez utiliser l'option -h
pour afficher les tailles de fichiers dans un format lisible par l'homme.
## Display the disk usage in a human-readable format
hdfs dfs -du -h /
Analyse récursive de l'utilisation du disque
Pour analyser l'utilisation du disque de manière récursive, vous pouvez utiliser les options -s
(sommaire) et -h
(lisible par l'homme) avec la commande hdfs dfs -du
.
## Display the recursive disk usage in a human-readable format
hdfs dfs -dus -h /
Cette commande fournira un résumé de l'utilisation du disque pour l'ensemble du système de fichiers HDFS, y compris tous les sous-répertoires et fichiers.
1.2 GB /user
500 MB /tmp
2.3 GB /data
En comprenant l'utilisation du disque dans le HDFS, vous pouvez identifier les zones de forte consommation de stockage et prendre les mesures appropriées pour optimiser l'utilisation de votre cluster Hadoop.