Techniques avancées de comptage de texte
Dans cette étape, vous apprendrez à combiner la commande wc
avec d'autres commandes en utilisant des pipes (tubes) pour effectuer des tâches d'analyse de texte plus complexes.
Utilisation de wc
avec des pipes
Le pouvoir des commandes Linux réside dans la capacité de les combiner à l'aide de pipes (|
). Un pipe envoie la sortie d'une commande en tant qu'entrée à une autre commande.
Créons un fichier texte plus complexe avec lequel travailler :
cat > ~/project/article.txt << EOF
Linux Text Processing
====================
Text processing is one of the fundamental skills for any Linux user.
The command line offers powerful tools for processing and analyzing text.
Some of the most common text processing commands include:
- grep: for searching text
- sed: for text transformation
- awk: for pattern scanning and processing
- wc: for counting
This article explores the wc command in detail.
EOF
Comptage de lignes spécifiques
Vous pouvez utiliser grep
pour trouver des lignes spécifiques, puis les compter avec wc
:
- Comptez combien de lignes contiennent le mot "text" :
grep -i "text" ~/project/article.txt | wc -l
L'option -i
rend la recherche insensible à la casse. Cette commande devrait afficher :
3
Cela signifie qu'il y a 3 lignes contenant le mot "text" (en toutes lettres) dans le fichier.
Comptage de mots dans un texte spécifique
Vous pouvez également compter les mots dans des parties spécifiques d'un fichier :
- Comptez le nombre de mots dans les lignes contenant "command" :
grep "command" ~/project/article.txt | wc -w
Sortie :
14
Cela vous indique qu'il y a 14 mots dans les lignes qui contiennent le mot "command".
Tri des fichiers par nombre de lignes
Combinons ce que nous avons appris avec la commande sort
pour organiser nos fichiers par nombre de lignes :
wc -l ~/project/*.txt | sort -n
Cette commande :
- Compte les lignes de tous les fichiers texte
- Utilise
sort -n
pour trier les résultats numériquement (par le nombre de lignes)
La sortie répertoriera les fichiers par ordre croissant de leur nombre de lignes, le fichier ayant le moins de lignes étant affiché en premier.
Analyse de la sortie d'une commande
Vous pouvez utiliser wc
pour compter la sortie de n'importe quelle commande. Par exemple, pour compter combien de fichiers se trouvent dans le répertoire du projet :
ls ~/project | wc -l
Cela vous indique le nombre d'entrées (fichiers et répertoires) dans le répertoire du projet.
Pour un autre exemple, pour compter combien de processus sont actuellement en cours d'exécution :
ps aux | wc -l
La sortie sera le nombre de lignes dans la liste des processus, qui inclut une ligne d'en-tête (donc le nombre réel de processus est inférieur d'une unité au nombre affiché).