Técnicas Avançadas de Contagem de Texto
Nesta etapa, você aprenderá como combinar o comando wc com outros comandos usando pipes para realizar tarefas de análise de texto mais complexas.
Usando wc com Pipes (Canais)
O poder dos comandos Linux vem da capacidade de combiná-los usando pipes (|). Um pipe envia a saída de um comando como entrada para outro comando.
Vamos criar um arquivo de texto mais complexo para trabalhar:
cat > ~/project/article.txt << EOF
Linux Text Processing
====================
Text processing is one of the fundamental skills for any Linux user.
The command line offers powerful tools for processing and analyzing text.
Some of the most common text processing commands include:
- grep: for searching text
- sed: for text transformation
- awk: for pattern scanning and processing
- wc: for counting
This article explores the wc command in detail.
EOF
Contando Linhas Específicas
Você pode usar grep para encontrar linhas específicas e, em seguida, contá-las com wc:
- Conte quantas linhas contêm a palavra "text":
grep -i "text" ~/project/article.txt | wc -l
A opção -i torna a pesquisa case-insensitive (sem distinção entre maiúsculas e minúsculas). Este comando deve produzir:
3
Isso significa que existem 3 linhas contendo a palavra "text" (em qualquer caso) no arquivo.
Contando Palavras em Texto Específico
Você também pode contar palavras em partes específicas de um arquivo:
- Conte o número de palavras nas linhas contendo "command":
grep "command" ~/project/article.txt | wc -w
Saída:
14
Isso informa que há 14 palavras nas linhas que contêm a palavra "command".
Classificando Arquivos por Contagem de Linhas
Vamos combinar o que aprendemos com o comando sort para organizar nossos arquivos por contagem de linhas:
wc -l ~/project/*.txt | sort -n
Este comando:
- Conta as linhas em todos os arquivos de texto
- Usa
sort -n para classificar os resultados numericamente (pelo número de linhas)
A saída listará os arquivos em ordem crescente por sua contagem de linhas, com o arquivo que tem menos linhas primeiro.
Analisando a Saída do Comando
Você pode usar wc para contar a saída de qualquer comando. Por exemplo, para contar quantos arquivos estão no diretório do projeto:
ls ~/project | wc -l
Isso informa o número de entradas (arquivos e diretórios) no diretório do projeto.
Para outro exemplo, para contar quantos processos em execução você tem atualmente:
ps aux | wc -l
A saída será o número de linhas na lista de processos, que inclui uma linha de cabeçalho (portanto, o número real de processos é um a menos que o número exibido).