Vamos aprender alguns comandos úteis para processar texto. Antes de começar, vamos criar um arquivo para trabalhar. Copie e cole o seguinte comando. Após colar, você precisará adicionar um caractere TAB literal entre "lazy" e "dog" (você pode fazer isso frequentemente pressionando Ctrl-v e depois TAB).
echo 'The quick brown; fox jumps over the lazy dog' > sample.txt
O primeiro comando que exploraremos é o cut, que extrai porções de texto de um arquivo.
Cortando por Caractere
Você pode extrair conteúdo com base na posição do caractere usando a flag -c.
cut -c 5 sample.txt
Este comando exibe o 5º caractere de cada linha do arquivo. No nosso caso, a saída é "q". Note que espaços também contam como caracteres.
Cortando por Campo com cut f
Um recurso mais poderoso é cortar por campos. A sintaxe cut f, usando a flag -f, permite extrair texto com base na posição do campo. Por padrão, cut usa o caractere TAB como delimitador, o que significa que tudo separado por um TAB é considerado um campo distinto.
Vamos ver como cortar f com base em campos:
cut -f 2 sample.txt
Como inserimos um TAB entre "lazy" e "dog", este comando trata "dog" como o segundo campo. Sua saída deve ser "dog".
Usando Delimitadores Personalizados
Você também pode combinar a flag de campo com a flag de delimitador (-d) para especificar um delimitador personalizado. Isso é útil ao trabalhar com arquivos que usam caracteres como vírgulas ou ponto e vírgula para separar dados.
cut -f 1 -d ";" sample.txt
Este comando altera o delimitador de TAB para ponto e vírgula (;). Como estamos cortando o primeiro campo (-f 1), o resultado será "The quick brown".