Nous allons apprendre quelques commandes utiles pour le traitement de texte. Avant de commencer, créons un fichier pour travailler. Copiez et collez la commande suivante. Après avoir collé, vous devrez ajouter un caractère TAB littéral entre "lazy" et "dog" (vous pouvez souvent le faire en appuyant sur Ctrl-v puis TAB).
echo 'The quick brown; fox jumps over the lazy dog' > sample.txt
La première commande que nous allons explorer est cut, qui extrait des portions de texte d'un fichier.
Découpage par Caractère
Vous pouvez extraire du contenu basé sur la position des caractères en utilisant l'indicateur -c.
cut -c 5 sample.txt
Cette commande affiche le 5ème caractère de chaque ligne du fichier. Dans notre cas, le résultat est "q". Notez que les espaces comptent également comme des caractères.
Découpage par Champ avec cut f
Une fonctionnalité plus puissante est le découpage par champs. La syntaxe cut f, utilisant l'indicateur -f, vous permet d'extraire du texte basé sur la position du champ. Par défaut, cut utilise le caractère TAB comme délimiteur, ce qui signifie que tout ce qui est séparé par un TAB est considéré comme un champ distinct.
Voyons comment découper f basé sur les champs :
cut -f 2 sample.txt
Puisque nous avons inséré une TAB entre "lazy" et "dog", cette commande traite "dog" comme le deuxième champ. Votre résultat devrait être "dog".
Utilisation de Délimiteurs Personnalisés
Vous pouvez également combiner l'indicateur de champ avec l'indicateur de délimiteur (-d) pour spécifier un délimiteur personnalisé. Ceci est utile lorsque vous travaillez avec des fichiers qui utilisent des caractères comme des virgules ou des points-virgules pour séparer les données.
cut -f 1 -d ";" sample.txt
Cette commande change le délimiteur de TAB à point-virgule (";"). Puisque nous découpons le premier champ (-f 1), le résultat sera "The quick brown".