我们将学习几个用于处理文本的有用命令。在开始之前,让我们创建一个用于操作的文件。复制并粘贴以下命令。粘贴后,您需要在 "lazy" 和 "dog" 之间添加一个字面上的 TAB 字符(您通常可以通过按 Ctrl-v 然后按 TAB 来实现)。
echo 'The quick brown; fox jumps over the lazy dog' > sample.txt
我们首先探索的命令是 cut,它用于从文件中提取文本部分。
按字符切割
您可以使用 -c 标志根据字符位置提取内容。
cut -c 5 sample.txt
此命令输出文件中每行的第 5 个字符。在我们的例子中,输出是 "q"。请注意,空格也算作字符。
使用 cut f 按字段切割
一个更强大的功能是按字段切割。cut f 语法使用 -f 标志,允许您根据字段位置提取文本。默认情况下,cut 使用 TAB 字符作为分隔符,这意味着由 TAB 分隔的所有内容都被视为一个独立的字段。
让我们看看如何根据字段使用 cut f:
cut -f 2 sample.txt
由于我们在 "lazy" 和 "dog" 之间插入了一个 TAB,此命令将 "dog" 视为第二个字段。您的输出应该是 "dog"。
使用自定义分隔符
您还可以将字段标志与分隔符标志 (-d) 结合使用,以指定自定义分隔符。当处理使用逗号或分号等字符分隔数据的文件时,这非常有用。
cut -f 1 -d ";" sample.txt
此命令将分隔符从 TAB 更改为分号 (;)。由于我们正在切割第一个字段 (-f 1),结果将是 "The quick brown"。