基础字符串操作

ShellBeginner
立即练习

介绍

在本实验中,你将学习 Shell 脚本中基础的字符串操作。在各种脚本任务中,字符串操作对于处理和提取文本数据至关重要。你将探索诸如确定字符串长度、查找字符位置、提取子字符串以及替换字符串内容等概念。这些技能对于在 Shell 脚本中进行高效的文本处理非常关键。

快速参考指南

以下是本实验将涵盖的字符串操作概览:

操作 语法 描述 示例
字符串长度 ${#string} 计算字符串中的字符数量 ${#"hello"} 返回 5
查找字符位置 $(expr index "$string" "$char") 查找字符在字符串中的位置(从 1 开始计数) $(expr index "abcdef" "c") 返回 3
提取子字符串 ${string:start:length} 提取字符串的一部分(从 0 开始计数) ${"hello":1:3} 返回 ell
替换首次出现的内容 ${string/pattern/replacement} 替换模式(pattern)第一次出现的地方 ${"hello"/l/L} 返回 heLlo
替换所有出现的内容 ${string//pattern/replacement} 替换模式所有出现的地方 ${"hello"//l/L} 返回 heLLo
在开头替换 ${string/#pattern/replacement} 仅当模式位于字符串开头时才进行替换 ${"hello"/#he/HE} 返回 HEllo
在结尾替换 ${string/%pattern/replacement} 仅当模式位于字符串结尾时才进行替换 ${"hello"/%lo/LO} 返回 helLO
这是一个引导实验,提供分步指导以帮助你学习和练习。请仔细按照说明完成每个步骤并获得实践经验。历史数据表明,这是一个初学者级别的实验,完成率为 97%。它获得了学习者 100% 的好评率。

创建脚本文件

首先,我们创建一个脚本文件,用于编写字符串操作代码。

  1. 在 WebIDE 中打开终端。终端是你输入命令与 Linux 系统交互的地方。

  2. 进入项目目录:

    cd ~/project

    此命令将当前目录切换到 ~/project~ 符号代表你的家目录,因此 ~/project 是家目录下名为「project」的文件夹。

  3. 创建一个名为 string_operations.sh 的新文件:

    touch string_operations.sh

    touch 命令用于创建一个新的空文件。如果文件已存在,它会更新文件的时间戳。

  4. 在 WebIDE 编辑器中打开该文件。你可以通过点击 WebIDE 左侧文件资源管理器中的文件名来完成此操作。

  5. 在文件顶部添加以下 Shebang 行以指定解释器:

    #!/bin/bash

    这一行被称为「Shebang」,它告诉系统使用 Bash Shell 来解释执行此脚本。它始终是 Shell 脚本的第一行。

字符串长度

现在,让我们学习如何确定字符串的长度。

  1. 将以下代码添加到你的 string_operations.sh 文件中:

    echo "Step 2: String Length"
    
    STRING="Hello, World!"
    LENGTH=${#STRING}
    
    echo "The string is: $STRING"
    echo "Its length is: $LENGTH"

    让我们逐步分解这段代码:

    • 首先,我们添加一个 echo 命令来显示本节的标题。

      echo "Step 2: String Length"
    • 接下来,我们定义一个名为 STRING 的变量,并为其赋值「Hello, World!」。

      STRING="Hello, World!"

      在 Bash 中,定义变量不需要使用任何特殊的关键字。只需写出变量名,后跟等号,再跟上值即可。

    • 然后,我们使用 ${#variable} 语法计算字符串的长度,并将其存储在名为 LENGTH 的变量中。

      LENGTH=${#STRING}

      ${#variable} 是一种特殊的 Shell 参数扩展方式,它会返回存储在变量中的字符串字符数。

    • 最后,我们显示原始字符串及其长度。

      echo "The string is: $STRING"
      echo "Its length is: $LENGTH"

      变量名前的 $ 符号告诉 Bash 将其替换为该变量的值。

  2. 保存文件。在大多数编辑器中,你可以通过按 Ctrl+S(Mac 上为 Cmd+S)来保存。

  3. 为脚本添加执行权限:

    chmod +x string_operations.sh

    此命令更改文件的权限使其可执行:

    • chmod 代表「change mode」(更改模式)。
    • +x 意味着「添加执行权限」。
    • 如果没有这一步,系统将不知道该文件应该作为一个程序来运行。
  4. 运行脚本:

    ./string_operations.sh

    ./ 前缀告诉 Shell 在当前目录中查找脚本。如果没有它,Shell 只会在 PATH 环境变量中列出的目录里查找。

你应该会看到类似以下的输出:

Step 2: String Length
The string is: Hello, World!
Its length is: 13

如果你没有看到这些输出,请仔细检查是否已保存文件并赋予了执行权限。

查找字符位置

接下来,我们将学习如何查找字符在字符串中的位置。

  1. 将以下代码添加到你的 string_operations.sh 文件中:

    echo -e "\nStep 3: Finding Character Position"
    
    STRING="abcdefghijklmnopqrstuvwxyz"
    CHAR="j"
    
    POSITION=$(expr index "$STRING" "$CHAR")
    
    echo "The string is: $STRING"
    echo "We're looking for the character: $CHAR"
    echo "It is at position: $POSITION"

    让我们详细分析这段代码:

    • 我们以一个包含 -e 选项和 \n 转义序列的 echo 命令开始。

      echo -e "\nStep 3: Finding Character Position"
      • -e 选项允许解释转义序列。
      • \n 转义序列在文本前添加一个换行符,从而与上一节内容产生视觉间隔。
    • 接下来,我们定义两个变量:

      STRING="abcdefghijklmnopqrstuvwxyz"
      CHAR="j"
      • STRING 包含整个小写字母表。
      • CHAR 包含我们要查找的字符「j」。
    • 我们使用 expr index 命令来查找字符的位置:

      POSITION=$(expr index "$STRING" "$CHAR")
      • expr 是一个用于求值表达式的工具。
      • index 操作用于在字符串中搜索字符。
      • $() 语法用于捕获命令的输出并将其赋值给 POSITION 变量。
      • 我们将变量用双引号("$STRING")括起来,以防止特殊字符引起的问题。
      • 重要提示:此命令返回的位置是从 1 开始计数的(而不是 0)。
    • 最后,我们打印结果:

      echo "The string is: $STRING"
      echo "We're looking for the character: $CHAR"
      echo "It is at position: $POSITION"
  2. 保存文件并再次运行脚本:

    ./string_operations.sh

你应该会看到额外的输出,类似于:

Step 3: Finding Character Position
The string is: abcdefghijklmnopqrstuvwxyz
We're looking for the character: j
It is at position: 10

请注意,该位置是基于 1 的索引,这意味着第一个字符的位置是 1 而不是 0。这与许多编程语言不同,在那些语言中索引通常从 0 开始。

子字符串提取

现在,让我们学习如何提取字符串的一部分。

  1. 将以下代码添加到你的 string_operations.sh 文件中:

    echo -e "\nStep 4: Substring Extraction"
    
    STRING="The quick brown fox jumps over the lazy dog"
    START=10
    LENGTH=5
    
    SUBSTRING=${STRING:$START:$LENGTH}
    
    echo "The original string is: $STRING"
    echo "Extracting 5 characters starting from position 10:"
    echo "The substring is: $SUBSTRING"

    让我们逐段分析这段代码:

    • 首先,添加一个带有换行符的标题以进行视觉分隔:

      echo -e "\nStep 4: Substring Extraction"
    • 接下来,定义变量:

      STRING="The quick brown fox jumps over the lazy dog"
      START=10
      LENGTH=5
      • STRING 包含一个示例句子。
      • START 是我们想要开始提取的位置(位置 10)。
      • LENGTH 是我们想要提取的字符数(5 个字符)。
    • 我们使用 Bash 的子字符串提取语法来获取字符串的一部分:

      SUBSTRING=${STRING:$START:$LENGTH}
      • 语法格式为 ${variable:start_position:length}
      • $START$LENGTH 是包含值 10 和 5 的变量。
      • 重要提示:与 expr index 命令不同,这里的索引是从 0 开始的,这意味着第一个字符的位置是 0。
    • 最后,显示结果:

      echo "The original string is: $STRING"
      echo "Extracting 5 characters starting from position 10:"
      echo "The substring is: $SUBSTRING"
  2. 保存文件并再次运行脚本:

    ./string_operations.sh

你应该会看到额外的输出,类似于:

Step 4: Substring Extraction
The original string is: The quick brown fox jumps over the lazy dog
Extracting 5 characters starting from position 10:
The substring is: brown

在字符串「The quick brown fox...」中,位置 10(从 0 开始计数)是「brown」中的「b」,接下来的 5 个字符正是「brown」。这就是为什么我们提取的子字符串是「brown」。

请记住,这里的索引方式与我们在上一步中看到的有所不同:

  • expr index(步骤 3)中,位置从 1 开始(第一个字符在位置 1)。
  • 在子字符串提取 ${STRING:position:length}(步骤 4)中,位置从 0 开始(第一个字符在位置 0)。

这是 Shell 脚本中常见的混淆点,因此记住哪些操作使用哪种索引系统非常重要。

字符串替换

最后,让我们学习如何替换字符串的部分内容。

  1. 将以下代码添加到你的 string_operations.sh 文件中:

    echo -e "\nStep 5: String Replacement"
    
    STRING="The quick brown fox jumps over the lazy dog"
    echo "Original string: $STRING"
    
    ## Replace the first occurrence of 'o' with 'O'
    NEW_STRING=${STRING/o/O}
    echo "Replacing first 'o' with 'O': $NEW_STRING"
    
    ## Replace all occurrences of 'o' with 'O'
    NEW_STRING=${STRING//o/O}
    echo "Replacing all 'o' with 'O': $NEW_STRING"
    
    ## Replace 'The quick' with 'The slow' if it's at the beginning of the string
    NEW_STRING=${STRING/#The quick/The slow}
    echo "Replacing 'The quick' with 'The slow' at the beginning: $NEW_STRING"
    
    ## Replace 'dog' with 'cat' if it's at the end of the string
    NEW_STRING=${STRING/%dog/cat}
    echo "Replacing 'dog' with 'cat' at the end: $NEW_STRING"

    让我们逐一查看每个字符串替换操作:

    • 首先,打印标题并显示原始字符串:

      echo -e "\nStep 5: String Replacement"
      STRING="The quick brown fox jumps over the lazy dog"
      echo "Original string: $STRING"
    • 替换字符的第一次出现:

      ## Replace the first occurrence of 'o' with 'O'
      NEW_STRING=${STRING/o/O}
      echo "Replacing first 'o' with 'O': $NEW_STRING"
      • 语法为 ${variable/pattern/replacement}
      • 这将找到第一个出现的「o」并将其替换为「O」。
      • 只有「brown」中的第一个「o」会被替换,其他保持不变。
    • 替换字符的所有出现:

      ## Replace all occurrences of 'o' with 'O'
      NEW_STRING=${STRING//o/O}
      echo "Replacing all 'o' with 'O': $NEW_STRING"
      • 语法为 ${variable//pattern/replacement}(注意是双斜杠)。
      • 双斜杠告诉 Bash 替换模式出现的所有地方。
      • 整个字符串中所有的「o」都将被替换为「O」。
    • 替换字符串开头的模式:

      ## Replace 'The quick' with 'The slow' if it's at the beginning of the string
      NEW_STRING=${STRING/#The quick/The slow}
      echo "Replacing 'The quick' with 'The slow' at the beginning: $NEW_STRING"
      • 语法为 ${variable/#pattern/replacement}
      • # 符号指定模式必须位于字符串的开头。
      • 只有当「The quick」出现在字符串开头时,才会进行替换。
    • 替换字符串结尾的模式:

      ## Replace 'dog' with 'cat' if it's at the end of the string
      NEW_STRING=${STRING/%dog/cat}
      echo "Replacing 'dog' with 'cat' at the end: $NEW_STRING"
      • 语法为 ${variable/%pattern/replacement}
      • % 符号指定模式必须位于字符串的结尾。
      • 只有当「dog」出现在字符串结尾时,才会进行替换。
  2. 保存文件并再次运行脚本:

    ./string_operations.sh

你应该会看到额外的输出,类似于:

Step 5: String Replacement
Original string: The quick brown fox jumps over the lazy dog
Replacing first 'o' with 'O': The quick brOwn fox jumps over the lazy dog
Replacing all 'o' with 'O': The quick brOwn fOx jumps Over the lazy dOg
Replacing 'The quick' with 'The slow' at the beginning: The slow brown fox jumps over the lazy dog
Replacing 'dog' with 'cat' at the end: The quick brown fox jumps over the lazy cat

这些字符串替换操作是 Shell 脚本中处理文本的强大工具。它们允许你根据模式和位置进行有针对性的替换,这在数据处理、文本格式化或文件内容修改等任务中特别有用。

总结

在本实验中,你学习并练习了 Shell 脚本中几种基础的字符串操作:

  1. 创建并执行 Shell 脚本。
  2. 使用 ${#string} 计算字符串的长度。
  3. 使用 $(expr index "$string" "$char") 查找字符在字符串中的位置。
  4. 使用 ${string:start:length} 从较长的字符串中提取子字符串。
  5. 执行各种字符串替换操作,包括:
    • ${string/pattern/replacement} - 替换首次出现的内容
    • ${string//pattern/replacement} - 替换所有出现的内容
    • ${string/#pattern/replacement} - 在字符串开头进行替换
    • ${string/%pattern/replacement} - 在字符串结尾进行替换

这些技能构成了 Shell 脚本中更复杂的文本处理任务的基础。随着你继续编写 Shell 脚本,你会发现这些字符串操作在处理和分析项目中的文本数据时非常宝贵。请记住,练习是掌握这些概念的关键,所以请大胆尝试不同的字符串和操作!