Функция replace в NumPy

NumPyNumPyBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

Numpy (Нампи) – одна из самых мощных библиотек для научных вычислений в Python. Она предоставляет высокопроизводительный многомерный массив и инструменты для работы с этими массивами.

Функция numpy.char.replace() библиотеки Numpy используется для замены вхождения подстроки в массиве строк или строке на новую подстроку. В этом практическом занятии мы научимся использовать функцию replace() для замены содержимого массива строк.

Советы по виртуальной машине

После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и приступить к практике в Jupyter Notebook.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.

Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. После занятия оставьте отзыв, и мы оперативно решим проблему для вас.

Импорт библиотеки Numpy

Для использования библиотеки Numpy (Нампи) необходимо сначала импортировать ее. Это можно сделать с помощью оператора импорта следующим образом:

import numpy as np

Определение строки

В рамках данного практического занятия мы определим строку с именем string1 и инициализируем ее некоторым значением.

string1 = "The quick brown fox jumps over the lazy dog"
print("The original string is:\n", string1)

Замена подстроки

Для замены подстроки в строке можно использовать функцию numpy.char.replace(). Эта функция принимает четыре параметра:

numpy.char.replace(a, old, new, count=None)

где:

  • a: массив строк или строка.
  • old: старая подстрока, которую нужно заменить.
  • new: новая подстрока, которая заменит старую.
  • count: необязательный параметр, который указывает количество вхождений старой подстроки, которые нужно заменить.

Давайте заменим подстроку 'brown' в строке string1 на новую подстроку 'red':

string2 = np.char.replace(string1, 'brown', 'red')
print("The string with replaced substring is:\n", string2)

Замена нескольких вхождений подстроки

Для замены нескольких вхождений подстроки можно передать необязательный параметр count в функцию. Например, давайте заменим оба вхождения подстроки 'the' на 'an':

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("The string with replaced substrings is:\n", string3)

Замена элементов в массиве

Мы также можем применить функцию replace() к массиву строк. Начнем с создания массива строк:

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

Теперь заменим подстроку 'world' во всех элементах массива на 'universe':

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

Замена повторяющихся подстрок

Мы также можем использовать параметр count для замены повторяющихся подстрок. Давайте заменим первое вхождение подстроки 'universe' во всех элементах массива на 'space':

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

Резюме

В этом практическом занятии (лабораторной работе) мы научились использовать функцию numpy.char.replace() для замены подстрок в строке или массиве строк. Мы узнали, как заменить одно вхождение подстроки или несколько вхождений подстроки с использованием параметра count. Наконец, мы научились применять функцию replace() к массиву строк. Эти навыки могут быть использованы в приложениях обработки естественного языка (NLP) и обработки текста, а также в задачах предварительной обработки данных.