Введение
В этом уроке мы рассмотрим функцию char.find() из библиотеки Numpy. Эта функция используется для поиска подстрок внутри массива строк. Она возвращает индекс первого вхождения подстроки. Функция char.find() аналогична функции str.find() в Python.
Советы по использованию ВМ
После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений в Jupyter Notebook.
Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Импортировать библиотеку Numpy
В этом шаге мы импортируем библиотеку Numpy с помощью инструкции import numpy.
import numpy as np
Создать массив строк
В этом шаге мы создадим массив строк с использованием функции np.array().
arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])
Найти подстроку в массиве
В этом шаге мы будем искать подстроку внутри массива с использованием функции np.char.find(). Первым параметром является массив, вторым параметром - подстрока, которую мы хотим найти. Мы также можем указать диапазон, в котором мы хотим искать подстроку, используя необязательные параметры start и end.
print(np.char.find(arr, 'xc'))
Найти подстроку в заданном диапазоне
В этом шаге мы снова будем искать подстроку в определенном диапазоне с использованием функции np.char.find(). На этот раз мы будем использовать параметр start, чтобы указать диапазон.
print(np.char.find(arr, 'xc', start=3))
Найти подстроку после определенного индекса
В этом шаге мы будем искать подстроку после определенного индекса с использованием функции np.char.find(). Мы снова будем использовать параметр start, чтобы указать индекс.
print(np.char.find(arr, 'xc', start=8))
Обработка несуществующих подстрок
В этом шаге мы будем обрабатывать несуществующие подстроки с использованием функции np.char.find(). Мы будем использовать массив, который не содержит подстроку, и указывать диапазон, в котором подстрока отсутствует.
arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))
Резюме
В этом уроке мы узнали о функции np.char.find() из библиотеки Numpy. Мы узнали, как искать подстроки в массиве строк с использованием этой функции и как задавать диапазоны для поиска подстрок. Мы также узнали, как обрабатывать несуществующие подстроки.