Найти подстроку с использованием функции np.char.find()

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

В этом уроке мы рассмотрим функцию char.find() из библиотеки Numpy. Эта функция используется для поиска подстрок внутри массива строк. Она возвращает индекс первого вхождения подстроки. Функция char.find() аналогична функции str.find() в Python.

Советы по использованию ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений в Jupyter Notebook.

Если вы сталкиваетесь с проблемами во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку Numpy

В этом шаге мы импортируем библиотеку Numpy с помощью инструкции import numpy.

import numpy as np

Создаем массив строк

В этом шаге мы создадим массив строк с использованием функции np.array().

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])

Найти подстроку в массиве

В этом шаге мы будем искать подстроку внутри массива с использованием функции np.char.find(). Первым параметром является массив, вторым параметром - подстрока, которую мы хотим найти. Мы также можем указать диапазон, в котором мы хотим искать подстроку, используя необязательные параметры start и end.

print(np.char.find(arr, 'xc'))

Найти подстроку в заданном диапазоне

В этом шаге мы снова будем искать подстроку в определенном диапазоне с использованием функции np.char.find(). На этот раз мы будем использовать параметр start, чтобы указать диапазон.

print(np.char.find(arr, 'xc', start=3))

Найти подстроку после определенного индекса

В этом шаге мы будем искать подстроку после определенного индекса с использованием функции np.char.find(). Мы снова будем использовать параметр start, чтобы указать индекс.

print(np.char.find(arr, 'xc', start=8))

Обработка несуществующих подстрок

В этом шаге мы будем обрабатывать несуществующие подстроки с использованием функции np.char.find(). Мы будем использовать массив, который не содержит подстроку, и указывать диапазон, в котором подстрока отсутствует.

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))

Обзор

В этом уроке мы узнали о функции np.char.find() из библиотеки Numpy. Мы узнали, как искать подстроки в массиве строк с использованием этой функции и как задавать диапазоны для поиска подстрок. Мы также узнали, как обрабатывать несуществующие подстроки.