Encontrar Substring Usando a Função char.find() do Numpy

Beginner

Introdução

Neste tutorial, abordaremos a função char.find() do Numpy. Esta função é usada para encontrar substrings dentro de um array de strings. Ela retorna o índice da primeira ocorrência da substring. A função char.find() é semelhante à função str.find() em Python.

Dicas para a VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar a Biblioteca Numpy

Nesta etapa, importaremos a biblioteca Numpy usando a instrução import numpy.

import numpy as np

Criar um Array de Strings

Nesta etapa, criaremos um array de strings usando a função np.array().

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])

Encontrar Substring no Array

Nesta etapa, encontraremos uma substring dentro do array usando a função np.char.find(). O primeiro parâmetro é o array, o segundo parâmetro é a substring que queremos encontrar. Também podemos fornecer o intervalo no qual queremos pesquisar a substring usando os parâmetros opcionais start e end.

print(np.char.find(arr, 'xc'))

Encontrar Substring dentro de um Intervalo

Nesta etapa, encontraremos uma substring dentro de um intervalo específico usando a função np.char.find() novamente. Desta vez, usaremos o parâmetro start para especificar o intervalo.

print(np.char.find(arr, 'xc', start=3))

Encontrar Substring após um Índice Específico

Nesta etapa, encontraremos uma substring após um índice específico usando a função np.char.find(). Usaremos o parâmetro start novamente para especificar o índice.

print(np.char.find(arr, 'xc', start=8))

Lidar com Substrings Inexistentes

Nesta etapa, lidaremos com substrings não existentes usando a função np.char.find(). Usaremos um array que não contém a substring e forneceremos um intervalo que também não contém a substring.

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))

Resumo

Neste tutorial, aprendemos sobre a função np.char.find() na biblioteca Numpy. Aprendemos como encontrar substrings em um array de strings usando a função e como fornecer intervalos para pesquisar as substrings. Também aprendemos como lidar com substrings não existentes.