Introdução
Neste tutorial, abordaremos a função char.find() do Numpy. Esta função é usada para encontrar substrings dentro de um array de strings. Ela retorna o índice da primeira ocorrência da substring. A função char.find() é semelhante à função str.find() em Python.
Dicas para a VM
Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.
Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido às limitações do Jupyter Notebook.
Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.
Importar a Biblioteca Numpy
Nesta etapa, importaremos a biblioteca Numpy usando a instrução import numpy.
import numpy as np
Criar um Array de Strings
Nesta etapa, criaremos um array de strings usando a função np.array().
arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])
Encontrar Substring no Array
Nesta etapa, encontraremos uma substring dentro do array usando a função np.char.find(). O primeiro parâmetro é o array, o segundo parâmetro é a substring que queremos encontrar. Também podemos fornecer o intervalo no qual queremos pesquisar a substring usando os parâmetros opcionais start e end.
print(np.char.find(arr, 'xc'))
Encontrar Substring dentro de um Intervalo
Nesta etapa, encontraremos uma substring dentro de um intervalo específico usando a função np.char.find() novamente. Desta vez, usaremos o parâmetro start para especificar o intervalo.
print(np.char.find(arr, 'xc', start=3))
Encontrar Substring após um Índice Específico
Nesta etapa, encontraremos uma substring após um índice específico usando a função np.char.find(). Usaremos o parâmetro start novamente para especificar o índice.
print(np.char.find(arr, 'xc', start=8))
Lidar com Substrings Inexistentes
Nesta etapa, lidaremos com substrings não existentes usando a função np.char.find(). Usaremos um array que não contém a substring e forneceremos um intervalo que também não contém a substring.
arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))
Resumo
Neste tutorial, aprendemos sobre a função np.char.find() na biblioteca Numpy. Aprendemos como encontrar substrings em um array de strings usando a função e como fornecer intervalos para pesquisar as substrings. Também aprendemos como lidar com substrings não existentes.