Encontrar subcadena utilizando la función np.char.find()

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

En este tutorial, cubriremos la función char.find() de Numpy. Esta función se utiliza para encontrar subcadenas dentro de una matriz de cadenas. Devuelve el índice de la primera aparición de la subcadena. La función char.find() es similar a la función str.find() en Python.

Consejos sobre la VM

Una vez que se haya iniciado la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca Numpy

En este paso, importaremos la biblioteca Numpy utilizando la declaración import numpy.

import numpy as np

Crear una matriz de cadenas

En este paso, crearemos una matriz de cadenas utilizando la función np.array().

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttdsxxxxcccc', 'AAaaxxxxcccutt', 'AAaaxxccxcxXDSDdscz'])

Encontrar una subcadena en la matriz

En este paso, encontraremos una subcadena dentro de la matriz utilizando la función np.char.find(). El primer parámetro es la matriz, el segundo parámetro es la subcadena que queremos encontrar. También podemos proporcionar el rango en el que queremos buscar la subcadena utilizando los parámetros opcionales start y end.

print(np.char.find(arr, 'xc'))

Encontrar una subcadena dentro de un rango

En este paso, encontraremos una subcadena dentro de un rango específico utilizando de nuevo la función np.char.find(). Esta vez usaremos el parámetro start para especificar el rango.

print(np.char.find(arr, 'xc', start=3))

Encontrar una subcadena después de un índice específico

En este paso, encontraremos una subcadena después de un índice específico utilizando la función np.char.find(). Volveremos a utilizar el parámetro start para especificar el índice.

print(np.char.find(arr, 'xc', start=8))

Manejar subcadenas no existentes

En este paso, manejaremos subcadenas no existentes utilizando la función np.char.find(). Utilizaremos una matriz que no contiene la subcadena y proporcionaremos un rango que no contiene la subcadena.

arr = np.array(['AAAabbbbbxcccccyyysss', 'AAAAAAAaattttds', 'AAaaxcutt', 'AAaaxXDSDdscz'])
print(np.char.find(arr, 'xc'))
print(np.char.find(arr, 'xc', start=8))

Resumen

En este tutorial, aprendimos sobre la función np.char.find() de la biblioteca Numpy. Aprendimos cómo encontrar subcadenas en una matriz de cadenas utilizando la función y cómo proporcionar rangos para buscar las subcadenas. También aprendimos cómo manejar subcadenas no existentes.