Función de reemplazo de NumPy

NumPyNumPyBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

Numpy es una de las bibliotecas de cómputo científico más poderosas en Python. Proporciona un objeto de matriz multidimensional de alto rendimiento y herramientas para trabajar con estas matrices.

La función numpy.char.replace() de la biblioteca Numpy se utiliza para reemplazar las ocurrencias de una subcadena en una matriz de cadenas o en una cadena con una nueva subcadena. En este laboratorio, aprenderemos cómo usar la función replace() para reemplazar el contenido de una matriz de cadenas.

Consejos para la MV

Después de que la máquina virtual (MV) haya terminado de iniciar, haz clic en la esquina superior izquierda para cambiar a la pestaña Notebook y acceder a Jupyter Notebook para practicar.

A veces, es posible que debas esperar unos segundos para que Jupyter Notebook termine de cargar. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si encuentras problemas durante el aprendizaje, no dudes en preguntarle a Labby. Proporciona comentarios después de la sesión y resolveremos el problema para ti de inmediato.

Importar Numpy

Para utilizar la biblioteca numpy, primero debemos importarla. Podemos hacerlo utilizando la declaración import de la siguiente manera:

import numpy as np

Definir una cadena

Con el propósito de este laboratorio, definiremos una cadena llamada string1 e inicializaremos con algún valor.

string1 = "The quick brown fox jumps over the lazy dog"
print("The original string is:\n", string1)

Reemplazar una subcadena

Para reemplazar una subcadena dentro de una cadena, podemos utilizar la función numpy.char.replace(). La función toma cuatro parámetros:

numpy.char.replace(a, old, new, count=None)

donde:

  • a: es una matriz de cadenas o una cadena.
  • old: es la subcadena antigua que se va a reemplazar.
  • new: es la nueva subcadena que reemplazará a la subcadena antigua.
  • count: es un parámetro opcional que especifica el número de ocurrencias de la subcadena antigua que se convertirán.

Reemplacemos la subcadena 'brown' en string1 con la nueva subcadena 'red':

string2 = np.char.replace(string1, 'brown', 'red')
print("The string with replaced substring is:\n", string2)

Reemplazar múltiples ocurrencias

Para reemplazar múltiples ocurrencias de una subcadena, podemos pasar el parámetro opcional count a la función. Por ejemplo, reemplacémos las dos ocurrencias de la subcadena 'the' con 'an':

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("The string with replaced substrings is:\n", string3)

Reemplazar elementos en una matriz

También podemos aplicar la función replace() a una matriz de cadenas. Comencemos creando una matriz de cadenas:

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

Ahora, reemplacémos la subcadena 'world' en todos los elementos de la matriz con 'universe':

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

Reemplazar subcadenas repetidas

También podemos utilizar el parámetro count para reemplazar subcadenas repetidas. Reemplacemos la primera aparición de la subcadena 'universe' en todos los elementos de la matriz con 'space':

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

Resumen

En este laboratorio, hemos aprendido cómo utilizar la función numpy.char.replace() para reemplazar subcadenas dentro de una cadena o una matriz de cadenas. Hemos aprendido cómo reemplazar una sola ocurrencia de una subcadena o múltiples ocurrencias de una subcadena utilizando el parámetro count. Finalmente, hemos aprendido cómo aplicar la función replace() a una matriz de cadenas. Estas habilidades se pueden utilizar en aplicaciones de PNL (Procesamiento del Lenguaje Natural) y procesamiento de texto, así como en tareas de preprocesamiento de datos.