Função Replace do NumPy

Beginner

Introdução

Numpy é uma das bibliotecas de computação científica mais poderosas em Python. Ela fornece um objeto array multidimensional de alto desempenho e ferramentas para trabalhar com esses arrays.

A função numpy.char.replace() da biblioteca Numpy é usada para substituir as ocorrências de uma substring em um array de strings ou em uma string por uma nova substring. Neste laboratório, aprenderemos como usar a função replace() para substituir o conteúdo de um array de strings.

Dicas da VM

Após a inicialização da VM, clique no canto superior esquerdo para mudar para a aba Notebook e acessar o Jupyter Notebook para praticar.

Às vezes, pode ser necessário aguardar alguns segundos para que o Jupyter Notebook termine de carregar. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.

Se você enfrentar problemas durante o aprendizado, sinta-se à vontade para perguntar ao Labby. Forneça feedback após a sessão, e resolveremos o problema prontamente para você.

Importar NumPy

Para usar a biblioteca numpy, precisamos primeiro importá-la. Podemos fazer isso usando a instrução import da seguinte forma:

import numpy as np

Definir uma String

Para fins deste laboratório, definiremos uma string chamada string1 e a inicializaremos com algum valor.

string1 = "The quick brown fox jumps over the lazy dog"
print("A string original é:\n", string1)

Substituir Substring

Para substituir um substring dentro da string, podemos usar a função numpy.char.replace(). A função recebe quatro parâmetros:

numpy.char.replace(a, old, new, count=None)

onde:

  • a: é um array de strings ou uma string.
  • old: é o substring antigo que deve ser substituído.
  • new: é o novo substring que substituirá o substring antigo.
  • count: é um parâmetro opcional que especifica o número de ocorrências do substring antigo a ser convertido.

Vamos substituir o substring 'brown' em string1 pelo novo substring 'red':

string2 = np.char.replace(string1, 'brown', 'red')
print("A string com o substring substituído é:\n", string2)

Substituir Múltiplas Ocorrências

Para substituir múltiplas ocorrências de um substring, podemos passar o parâmetro opcional count para a função. Por exemplo, vamos substituir ambas as ocorrências do substring 'the' por 'an':

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("A string com os substrings substituídos é:\n", string3)

Substituindo Elementos em um Array

Podemos também aplicar a função replace() a um array de strings. Vamos começar criando um array de strings:

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

Agora vamos substituir o substring 'world' em todos os elementos do array por 'universe':

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

Substituição de Substrings Repetidas

Podemos também usar o parâmetro count para substituir substrings repetidos. Vamos substituir a primeira aparição do substring 'universe' em todos os elementos do array por 'space':

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

Resumo

Neste laboratório, aprendemos como usar a função numpy.char.replace() para substituir substrings dentro de uma string ou um array de strings. Aprendemos como substituir uma única ocorrência de uma substring ou múltiplas ocorrências de uma substring usando o parâmetro count. Finalmente, aprendemos como aplicar a função replace() a um array de strings. Essas habilidades podem ser usadas em aplicações de PNL (Processamento de Linguagem Natural) e processamento de texto, bem como em tarefas de pré-processamento de dados.