Fonction de remplacement de NumPy

NumPyNumPyBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

Numpy est l'une des bibliothèques de calcul scientifique les plus puissantes en Python. Elle fournit un objet tableau multidimensionnel haute performance et des outils pour travailler avec ces tableaux.

La fonction numpy.char.replace() de la bibliothèque Numpy est utilisée pour remplacer les occurrences d'une sous-chaîne dans un tableau de chaînes de caractères ou une chaîne de caractères par une nouvelle sous-chaîne. Dans ce laboratoire (lab), nous apprendrons à utiliser la fonction replace() pour remplacer le contenu d'un tableau de chaînes de caractères.

Conseils pour la machine virtuelle (VM)

Une fois le démarrage de la machine virtuelle terminé, cliquez dans le coin supérieur gauche pour basculer sur l'onglet Notebook afin d'accéder à Jupyter Notebook pour pratiquer.

Parfois, vous devrez peut-être attendre quelques secondes que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes lors de votre apprentissage, n'hésitez pas à demander de l'aide à Labby. Fournissez vos commentaires après la session, et nous résoudrons rapidement le problème pour vous.

Importation de Numpy

Pour utiliser la bibliothèque numpy, nous devons d'abord l'importer. Nous pouvons le faire en utilisant l'instruction import comme suit :

import numpy as np

Définir une chaîne de caractères

Dans le cadre de ce laboratoire (lab), nous allons définir une chaîne de caractères appelée string1 et l'initialiser avec une certaine valeur.

string1 = "The quick brown fox jumps over the lazy dog"
print("The original string is:\n", string1)

Remplacer une sous-chaîne

Pour remplacer une sous-chaîne dans une chaîne de caractères, nous pouvons utiliser la fonction numpy.char.replace(). Cette fonction prend quatre paramètres :

numpy.char.replace(a, old, new, count=None)

où :

  • a : est un tableau de chaînes de caractères ou une chaîne de caractères.
  • old : est la sous-chaîne à remplacer.
  • new : est la nouvelle sous-chaîne qui remplacera l'ancienne sous-chaîne.
  • count : est un paramètre facultatif qui spécifie le nombre d'occurrences de l'ancienne sous-chaîne à convertir.

Remplaçons la sous-chaîne 'brown' dans string1 par la nouvelle sous-chaîne 'red' :

string2 = np.char.replace(string1, 'brown', 'red')
print("The string with replaced substring is:\n", string2)

Remplacer plusieurs occurrences

Pour remplacer plusieurs occurrences d'une sous-chaîne, nous pouvons passer le paramètre facultatif count à la fonction. Par exemple, remplaçons les deux occurrences de la sous-chaîne 'the' par 'an' :

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("The string with replaced substrings is:\n", string3)

Remplacer des éléments dans un tableau

Nous pouvons également appliquer la fonction replace() à un tableau de chaînes de caractères. Commençons par créer un tableau de chaînes de caractères :

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

Maintenant, remplaçons la sous-chaîne 'world' dans tous les éléments du tableau par 'universe' :

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

Remplacer des sous-chaînes répétées

Nous pouvons également utiliser le paramètre count pour remplacer des sous-chaînes répétées. Remplaçons la première occurrence de la sous-chaîne 'universe' dans tous les éléments du tableau par 'space' :

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

Résumé

Dans ce laboratoire, nous avons appris à utiliser la fonction numpy.char.replace() pour remplacer des sous-chaînes dans une chaîne de caractères ou dans un tableau de chaînes de caractères. Nous avons appris à remplacer une seule occurrence d'une sous-chaîne ou plusieurs occurrences d'une sous-chaîne en utilisant le paramètre count. Enfin, nous avons appris à appliquer la fonction replace() à un tableau de chaînes de caractères. Ces compétences peuvent être utilisées dans les applications de traitement du langage naturel (NLP) et de traitement de texte, ainsi que dans les tâches de prétraitement des données.