NumPy-Ersetzungsfunktion

NumPyNumPyBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

Numpy ist eine der leistungsstärksten wissenschaftlichen Computings-Bibliotheken in Python. Sie bietet ein Hochleistungs-Objekt für mehrdimensionale Arrays sowie Werkzeuge zur Arbeit mit diesen Arrays.

Die Funktion numpy.char.replace() der Numpy-Bibliothek wird verwendet, um Vorkommen einer Teilzeichenfolge in einem Array von Zeichenketten oder in einer Zeichenkette durch eine neue Teilzeichenfolge zu ersetzen. In diesem Lab werden wir lernen, wie man die replace()-Funktion verwendet, um den Inhalt eines Arrays von Zeichenketten zu ersetzen.

Tipps zur virtuellen Maschine (VM)

Nachdem die VM gestartet wurde, klicken Sie in der oberen linken Ecke auf die Registerkarte Notebook, um auf Jupyter Notebook für die Übung zuzugreifen.

Manchmal müssen Sie möglicherweise einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Aufgrund von Einschränkungen in Jupyter Notebook kann die Validierung von Operationen nicht automatisiert werden.

Wenn Sie während des Lernens Probleme haben, können Sie sich gerne an Labby wenden. Geben Sie nach der Sitzung Feedback ab, und wir werden das Problem umgehend für Sie lösen.

Importieren von Numpy

Um die Numpy-Bibliothek zu verwenden, müssen wir sie zuerst importieren. Dies können wir mit der import-Anweisung wie folgt tun:

import numpy as np

Definieren einer Zeichenkette

Für das Ziel dieses Labs werden wir eine Zeichenkette namens string1 definieren und sie mit einem bestimmten Wert initialisieren.

string1 = "The quick brown fox jumps over the lazy dog"
print("The original string is:\n", string1)

Ersetzen einer Teilzeichenkette

Um eine Teilzeichenkette innerhalb einer Zeichenkette zu ersetzen, können wir die Funktion numpy.char.replace() verwenden. Die Funktion nimmt vier Parameter entgegen:

numpy.char.replace(a, old, new, count=None)

Dabei bedeuten:

  • a: Ein Array von Zeichenketten oder eine einzelne Zeichenkette.
  • old: Die alte Teilzeichenkette, die ersetzt werden soll.
  • new: Die neue Teilzeichenkette, die die alte Teilzeichenkette ersetzen wird.
  • count: Ein optionaler Parameter, der die Anzahl der Vorkommen der alten Teilzeichenkette angibt, die ersetzt werden sollen.

Lassen Sie uns die Teilzeichenkette 'brown' in string1 durch die neue Teilzeichenkette 'red' ersetzen:

string2 = np.char.replace(string1, 'brown', 'red')
print("The string with replaced substring is:\n", string2)

Mehrfaches Ersetzen einer Teilzeichenkette

Um mehrere Vorkommen einer Teilzeichenkette zu ersetzen, können wir den optionalen Parameter count an die Funktion übergeben. Beispielsweise ersetzen wir beide Vorkommen der Teilzeichenkette 'the' durch 'an':

string3 = np.char.replace(string1, 'the', 'an', count=2)
print("The string with replaced substrings is:\n", string3)

Ersetzen von Elementen in einem Array

Wir können die Funktion replace() auch auf ein Array von Zeichenketten anwenden. Beginnen wir damit, ein Array von Zeichenketten zu erstellen:

string_array = np.array(['hello world', 'goodbye world', 'world peace', 'world health'])
print("The original string array is:\n", string_array)

Nun ersetzen wir die Teilzeichenkette 'world' in allen Elementen des Arrays durch 'universe':

new_string_array = np.char.replace(string_array, 'world', 'universe')
print("The new string array is:\n", new_string_array)

Ersetzen wiederholter Teilzeichenketten

Wir können auch den Parameter count verwenden, um wiederholte Teilzeichenketten zu ersetzen. Lassen Sie uns das erste Vorkommen der Teilzeichenkette 'universe' in allen Elementen des Arrays durch 'space' ersetzen:

new_string_array2 = np.char.replace(string_array, 'universe', 'space', count=1)
print("The new string array is:\n", new_string_array2)

Zusammenfassung

In diesem Lab haben wir gelernt, wie man die Funktion numpy.char.replace() verwendet, um Teilzeichenketten innerhalb einer Zeichenkette oder eines Arrays von Zeichenketten zu ersetzen. Wir haben gelernt, wie man ein einzelnes Vorkommen einer Teilzeichenkette oder mehrere Vorkommen einer Teilzeichenkette mithilfe des Parameters count ersetzt. Schließlich haben wir gelernt, wie man die Funktion replace() auf ein Array von Zeichenketten anwendet. Diese Fähigkeiten können in Anwendungen der natürlichen Sprachverarbeitung (NLP) und des Textverarbeitungs sowie bei Datenvorverarbeitungstasks eingesetzt werden.