NumPy Encode-Funktion

PythonPythonBeginner
Jetzt üben

💡 Dieser Artikel wurde von AI-Assistenten übersetzt. Um die englische Version anzuzeigen, können Sie hier klicken

Einführung

NumPy ist eine beliebte Python-Bibliothek, die zur Arbeit mit Arrays verwendet wird. Eines der Submodule von NumPy ist das char-Modul, das mehrere Zeichenfolgenoperationen bereitstellt, die auf NumPy-Arrays angewendet werden können. In diesem Lab-Tutorial werden wir die encode()-Funktion des char-Moduls von NumPy diskutieren. Wir werden lernen, wie diese Funktion verwendet wird, um einen gegebenen Eingabestring zu kodieren. Wir werden die Syntax, die Parameter und die zurückgegebenen Werte der encode()-Funktion anhand von Beispielen behandeln.

VM-Tipps

Nachdem der VM-Start abgeschlossen ist, klicken Sie in der oberen linken Ecke, um zur Registerkarte Notebook zu wechseln und Jupyter Notebook für die Übung zu nutzen.

Manchmal müssen Sie einige Sekunden warten, bis Jupyter Notebook vollständig geladen ist. Die Validierung von Vorgängen kann aufgrund von Einschränkungen in Jupyter Notebook nicht automatisiert werden.

Wenn Sie bei der Lernphase Probleme haben, können Sie Labby gerne fragen. Geben Sie nach der Sitzung Feedback, und wir werden das Problem für Sie prompt beheben.

Importieren der NumPy-Bibliothek

Wir beginnen mit dem Importieren der NumPy-Bibliothek, die für die Verwendung der encode()-Funktion erforderlich ist. Folgender Codeblock dient zum Importieren von NumPy:

import numpy as np

Verwenden der encode()-Funktion mit verschiedenen Codierungsverfahren

Wir werden nun die encode()-Funktion mit zwei verschiedenen Codierungsverfahren, 'cp037' und 'utf-8', verwenden. Dazu definieren wir zunächst ein Array von Zeichenfolgen.

a = ['aAaAaA',' aA  ', 'abBABba', 'dffgs', 'ttsred']

Verwenden des Codierungsverfahrens 'cp037':

Wir verwenden die encode()-Funktion mit dem Codierungsverfahren 'cp037', indem wir das Eingangsarray und den Codierungstyp als Parameter übergeben. Folgender Codeblock zeigt dies:

x = np.char.encode(a, encoding='cp037', errors=None)

Der obige Codeblock liest das Eingangsarray a und codiert es mit dem 'cp037'-Codierungsverfahren. Die codierte Zeichenfolge wird in der Variable x gespeichert. Da kein Fehlerbehandlungsmechanismus angegeben ist, wird der errors-Parameter auf None gesetzt. Wir drucken nun das Eingangsarray und die codierte Zeichenfolge wie folgt aus:

print("Eingabe ist:")
print(a)

print("Codierte Zeichenfolge ist:")
print(x)

Ausgabe:

Eingabe ist:
['aAaAaA',' aA  ', 'abBABba', 'dffgs', 'ttsred']
Codierte Zeichenfolge ist:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
 b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
 b'\xa3\xa3\xa2\x99\x85\x84']

Verwenden des Codierungsverfahrens 'utf-8':

Wir verwenden die encode()-Funktion mit dem Codierungsverfahren 'utf-8', indem wir das Eingangsarray und den Codierungstyp als Parameter übergeben. Folgender Codeblock zeigt dies:

x = np.char.encode(a, encoding='utf-8', errors=None)

Der obige Codeblock liest das Eingangsarray a und codiert es mit dem 'utf-8'-Codierungsverfahren. Die codierte Zeichenfolge wird in der Variable x gespeichert. Da kein Fehlerbehandlungsmechanismus angegeben ist, wird der errors-Parameter auf None gesetzt. Wir drucken nun das Eingangsarray und die codierte Zeichenfolge wie folgt aus:

print("Eingabe ist:")
print(a)

print("Codierte Zeichenfolge ist:")
print(x)

Ausgabe:

Eingabe ist:
['aAaAaA',' aA  ', 'abBABba', 'dffgs', 'ttsred']
Codierte Zeichenfolge ist:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']

Zusammenfassung

In diesem Lab haben wir uns mit der encode()-Funktion des char-Moduls der NumPy-Bibliothek beschäftigt. Wir haben gelernt, wie diese Funktion mit ihrer Syntax und den von ihr zurückgegebenen Werten verwendet wird. Wir haben auch verschiedene Codierungsverfahren wie 'cp037' und 'utf-8' diskutiert und ihre Verwendung anhand von Beispielen demonstriert. Die encode()-Funktion ermöglicht die elementweise Codierung eines Eingabestrings und gibt die codierte Zeichenfolge zurück.