Función de codificación de NumPy

PythonPythonBeginner
Practicar Ahora

💡 Este tutorial está traducido por IA desde la versión en inglés. Para ver la versión original, puedes hacer clic aquí

Introducción

NumPy es una popular biblioteca de Python utilizada para trabajar con matrices. Uno de los submódulos de NumPy es el módulo char que proporciona varias operaciones de cadenas que se pueden aplicar en matrices de NumPy. En este tutorial de laboratorio, discutiremos la función encode() del módulo char de NumPy. Aprenderemos cómo usar esta función para codificar una cadena de entrada dada. Cubriremos la sintaxis, los parámetros y los valores devueltos de la función encode() utilizando ejemplos.

Consejos sobre la VM

Una vez finalizada la inicialización de la VM, haga clic en la esquina superior izquierda para cambiar a la pestaña Cuaderno y acceder a Jupyter Notebook para practicar.

A veces, es posible que tenga que esperar unos segundos a que Jupyter Notebook termine de cargarse. La validación de las operaciones no se puede automatizar debido a las limitaciones de Jupyter Notebook.

Si tiene problemas durante el aprendizaje, no dude en preguntar a Labby. Deje sus comentarios después de la sesión y lo resolveremos rápidamente para usted.

Importar la biblioteca NumPy

Comenzamos importando la biblioteca NumPy, que es necesaria para utilizar la función encode(). A continuación, se muestra el bloque de código para importar NumPy:

import numpy as np

Usar la función encode() con diferentes esquemas de codificación

Ahora usaremos la función encode() con dos diferentes esquemas de codificación: 'cp037' y 'utf-8'. Para ello, primero definimos una matriz de cadenas.

a = ['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']

Usando el esquema de codificación 'cp037':

Usamos la función encode() con el esquema de codificación 'cp037' pasando la matriz de entrada y el tipo de codificación como parámetros. A continuación, se muestra el bloque de código:

x = np.char.encode(a, encoding='cp037', errors=None)

El bloque de código anterior lee la matriz de entrada a y la codifica utilizando el esquema de codificación 'cp037'. La cadena codificada se almacena en la variable x. Dado que no se especifica ningún mecanismo de manejo de errores, el parámetro errors se establece en None. Ahora imprimimos la matriz de entrada y la cadena codificada de la siguiente manera:

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Salida:

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
 b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
 b'\xa3\xa3\xa2\x99\x85\x84']

Usando el esquema de codificación 'utf-8':

Usamos la función encode() con el esquema de codificación 'utf-8' pasando la matriz de entrada y el tipo de codificación como parámetros. A continuación, se muestra el bloque de código:

x = np.char.encode(a, encoding='utf-8', errors=None)

El bloque de código anterior lee la matriz de entrada a y la codifica utilizando el esquema de codificación 'utf-8'. La cadena codificada se almacena en la variable x. Dado que no se especifica ningún mecanismo de manejo de errores, el parámetro errors se establece en None. Ahora imprimimos la matriz de entrada y la cadena codificada de la siguiente manera:

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Salida:

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']

Resumen

En este laboratorio, aprendimos sobre la función encode() del módulo char de la biblioteca NumPy. Cubrimos cómo se utiliza, su sintaxis y los valores devueltos por esta función. También discutimos diferentes esquemas de codificación, como 'cp037' y 'utf-8', y demostramos su uso con ejemplos. La función encode() permite codificar una cadena de entrada de manera elemento a elemento y devuelve la cadena codificada.