Fonction d'encodage de NumPy

PythonPythonBeginner
Pratiquer maintenant

💡 Ce tutoriel est traduit par l'IA à partir de la version anglaise. Pour voir la version originale, vous pouvez cliquer ici

Introduction

NumPy est une bibliothèque Python populaire utilisée pour travailler avec des tableaux. L'un des sous-modules de NumPy est le module char qui fournit plusieurs opérations sur les chaînes de caractères qui peuvent être appliquées sur des tableaux NumPy. Dans ce tutoriel de laboratoire, nous allons discuter de la fonction encode() du module char de NumPy. Nous allons apprendre à utiliser cette fonction pour encoder une chaîne de caractères d'entrée donnée. Nous allons couvrir la syntaxe, les paramètres et les valeurs renvoyées de la fonction encode() à l'aide d'exemples.

Conseils sur la VM

Une fois le démarrage de la VM terminé, cliquez dans le coin supérieur gauche pour basculer vers l'onglet Notebook pour accéder à Jupyter Notebook pour la pratique.

Parfois, vous devrez peut-être attendre quelques secondes pour que Jupyter Notebook ait fini de charger. La validation des opérations ne peut pas être automatisée en raison des limitations de Jupyter Notebook.

Si vous rencontrez des problèmes pendant l'apprentissage, n'hésitez pas à demander à Labby. Donnez des commentaires après la session, et nous résoudrons rapidement le problème pour vous.

Import NumPy library

Nous commençons par importer la bibliothèque NumPy qui est nécessaire pour utiliser la fonction encode(). Voici le bloc de code pour importer NumPy :

import numpy as np

Utiliser la fonction encode() avec différents schémas d'encodage

Nous allons maintenant utiliser la fonction encode() avec deux schémas d'encodage différents : 'cp037' et 'utf-8'. Pour ce faire, nous définissons d'abord un tableau de chaînes de caractères.

a = ['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']

Utilisation du schéma d'encodage 'cp037' :

Nous utilisons la fonction encode() avec le schéma d'encodage 'cp037' en passant le tableau d'entrée et le type d'encodage en tant que paramètres. Voici le bloc de code :

x = np.char.encode(a, encoding='cp037', errors=None)

Le bloc de code ci-dessus lit le tableau d'entrée a et l'encode en utilisant le schéma d'encodage 'cp037'. La chaîne encodée est stockée dans la variable x. Étant donné qu'aucun mécanisme de gestion d'erreurs n'est spécifié, le paramètre errors est défini sur None. Nous affichons maintenant le tableau d'entrée et la chaîne encodée comme suit :

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Sortie :

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
 b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
 b'\xa3\xa3\xa2\x99\x85\x84']

Utilisation du schéma d'encodage 'utf-8' :

Nous utilisons la fonction encode() avec le schéma d'encodage 'utf-8' en passant le tableau d'entrée et le type d'encodage en tant que paramètres. Voici le bloc de code :

x = np.char.encode(a, encoding='utf-8', errors=None)

Le bloc de code ci-dessus lit le tableau d'entrée a et l'encode en utilisant le schéma d'encodage 'utf-8'. La chaîne encodée est stockée dans la variable x. Étant donné qu'aucun mécanisme de gestion d'erreurs n'est spécifié, le paramètre errors est défini sur None. Nous affichons maintenant le tableau d'entrée et la chaîne encodée comme suit :

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Sortie :

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']

Résumé

Dans ce laboratoire, nous avons appris à connaître la fonction encode() du module char de la bibliothèque NumPy. Nous avons vu comment elle est utilisée avec sa syntaxe et les valeurs renvoyées par cette fonction. Nous avons également discuté de différents schémas d'encodage tels que 'cp037' et 'utf-8' et démontré leur utilisation à l'aide d'exemples. La fonction encode() permet d'encoder une chaîne d'entrée de manière élémentaire et renvoie la chaîne encodée.