Функция кодирования NumPy

PythonPythonBeginner
Практиковаться сейчас

💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал

Введение

NumPy - это популярная библиотека Python, используемая для работы с массивами. Одним из подмодулей NumPy является модуль char, который предоставляет несколько операций со строками, которые можно применить к массивам NumPy. В этом практическом руководстве мы обсудим функцию encode() модуля char NumPy. Мы узнаем, как использовать эту функцию для кодирования заданной входной строки. Мы рассмотрим синтаксис, параметры и возвращаемые значения функции encode() с использованием примеров.

Советы по работе с ВМ

После запуска ВМ нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.

Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook не загрузится полностью. Валидация операций не может быть автоматизирована из-за ограничений в Jupyter Notebook.

Если вы сталкиваетесь с проблемами при обучении, не стесняйтесь задавать вопросы Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.

Импортируем библиотеку NumPy

Начнем с импорта библиотеки NumPy, которая нужна для использования функции encode(). Ниже приведен код для импорта NumPy:

import numpy as np

Использование функции encode() с разными схемами кодирования

Теперь мы будем использовать функцию encode() с двумя разными схемами кодирования: 'cp037' и 'utf-8'. Для этого мы сначала определим массив строк.

a = ['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']

Использование схемы кодирования 'cp037':

Мы используем функцию encode() с схемой кодирования 'cp037', передав в качестве параметров входной массив и тип кодирования. Ниже приведен код:

x = np.char.encode(a, encoding='cp037', errors=None)

Вышеприведенный код читает входной массив a и кодирует его с использованием схемы кодирования 'cp037'. Закодированная строка сохраняется в переменной x. Поскольку не указан механизм обработки ошибок, параметр errors установлен в None. Теперь мы выводим входной массив и закодированную строку следующим образом:

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Результат:

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
 b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
 b'\xa3\xa3\xa2\x99\x85\x84']

Использование схемы кодирования 'utf-8':

Мы используем функцию encode() с схемой кодирования 'utf-8', передав в качестве параметров входной массив и тип кодирования. Ниже приведен код:

x = np.char.encode(a, encoding='utf-8', errors=None)

Вышеприведенный код читает входной массив a и кодирует его с использованием схемы кодирования 'utf-8'. Закодированная строка сохраняется в переменной x. Поскольку не указан механизм обработки ошибок, параметр errors установлен в None. Теперь мы выводим входной массив и закодированную строку следующим образом:

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

Результат:

Input is:
['aAaAaA','  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']

Резюме

В этом практическом занятии мы узнали о функции encode() модуля char библиотеки NumPy. Мы рассмотрели, как ее использовать с ее синтаксисом и возвращаемыми значениями. Мы также обсудили разные схемы кодирования, такие как 'cp037' и 'utf-8', и продемонстрировали их использование с примерами. Функция encode() позволяет кодировать входную строку поэлементно и возвращает закодированную строку.