NumPy encode 함수

Beginner

소개

NumPy 는 배열 작업을 위해 사용되는 널리 사용되는 Python 라이브러리입니다. NumPy 의 하위 모듈 중 하나는 NumPy 배열에 적용할 수 있는 여러 문자열 연산을 제공하는 char 모듈입니다. 이 Lab 튜토리얼에서는 NumPy 의 char 모듈의 encode() 함수에 대해 논의할 것입니다. 이 함수를 사용하여 주어진 입력 문자열을 인코딩하는 방법을 배우겠습니다. 예제를 사용하여 encode() 함수의 구문, 매개변수 및 반환 값을 다룰 것입니다.

VM 팁

VM 시작이 완료되면 왼쪽 상단을 클릭하여 Notebook 탭으로 전환하여 실습을 위해 Jupyter Notebook에 액세스하십시오.

때로는 Jupyter Notebook 이 로딩을 완료하는 데 몇 초 정도 기다려야 할 수 있습니다. Jupyter Notebook 의 제한으로 인해 작업의 유효성 검사는 자동화될 수 없습니다.

학습 중에 문제가 발생하면 언제든지 Labby 에게 문의하십시오. 세션 후 피드백을 제공해주시면 문제를 즉시 해결해 드리겠습니다.

NumPy 라이브러리 임포트

encode() 함수를 사용하기 위해 필요한 NumPy 라이브러리를 가져오는 것으로 시작합니다. 다음은 NumPy 를 가져오기 위한 코드 블록입니다.

import numpy as np

다양한 인코딩 방식과 함께 encode() 함수 사용

이제 두 가지 다른 인코딩 방식인 'cp037'과 'utf-8'을 사용하여 encode() 함수를 사용해 보겠습니다. 이를 위해 먼저 문자열 배열을 정의합니다.

a = ['aAaAaA', '  aA  ', 'abBABba','dffgs','ttsred']

인코딩 방식 'cp037' 사용하기

입력 배열과 인코딩 유형을 매개변수로 전달하여 인코딩 방식 'cp037'을 사용하여 encode() 함수를 사용합니다. 다음은 코드 블록입니다.

x = np.char.encode(a, encoding='cp037', errors=None)

위의 코드 블록은 입력 배열 a를 읽고 'cp037' 인코딩 방식으로 인코딩합니다. 인코딩된 문자열은 변수 x에 저장됩니다. 오류 처리 메커니즘이 지정되지 않았으므로 errors 매개변수는 None으로 설정됩니다. 이제 입력 배열과 인코딩된 문자열을 다음과 같이 출력합니다.

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

출력:

Input is:
['aAaAaA', '  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
 b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
 b'\xa3\xa3\xa2\x99\x85\x84']

인코딩 방식 'utf-8' 사용하기

입력 배열과 인코딩 유형을 매개변수로 전달하여 인코딩 방식 'utf-8'을 사용하여 encode() 함수를 사용합니다. 다음은 코드 블록입니다.

x = np.char.encode(a, encoding='utf-8', errors=None)

위의 코드 블록은 입력 배열 a를 읽고 'utf-8' 인코딩 방식으로 인코딩합니다. 인코딩된 문자열은 변수 x에 저장됩니다. 오류 처리 메커니즘이 지정되지 않았으므로 errors 매개변수는 None으로 설정됩니다. 이제 입력 배열과 인코딩된 문자열을 다음과 같이 출력합니다.

print("Input is:")
print(a)

print("Encoded String is:")
print(x)

출력:

Input is:
['aAaAaA', '  aA  ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']

요약

이 랩에서는 NumPy 라이브러리의 char 모듈의 encode() 함수에 대해 배웠습니다. 이 함수의 구문과 반환 값을 사용하여 어떻게 사용되는지 다루었습니다. 또한 'cp037' 및 'utf-8'과 같은 다양한 인코딩 방식 (encoding schemes) 에 대해 논의하고 예제를 통해 사용법을 시연했습니다. encode() 함수는 입력 문자열을 요소별 방식으로 인코딩하고 인코딩된 문자열을 반환합니다.