다양한 인코딩 방식과 함께 encode() 함수 사용
이제 두 가지 다른 인코딩 방식인 'cp037'과 'utf-8'을 사용하여 encode() 함수를 사용해 보겠습니다. 이를 위해 먼저 문자열 배열을 정의합니다.
a = ['aAaAaA', ' aA ', 'abBABba','dffgs','ttsred']
인코딩 방식 'cp037' 사용하기
입력 배열과 인코딩 유형을 매개변수로 전달하여 인코딩 방식 'cp037'을 사용하여 encode() 함수를 사용합니다. 다음은 코드 블록입니다.
x = np.char.encode(a, encoding='cp037', errors=None)
위의 코드 블록은 입력 배열 a를 읽고 'cp037' 인코딩 방식으로 인코딩합니다. 인코딩된 문자열은 변수 x에 저장됩니다. 오류 처리 메커니즘이 지정되지 않았으므로 errors 매개변수는 None으로 설정됩니다. 이제 입력 배열과 인코딩된 문자열을 다음과 같이 출력합니다.
print("Input is:")
print(a)
print("Encoded String is:")
print(x)
출력:
Input is:
['aAaAaA', ' aA ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
b'\xa3\xa3\xa2\x99\x85\x84']
인코딩 방식 'utf-8' 사용하기
입력 배열과 인코딩 유형을 매개변수로 전달하여 인코딩 방식 'utf-8'을 사용하여 encode() 함수를 사용합니다. 다음은 코드 블록입니다.
x = np.char.encode(a, encoding='utf-8', errors=None)
위의 코드 블록은 입력 배열 a를 읽고 'utf-8' 인코딩 방식으로 인코딩합니다. 인코딩된 문자열은 변수 x에 저장됩니다. 오류 처리 메커니즘이 지정되지 않았으므로 errors 매개변수는 None으로 설정됩니다. 이제 입력 배열과 인코딩된 문자열을 다음과 같이 출력합니다.
print("Input is:")
print(a)
print("Encoded String is:")
print(x)
출력:
Input is:
['aAaAaA', ' aA ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']