異なるエンコード方式でencode()関数を使用する
ここでは、2つの異なるエンコード方式 'cp037' と 'utf-8' で encode()
関数を使用します。このために、まず文字列の配列を定義します。
a = ['aAaAaA',' aA ', 'abBABba', 'dffgs', 'ttsred']
エンコード方式 'cp037' を使用する場合:
入力配列とエンコードタイプをパラメータとして渡すことで、エンコード方式 'cp037' で encode()
関数を使用します。次がコードブロックです。
x = np.char.encode(a, encoding='cp037', errors=None)
上記のコードブロックは、入力配列 a
を読み取り、'cp037' エンコード方式でエンコードします。エンコードされた文字列は変数 x
に格納されます。エラーハンドリングメカニズムが指定されていないため、errors
パラメータは None
に設定されています。次に、入力配列とエンコードされた文字列を次のように出力します。
print("Input is:")
print(a)
print("Encoded String is:")
print(x)
出力:
Input is:
['aAaAaA',' aA ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'\x81\xc1\x81\xc1\x81\xc1' b'@@\x81\xc1@@'
b'\x81\x82\xc2\xc1\xc2\x82\x81' b'\x84\x86\x86\x87\xa2'
b'\xa3\xa3\xa2\x99\x85\x84']
エンコード方式 'utf-8' を使用する場合:
入力配列とエンコードタイプをパラメータとして渡すことで、エンコード方式 'utf-8' で encode()
関数を使用します。次がコードブロックです。
x = np.char.encode(a, encoding='utf-8', errors=None)
上記のコードブロックは、入力配列 a
を読み取り、'utf-8' エンコード方式でエンコードします。エンコードされた文字列は変数 x
に格納されます。エラーハンドリングメカニズムが指定されていないため、errors
パラメータは None
に設定されています。次に、入力配列とエンコードされた文字列を次のように出力します。
print("Input is:")
print(a)
print("Encoded String is:")
print(x)
出力:
Input is:
['aAaAaA',' aA ', 'abBABba', 'dffgs', 'ttsred']
Encoded String is:
[b'aAaAaA' b' aA ' b'abBABba' b'dffgs' b'ttsred']