はじめに
この実験では、Numpy ライブラリの char モジュールの split() 関数について説明します。split() 関数は、指定された区切り文字に基づいて入力文字列を文字列のリストに分割するために使用されます。
VM のヒント
VM の起動が完了したら、左上隅をクリックして ノートブック タブに切り替え、Jupyter Notebook を使って練習しましょう。
Jupyter Notebook の読み込みには数秒かかる場合があります。Jupyter Notebook の制限により、操作の検証を自動化することはできません。
学習中に問題が発生した場合は、Labby にお問い合わせください。セッション後にフィードバックを提供してください。すぐに問題を解決いたします。
Numpy ライブラリをインポートする
numpy.char.split() 関数を使用するには、numpy ライブラリをインポートする必要があります。次のコードを使用して行うことができます。
import numpy as np
split() 関数を使って単純な文字列を分割する
このステップでは、split() 関数を使って単純な文字列を分割します。文字列 input_string を定義し、それを split() 関数の引数として渡します。関数の出力は、入力文字列を空白で分割することによって得られる文字列のリストになります。
input_string = "Hello World!"
result = np.char.split(input_string)
print("Input String: {}\nOutput String: {}".format(input_string,result))
上記のコードの出力は以下の通りです。
Input String: Hello World!
Output String: ['Hello', 'World!']
区切り文字付きで文字列を分割する
このステップでは、区切り文字を使って文字列を分割します。複数の | 区切り文字が含まれる文字列 input_string を定義します。split() 関数を使って、区切り文字として | を基準に文字列を分割し、結果のリストを出力します。
input_string = "apple|banana|cherry"
result = np.char.split(input_string, sep='|')
print("Input String: {}\nOutput String: {}".format(input_string,result))
上記のコードの出力は以下の通りです。
Input String: apple|banana|cherry
Output String: ['apple', 'banana', 'cherry']
最大分割数で文字列を分割する
このステップでは、最大回数で文字列を分割します。ただ 1 回だけ分割する文字列 input_string を定義します。split() 関数を使って、区切り文字として | を基準に、最大分割回数を 1 回に設定して文字列を分割します。
input_string = "apple|banana|cherry"
result = np.char.split(input_string, sep='|', maxsplit=1)
print("Input String: {}\nOutput String: {}".format(input_string,result))
上記のコードの出力は以下の通りです。
Input String: apple|banana|cherry
Output String: ['apple', 'banana|cherry']
文字列の配列を分割する
このステップでは、文字列の配列を分割します。numpy を使って文字列の配列を定義します。split() 関数を使って、区切り文字として - を基準に、最大分割回数を 1 回に設定して文字列の配列を分割します。
input_array = np.array(['apple-juice', 'banana-milkshake', 'cherry-smoothie'])
result = np.char.split(input_array, sep='-', maxsplit=1)
print("Input Array: \n{}\nOutput Array: {}".format(input_array,result))
上記のコードの出力は以下の通りです。
Input Array:
['apple-juice' 'banana-milkshake' 'cherry-smoothie']
Output Array:
[list(['apple', 'juice']) list(['banana','milkshake']) list(['cherry','smoothie'])]
まとめ
この実験では、Numpy ライブラリの split() 関数について学びました。指定された区切り文字に基づいて文字列を文字列のリストに分割する方法を学びました。また、文字列を分割する際の最大分割回数の使用方法についても説明しました。最後に、split() 関数を使って文字列の配列を分割する方法について説明しました。