プロジェクト の Python スキルツリー
One Cut Into Two
初級
このプロジェクトでは、サブワードトークナイザーを実装する方法を学びます。サブワードトークナイザーは、自然言語処理タスクにおける重要なステップです。トークナイゼーションとは、テキストの文字列を、トークンと呼ばれるより小さな単位に分割するプロセスです。トークンは、個々の単語、文字、またはサブワードになります。このプロジェクトでは、英語や他のラテン語ベースの言語で一般的に使用されるサブワードレベルのトークナイゼーションに焦点を当てています。
pythondata-science
💡 このチュートリアルは英語版からAIによって翻訳されています。原文を確認するには、 ここをクリックしてください
講師
Labby
Labby is the LabEx teacher.





