projeto em Python Skill Tree
Um Corte em Dois
Iniciante
Neste projeto, você aprenderá como implementar um tokenizador de subpalavras, um passo crucial em tarefas de processamento de linguagem natural. A tokenização é o processo de dividir uma string de texto em unidades menores, chamadas tokens, que podem ser palavras individuais, caracteres ou subpalavras. Este projeto se concentra na tokenização em nível de subpalavra, comumente usada em inglês e outras línguas baseadas no latim.
pythondata-science
💡 Este tutorial foi traduzido do inglês com assistência de IA. Para ver o original, você pode mudar para a versão em inglês
Professor
Labby
Labby is the LabEx teacher.





