Introdução
Neste laboratório, aprenderá a realizar classificação semi-supervisionada num conjunto de dados de texto utilizando o scikit-learn. O aprendizado semi-supervisionado é um tipo de aprendizado de máquina onde um modelo é treinado com dados rotulados e não rotulados. Este laboratório abordará como utilizar os algoritmos Self-Training e LabelSpreading para classificação de texto semi-supervisionada. Utilizaremos o conjunto de dados 20 newsgroups para treinar e testar nossos modelos.
Dicas da Máquina Virtual
Após o arranque da máquina virtual, clique no canto superior esquerdo para mudar para a aba Notebook para aceder ao Jupyter Notebook para a prática.
Por vezes, pode ser necessário aguardar alguns segundos para o Jupyter Notebook terminar o carregamento. A validação das operações não pode ser automatizada devido a limitações no Jupyter Notebook.
Se tiver problemas durante o aprendizado, não hesite em contactar o Labby. Forneça feedback após a sessão e resolveremos o problema rapidamente para si.