Введение
В этом практическом занятии (лабораторной работе) вы научитесь выполнять полусupervised классификацию текстового набора данных с использованием библиотеки scikit-learn. Полусupervised обучение - это тип машинного обучения, при котором модель обучается на как помеченных, так и непомеченных данных. В этом практическом занятии будет показано, как использовать алгоритмы Self-Training и LabelSpreading для полусupervised классификации текстов. Мы будем использовать набор данных 20 newsgroups для обучения и тестирования наших моделей.
Советы по виртуальной машине (VM)
После запуска виртуальной машины нажмите в левом верхнем углу, чтобы переключиться на вкладку Notebook и получить доступ к Jupyter Notebook для практики.
Иногда вам может потребоваться подождать несколько секунд, пока Jupyter Notebook загрузится. Валидация операций не может быть автоматизирована из-за ограничений Jupyter Notebook.
Если у вас возникнут проблемы во время обучения, не стесняйтесь обращаться к Labby. Оставьте отзыв после занятия, и мы оперативно решим проблему для вас.
Skills Graph
%%%%{init: {'theme':'neutral'}}%%%%
flowchart RL
sklearn(("Sklearn")) -.-> sklearn/DataPreprocessingandFeatureEngineeringGroup(["Data Preprocessing and Feature Engineering"])
sklearn(("Sklearn")) -.-> sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup(["Advanced Data Analysis and Dimensionality Reduction"])
sklearn(("Sklearn")) -.-> sklearn/CoreModelsandAlgorithmsGroup(["Core Models and Algorithms"])
sklearn(("Sklearn")) -.-> sklearn/ModelSelectionandEvaluationGroup(["Model Selection and Evaluation"])
sklearn(("Sklearn")) -.-> sklearn/UtilitiesandDatasetsGroup(["Utilities and Datasets"])
ml(("Machine Learning")) -.-> ml/FrameworkandSoftwareGroup(["Framework and Software"])
sklearn/CoreModelsandAlgorithmsGroup -.-> sklearn/linear_model("Linear Models")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/preprocessing("Preprocessing and Normalization")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/feature_extraction("Feature Extraction")
sklearn/DataPreprocessingandFeatureEngineeringGroup -.-> sklearn/pipeline("Pipeline")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/model_selection("Model Selection")
sklearn/ModelSelectionandEvaluationGroup -.-> sklearn/metrics("Metrics")
sklearn/AdvancedDataAnalysisandDimensionalityReductionGroup -.-> sklearn/semi_supervised("Semi-Supervised Learning")
sklearn/UtilitiesandDatasetsGroup -.-> sklearn/datasets("Datasets")
ml/FrameworkandSoftwareGroup -.-> ml/sklearn("scikit-learn")
subgraph Lab Skills
sklearn/linear_model -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/preprocessing -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/feature_extraction -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/pipeline -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/model_selection -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/metrics -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/semi_supervised -.-> lab-49281{{"Полусupervised классификация текстов"}}
sklearn/datasets -.-> lab-49281{{"Полусupervised классификация текстов"}}
ml/sklearn -.-> lab-49281{{"Полусupervised классификация текстов"}}
end