Практические лабораторные работы по Sklearn
Начинающий
Этот курс содержит множество лабораторных работ по Sklearn. Каждая лабораторная работа представляет собой небольшой проект на Sklearn с подробными инструкциями и решениями. Вы можете практиковать свои навыки работы с Sklearn, улучшить свои навыки программирования и научиться писать чистый и эффективный код, выполняя эти лабораторные работы.
sklearnpythondata-science
💡 Этот учебник переведен с английского с помощью ИИ. Чтобы просмотреть оригинал, вы можете перейти на английский оригинал
- Введение
- Программа
Сравнение классификаторов в Scikit-Learn
Классификация текстовых документов
Дискретизация признаков для классификации
Конвейеры и составные оценщики
Масштабирование признаков в машинном обучении
Построение конвейеров в Scikit-Learn
Scikit-Learn Iterative Imputer
Многообразие в машинном обучении на рукописных цифрах
Классификация цифр с использованием признаков RBM
Column Transformer с смешанными типами
Использование API set_output
Полусupervised классификация текстов
Сравнение калибровки классификаторов
Кривая权衡 ошибок обнаружения
Снижение размерности с использованием Pipeline и GridSearchCV
Кривые градуировки вероятностей
Сравнение алгоритмов обнаружения аномалий
Метрика Точность - Полнота для несбалансированной классификации
Отбор признаков в задачах с одним признаком
Отбор признаков для SVC на наборе данных iris
Приблизительные ближайшие соседи в TSNE
Создание визуализаций с использованием объектов отображения
Преобразование целевой переменной для линейной регрессии
Gradient Boosting с категориальными признаками
Построение конвейеров машинного обучения с использованием Scikit - Learn
Распознавание лиц с использованием собственных лиц (eigenfaces) и методов опорных векторов (SVM)
Объединение нескольких методов извлечения признаков
Отношения правдоподобия классов для измерения качества классификации
Построение графика PCR против PLS
Алгоритмы мультиклассовой и мультивыходной классификации
Заполнение пропущенных данных
Многиномиальная логистическая регрессия для MNIST
Обнаружение выбросов с использованием алгоритмов Scikit-Learn
Оценка многоклассовых классификаторов с использованием ROC с помощью Scikit - learn
Извлечение и оценка текстовых признаков
Преобразование признаков с использованием ансамблей деревьев
Регуляризация многослойного перцептрона
Кластеризация K-Means для рукописных цифр
Приближение полиномиального ядра с использованием Scikit - Learn
API визуализации Scikit-Learn
Классификация ирисных цветов с использованием Voting Classifier
Построение классификации Nca
Построение конвейера для цифр
Scikit - Learn: оценщики и конвейеры
Сбалансировать сложность модели и оценку при кросс-валидации
Влияние переменного порога на самообучение
Многоэтикетная классификация документов
Классификация текстов с использованием out - of - core обучения
Сравнение линейных байесовских регрессоров
Выбор модели Lasso
Выбор модели для Lasso-регрессии
Рекурсивное исключение признаков с использованием кросс-валидации
Выбор признаков с использованием Scikit-Learn
Алгоритм кластеризации DBSCAN
Бикластеризация документов с использованием алгоритма спектральной кокластеризации
Исследование ансамблевых методов с использованием Scikit-Learn
Многоклассовые деревья решений с использованием AdaBoost
Построение кривых обучения
Преобразование категориальных данных с использованием TargetEncoder
Недообучение и переобучение
Классификация с использованием решательного дерева AdaBoost
Построение предсказаний с использованием кросс-валидации
Найлучшая подгонка линейных оценщиков
Оценка качества модели машинного обучения
Кеширование ближайших соседей
Оптимизация гиперпараметров модели с использованием GridSearchCV
Оценки вне пакета для градиентного бустинга
Дезшумивание изображений с использованием Kernel PCA
Преобразование признаков с использованием хэширования
Построение вероятности классификации
Калибровка вероятностей для классификации на три класса
Важность признаков с использованием случайного леса
Дискретный против реального AdaBoost
Оценка плотности с использованием ядра
Ранняя остановка стохастического градиентного спуска
Построение графика Sgdocsvm против Ocsvm
Многоклассовая разреженная логистическая регрессия
Последовательные итерации усечения
Классификация рукописных цифр с помощью классификатора MLP
Квантование цветов с использованием K-Means
Отбор признаков на основе модели и последовательный отбор признаков
Дискретизация непрерывных признаков с использованием KBinsDiscretizer
Рекурсивное исключение признаков
Предсказание диабета с использованием Регурессора голосования
Построение леса на наборе данных iris
Иерархическая кластеризация с ограничениями связности
Оптимизация гиперпараметров: случайный поиск против сеточного поиска
Валидационные кривые: построение оценок для оценки моделей
После усечения деревьев решений
Регуляризация Тихонова (Ridge Regression) для линейной моделирования
Сравнение онлайн-решателей для классификации рукописных цифр
Анализ дерева решений
Вероятности классов с использованием VotingClassifier
Построение сравнения между лесом и гистограммным градиентным бустингом
Анализ кластеризации методом силуэта
Построение многонаправленной и логистической регрессии «один против всех»
Сравнение K-Means и MiniBatchKMeans
Алгоритм спектральной бикластеризации
Алгоритм спектральной ко - кластеризации
Важность признаков перестановки
Деревья решений на наборе данных Iris
Вложенная кросс-валидация для выбора модели
Тест перестановочной оценки для классификации
Масштабирование параметра регуляризации для SVM
Построение кривых валидации
Настройка гиперпараметров оценщика
Классификация цифр с использованием Scikit-Learn
Открытие структуры набора данных Iris с помощью факторного анализа
Построение графиков по извлечению тем с использованием NMF и LDA
Методы инициализации модели смеси Гаусса
Частичная зависимость и индивидуальное условное ожидание
ROC с использованием кросс-валидации
Непараметрическая изотонная регрессия с использованием Scikit-Learn
Регуляризация разреженных сигналов с использованием моделей на основе L1
Регирессия с неотрицательными наименьшими квадратами
Квантильная регрессия с использованием Scikit - Learn
Обнаружение выбросов в данных о вине
Исследование предположений алгоритма кластеризации k-средних
Исследование леммы Джонсона-Линденштрасса с использованием случайных проекций
Анализ главных компонент с использованием Kernel PCA
Анализ набора данных цифр
Построение сеточного поиска для цифр
Обнаружение аномалий с использованием Isolation Forest
Сравнение GPR и KRR на графике
Scikit-Learn MLPClassifier: Стратегии стохастического обучения
Линейный дискриминантный анализ для классификации
Построение Kernel Ridge Regression
Построение графика для мульти-выходной регрессии с использованием случайного леса
Сравнение Grid Search и Successive Halving
Построение сравнения моделирования PCA и FA
Моделирование распределения видов
Масштабирование и преобразование данных
Демонстрация стратегий KBinsDiscretizer
Сравнение FeatureHasher и DictVectorizer
Предварительное вычисление матрицы Грама для ElasticNet
Построение графика для сравнения Huber и Ridge
Регурессия Lasso в Scikit-Learn
Восстановление разреженного сигнала с использованием Ортогонального Метода Сопоставления
Построение разделяющей гиперплоскости с использованием SGD
Пошаговая логистическая регрессия
Эмпирическая оценка инициализации K-Means
Анализ компонентов соседей
Оценка плотности ядра распределений видов
Кластеризация методом Affinity Propagation
Дендрограмма иерархической кластеризации
Сравнение BIRCH и MiniBatchKMeans
Сравнение производительности Bisecting K-Means и обычного K-Means
Сравнение алгоритмов кластеризации
Демонстрация алгоритма кластеризации HDBSCAN
Алгоритм кластеризации Mean-Shift
Неразмеченная кластеризация с использованием k-средних
Оценка ошибки вне пакета (Out-Of-Bag) для Случайного леса
Важность пикселей с параллельным лесом деревьев
Сегментация изображений с использованием иерархической кластеризации
Построение графиков для патчей лиц из словаря
Гауссовские процессы для дискретных структур данных
Спектральное кластерирование для сегментации изображений
Разрешение конфликтов в SVM
Построение графика для GPR Co2
Регурессия с помощью бустингового дерева решений
Разложение на смещение и дисперсию с использованием bagging
Модель регрессии Elastic-Net в Scikit-Learn
Построение иерархической кластеризации
Преобразование данных в нормальное распределение
Кросс-валидация с линейными моделями
SVM: Максимальная гиперплоскость разделения с отступом
SVM для несбалансированных классов
Техники предобработки в Scikit-Learn
Метрики агломеративного кластерирования
Логистическая регрессия для классификации датасета Iris
Многоклассовый классификатор SGD в Scikit-Learn
Инкрементальный анализ главных компонент для датасета Iris
Оценка разреженной обратной ковариации
Классификация ближайшего центроида
Вероятностные прогнозы с использованием классификации гауссовского процесса
Монотонные ограничения в градиентном бустинге
Матрица ошибок в Scikit-Learn
Распознавание рукописных цифр
Регуляризация градиентного бустинга
Обучение с использованием Label Propagation
Алгоритмы полунаправленного обучения
Техники регрессии нелинейных данных
Прогноз цены биткойна
Оценка ковариации методом сужения
Визуализация высокомерных данных с использованием MDS
Ковариации гауссовской смеси
Выбор модели гауссовских смесей
Полуподдерживаемые классификаторы на наборе данных Iris
Явная аппроксимация карты признаков для ядер RBF
Построить сравнение PCA и LDA
Многообразиевое обучение на сферических данных
Декомпозиции набора данных лиц
Построение случайных наборов данных для классификации
Генерация мультиметкажных датасетов с использованием Scikit-Learn
Снижение размерности Swiss Roll и Swiss-Hole
Scikit-Learn Libsvm GUI
Векторное квантование с использованием KBinsDiscretizer
Иерархическая кластеризация с использованием Scikit - Learn
Преобразование целевого прогноза
Агломерация признаков для высокомерных данных
Извлечение признаков с использованием Scikit-Learn
Сравнение F-теста и взаимной информации
Подгонка кривых с использованием байесовской регрессии с убывающим коэффициентом
Lasso и Elastic Net
Модель логистической регрессии
Совместный подбор признаков с использованием Lasso для многозадачности
Применение техник регуляризации с использованием SGD
Регирессия Тейла-Сена с использованием библиотеки Scikit-Learn для Python
Восстановление изображения с использованием сжатие данных
Регурессия дерева решений
Регирессия с деревом решений для нескольких выходов
Простая одномерная оценка плотности вероятности с использованием ядра
Локальный фактор аномальности (Local Outlier Factor) для обнаружения новизны
Обнаружение выбросов с использованием LOF
Оценка плотности с использованием ядра
Изучение алгоритма K-Means Clustering с использованием Python
Агломеративная кластеризация на наборе данных цифр
Алгоритм кластеризации OPTICS
Бикластеризация в Scikit-Learn
Путь регуляризации L1-логистической регрессии
Подгонка модели методом опорных векторов для регрессии
Кластеризация на основе центроидов
Модели нейронных сетей
Классификация с помощью гауссовского процесса на наборе данных Iris
Классификация с использованием гауссовых процессов
Классификация гауссовским процессом на наборе данных XOR
Нелинейная прогностическая модель с использованием Гауссовского процесса
Подгонка модели регрессии с гауссовым процессом
Регирессия с гауссовым процессом: ядра
Спектральная кластеризация и другие методы кластеризации
Техники нелинейного распознавания образов
Быстрый выбор моделей с использованием cross-validation
Кросс-валидация на наборе данных digits
Раннее прекращение градиентного бустинга
Кросс-валидация в машинном обучении с использованием Python
Пример линейной регрессии
Попарные метрики и ядра в Scikit-Learn
Сравнение методов кросс-разложения
Классификация ближайших соседей
Классификация SVM с использованием пользовательского ядра
Классификатор SVM на наборе данных Iris
Восстановление пропущенных значений
Классификация с использованием дерева решений на Python
Техники аппроксимации ядра в Scikit-Learn
Вероятностная классификация с использованием наивного Байеса
Разделение смешанных сигналов на исходные компоненты
Анализ независимых компонент с использованием FastICA и PCA
Классификация цветов Ириса с использованием Scikit-learn
Анализ главных компонент
Разреженное кодирование с предварительно вычисленным словарем
PageRank Википедии с использованием случайного SVD
Разложение сигналов на компоненты
Сравнение оценщиков ковариации
Робастная оценка ковариации и связь с расстояниями Махаланобиса
Оценка устойчивой матрицы ковариации в Python
Оценка ковариационной матрицы с использованием Scikit-Learn
Обучение многообразия с использованием Scikit-Learn
Алгоритмы классификации Дискриминантного Анализа
Построение априорного распределения концентрации
Модели смеси Гаусса
Нелинейная регрессия с использованием изотонной регрессии
Активное обучение с использованием распространения меток
Метод Bagging и Boosting
Исследование иерархической кластеризации для кластеризации
Руководство по TensorFlow
Небольшая нейронная сеть, реализованная с использованием TensorFlow 2
Сохранение и восстановление модели в TensorFlow 2
Обучение нейронной сети для распознавания рукописных цифр
Вычисление коэффициента регрессии с гребнем
Основы линейной регрессии
Классификация с использованием логистической регрессии в Scikit-Learn
Предсказание цен на жилье в Пекине
Кластеризация на основе плотности
Сжатие изображений с использованием Mini Batch K Means
Приложение кластеризации на основе плотности
Алгоритм k ближайших соседей
Регирессия с риджем (Ridge Regression) и LASSO-регрессия
Классификация датасета по оценке безопасности автомобилей
Перцептрон и искусственная нейронная сеть
Преподаватель
Labby
Labby is the LabEx teacher.
Поделиться в Google Classroom
Присоединяйтесь к нашему Discord и учитесь вместе
Присоединиться сейчасОтзывы пользователей
" Thank you so much for collecting all this knowledge into one place!"
— Joni Uusitalo
" Es muy dinámico y fácil de comprender"
— Nadia Gonzalez Armayor
Рекомендовано для вас

