Учебный план курса
"Ракета в Computer Vision"

Моделинг
  1. Организация репозитория для обучения моделей
  2. Конфигурирование и логирование экспериментов
  3. Catalyst VS Lightning, Reproducibility
  4. Метрики, аугментации
  5. DVC
Мультилейбл классификация, JIT
  1. Классические и SOTA архитектуры для классификации
  2. Обучение при дисбалансе данных
  3. Schedulers, stages
  4. Конвертация в JIT и Torch Script
Сервис
  1. Flask, DI контейнеры, организация репозитория
  2. Конфигурирование сервиса
  3. Интеграция веб-сервиса и инференса модели
OPS (Docker, GIT, CI/CD, линтер, тесты ...)
  1. Продвинутый git, git flow
  2. Docker
  3. GitLab CI
  4. Линтеры, юнит-тесты
  5. Деплой, Heroku
  6. Мониторинг ошибок, sentry
  7. Интеграционные тесты, docker-compose
Сегментация
  1. Обзор сегментационных моделей для задач Semantic Segmetation
  2. Метрики
  3. Multi-task learning (segmentation + classification)
  4. Triplet thresholds
  5. Watershed
Классический CV
Варпафинные преобразование
Ускорение моделей
  1. Quantization, quantization aware training
  2. Дистилляция, teacher-student
  3. Фьюзинг
  4. Прунинг
Толока
  1. Декомпозиция исходной задачи
  2. Тонкости написания инструкции
  3. Подготовка данных к загрузке в Толоку
  4. Создания основных, обучающих и экзаменационных пулов
  5. Контроль качества разметки
  6. Агрегация результатов
Инференс в вебе
  1. Скрапинг
  2. Конвертация модели в tfjs
  3. wasm и webgl
  4. Сервер на flask для подгрузки модели
  5. Обработка результатов модели в js
Object Detection, Трекинг
  1. От RCNN до SSD, поймем как работают двух и одноэтапные anchor based детекторы
  2. Anchor-free детекторы
  3. MMDetection, как правильно работать с данными
  4. Байесовские фильтры и фильтр Калмана для детекции (SORT)
  5. FairMOT
Face Recognition
  1. Кластеризация
  2. Elastic DB
  3. Metric Learning
Еще про оптимизацию инференса и конвертацию
  1. TensorRT
  2. ONNX
  3. DALLI ?
OCR
  1. Задача OCR, RNN, LSTM, CTC-loss
  2. Патчинг архитектур OCR-моделей
  3. Интерпретируемость (KL-див, CTC-loss)
Предобучение на синтетике
  1. Active Learning
  2. OpenCV, PIL
  3. Синтезирование данных для OCR