Расскажем, что такое crowdsource и как с ним работать. Научимся декомпозировать исходную задачу и писать инструкции для разметчиков. Покажем, как работать в Толоке: научим готовить данные, создавать пулы, контролировать качество и агрегировать результаты
→ Семантическая сегментация
Сделаем обзор моделей для задачи семантической сегментации, обсудим метрики и лоссы. Покажем, как применять Multi-task learning для этой задачи. Расскажем, как можно отделять объекты одного класса друг от друга при помощи Watershed
Пройдём путь от первых детекторов до современных. Обсудим двух- и одноэтапные anchor-based детекторы, а также anchor-free детекторы. Разберёмся, как работать с MMDetection. В задаче трекинга обсудим классический SORT и его современную модификацию FairMOT
Расскажем, как обычная кросс-энтропия помогает искать похожие картинки (лица), узнаем, как из этого выводится angular margin loss и при чём здесь contrastive loss. Затронем использование этого для быстрого поиска картинок (лиц), упомянув матричные разложения и кластеризацию
→ Распознавание текста (OCR)
Расскажем про детекцию и распознавание текста, сделаем обзор основных архитектур и датасетов. Расскажем про готовые фреймворки и библиотеки: Paddle OCR, MMOCR, EasyOCR и расскажем, в каких случаях какой лучше применять
→ Детекция без нейросетей
Расскажем, как решают задачу локализации объектов без нейросетей. Рассмотрим алгоритмы поиска контуров и минимально-описывающих фигур, математические морфологии, проекции и бинаризацию