Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Computer Vision Rocket

Онлайн-курс
Cтарт — 13 мая
Погрузитесь в продвинутый Computer Vision: от сложностей и корнер-кейсов в «обычных» задачах до мультимодальных моделей и дизайна CV-систем

Курс подойдёт CV-инженерам всех грейдов

Junior

Middle

Senior

узнаете теорию и закрепит на практике
систематизируете знания и закроет пробелы
подсмотрите на практики других команд
Важно знать основы DL и работать с Python и PyTorch
1. Математика для ML и основы DL
Необходимо знать, что такое производная, матричное умножение, скалярное произведение, градиентный спуск, дифференцируемость, как работают оптимизаторы SGD/Adam, что такое кроссэнтропийная функция потерь
Будем писать функции и классы. Домашние задания будут на PyTorch, OpenCV, NumPy. Часть из них будет в py-скриптах
2. Базовое знание Python и PyTorch
Будем разбирать последние подходы в CV и сложные задачи, поэтому необходимо знать про работу свёртки и о других базовых понятиях
3. Опыт в Computer Vision
4. Навыки работы с данными
Нужно иметь опыт с данными: предобработка, визуализация, анализ

Программа

Лекция каждую неделю. После каждой темы — домашнее задание с фидбеком от лектора. Раз в 4−5 недель — Q&A-сессия для разбора вопросов. В середине курса есть перерыв на каникулы.
4 месяца
13 лекций
13 заданий с фидбеком от преподавателей

01. Подготовка данных

Разберём основные источники открытых данных и научимся быстро находить, скачивать и курировать датасеты через API. Освоим визуализацию изображений и аннотаций. Познакомимся с инструментами для разметки и генерации синтетических данных.
  • Авторазметка через модели (HuggingFace, VLM)
  • Разметка данных: Label Studio, CVAT
  • Визуализация данных: Matplotlib, Plotly, FiftyOne
  • PapersWithCode, Academic Torrents и другие источники
  • Kaggle API: поиск датасетов, загрузка и обработка данных
  • HuggingFace: поиск и загрузка данных через API
Основные темы:
  • Скраппинг данных и генерация синтетики

02. Качество данных и улучшение разметки

Научимся оценивать качество данных, устранять шум и улучшать разметку с помощью активного обучения. Разберёмся с атаками на модели через отравление данных и методами защиты
  • Деградация моделей при обновлении датасетов
  • Уязвимости моделей к data poisoning
  • Выявление и устранение «мусорных» данных
  • Множественная разметка и оценка согласованности
  • Active Learning: цикл обучения, выбор «оракула»
  • Критерии качества данных
Основные темы:

03. Секреты успешных архитектур

Познакомимся с эволюцией архитектур нейросетей в CV и разберём ключевые улучшения, ускоряющие обучение и инференс. Освоим адаптивные методы дообучения без изменения основной архитектуры
  • Адаптеры (LoRA) для точечной настройки моделей
  • Оптимизация кеша, отказ от skip connections
  • MobileNet, EfficientNet, FastViT
  • Трансформеры и Multihead Attention
  • ResNet, DenseNet, Unet, BatchNorm
Основные темы:

04. Обучение метрики и быстрый векторный поиск

Разберём постановку задачи metric learning и её связь с классификацией. Освоим контрастное обучение и построение векторных индексов для поиска в embedding-пространстве
  • Векторные базы данных и их метрики
  • KD-деревья, KMeans, PQ, HNSW
  • ArcFace, CosFace, Contrastive loss, Triplet loss
  • Open-set и closed-set валидация
Основные темы:

05. Детекция объектов

Разберём подходы к детекции, включая anchor-based и anchor-free методы. Узнаем, когда стандартные модели недостаточно хороши и как их адаптировать под сложные кейсы
  • Open Vocabulary Detection: YOLO-World, GLEE, Florence-2
  • Дополнительные свойства объектов: ключевые точки, домены
  • Тюнинг детекторов под специфические задачи
  • YOLO: развитие архитектуры
Основные темы:

06. Сегментация

Разберём основные подходы к сегментации изображений, включая современные фундаментальные модели. Обсудим сложные кейсы и методы их решения
  • Проблемы масок: «рваные» границы, сложные структуры
  • Оптимизация сегментации для больших изображений
  • Mask2Former, SAM, GLEE, Florence-2
  • Semantic и Instance Segmentation
Основные темы:

07. Optical Character Recognition (OCR)

Освоим пайплайн OCR: от детекции текста до его распознавания. Познакомимся с современными моделями и VLM, применяемыми в OCR-задачах
  • Трансформеры в OCR: TrOCR, LayoutLM, Donut
  • Препроцессинг, постпроцессинг и синтетические данные
  • Графовые сети для извлечения информации
  • Распознавание текста: CRNN, CTC Loss
  • Детекция текста: CRAFT, DB
Основные темы:

08. Поиск ошибок и интерпретируемость моделей

Научимся анализировать аномалии в процессе обучения и инференса. Освоим методы интерпретации моделей, такие как GradCAM и Test-Time Augmentation
  • GradCAM, Class Activation Maps, Captum
  • Аномальное поведение на инференсе
  • Выявление проблемных данных через кросс-валидацию
  • Визуализация активаций, норм и градиентов
Основные темы:

09. Self-supervised Learning

Освоим подходы к обучению без разметки, включая автокодировщики и контрастное обучение. Разберём способы переноса знаний между доменами
  • Сопоставление разных модальностей (изображение-текст, видео-звук)
  • SimCLR, BYOL и другие методы SSL
  • Jigsaw puzzle, автокодировщики, восстановление части изображения
Основные темы:

10. Работа с видео

Познакомимся с обработкой видео и адаптацией CV-моделей под временные данные. Разберём как построить эффективные пайплайны для видеоаналитики
  • Фундаментальные видео-модели
  • 2D+1D модели, оптический поток, 3D-свёртки
  • Ошибки сжатия и восстановления видео
  • Декодирование видео, раскадровка, работа с FFMPEG
Основные темы:

11. Задачи на видео

Рассмотрим ключевые задачи CV для видео: трекинг, распознавание действий, мультимодальные модели с аудио
  • Интеграция аудио в CV-модели
  • Action Recognition: трекинг ключевых точек, жесты
  • Реидентификация объектов
  • Объектный трекинг: Kalman filter, FairMOT, HNSW
Основные темы:

12. Мультимодальные модели

Разберём современные подходы к объединению изображений, текста и других модальностей в единое представление
  • Тюнинг мультимодальных моделей: LoRA, кастомные токены
  • LLaVA: интеграция эмбеддеров в языковые модели
  • CLIP: контрастное обучение текст-картинка
Основные темы:

13. Дизайн ML-систем

Научимся проектировать пайплайны CV-приложений, подбирать оптимальные решения и интегрировать их в production
  • Active Learning, SSL в проверке решений
  • Использование фундаментальных моделей
  • Разбиение задач на модули
Основные темы:

Как именно вы освоите каждый навык

Онлайн-лекции, где можно задавать вопросы, обсуждать сложные кейсы и дискутировать. В конце — анонимный тест для закрепления материала

01. Изучите теорию на zoom-лекции

1/5
2/5
После каждой темы — домашнее задание. По окончании обучения вы сделаете проект, который можно с гордостью показать коллегам

02. Сделаете практическое задание

3/5
Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

03. Получите разбор домашнего задания

4/5
Обсуждайте домашние задания, рабочие задачи или просто общайтесь. Кураторы курса всегда помогут решить проблемы и поделятся советом

04. Если возникнут трудности, мы оперативно поможем в чате

5/5
Раз в 4−5 недель спикеры и кураторы собираются в zoom, чтобы ответить на ваши вопросы, помочь с практикой, обсудить задачи

05. Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

Кто будет преподавать

Опытные инженеры будут вести Zoom-лекции и семинары, отвечать на ваши вопросы и ревьюить код
Тимлид команды распознавания лиц. Расскажет как решать metric learning задачи
Андрей Шадриков
verigram.ai
Expasoft
Дмитрий Чудаков
Оптимизирует сети. Расскажет про детекцию и секреты успешных архитектур
НИИАС
Дмитрий Раков
Руководит командой ML, которая занимается разработкой беспилотных поездов в AO НИИАС
Работал над сервисом распознавания документов. Расскажет о распознавании текста
Василий Баранов
Авито
verigram.ai
Андрей Шадриков
Тимлид команды распознавания лиц. Расскажет как решать metric learning задачи
Expasoft
Дмитрий Чудаков
Оптимизирует сети для быстрой работы на Edge устройствах. Научит ускорять сети
НИИАС
Дмитрий Раков
Работает над беспилотными поездами. Расскажет о трансформерах
Авито
Василий Баранов
Работал над сервисом распознавания документов. Расскажет о распознавании текста

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий
Налоговый вычет
получите 13% от стоимости курса после обучения
Оплата из-за рубежа
картой иностранного банка или другими удобными способами
Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты
Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Запишитесь в лист ожидания

Старт — 13 мая. Мы свяжемся, когда начнем собирать группу, расскажем о тарифах и подарим скидки на обучение первым участникам

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение
Артём Соломко
LinkedIn
«Был удивлен подробным код ревью домашних заданий, с объяснениями почему, при этом быстро»
«Хочу сказать, что это, пожалуй, лучший курс по ML, который я проходила (а у меня достаточно лет опыта в ML)»
Галина Альперович
(CV Rocket)
(CV Rocket)
Александр
LinkedIn
«На собеседовании за счет того, что подчерпнул на курсе об устройстве OCR, вытянул»
(CV Rocket)

FAQs

Когда проходят лекции и Q&A-сессии?

Лекции проходят по будням в 19:00 по московскому времени и длятся 1,5−2 часа. Q&A-сессии проходят после каждой 5-й лекции, время определяется индивидуально для каждого потока.

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?
Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru
Скидки не распространяются на оплату курса юр. лицами, поэтому при заполнении заявки указывайте полную стоимость.

Если у вас остались вопросы по курсу, напишите нам в Telegram

Наши программы

Поможем освоить востребованные на рынке знания, передав секреты и опыт практикующих инженеров и исследователей
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Март 2025 • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Июнь 2025 • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Июль 2025 • 3 месяца
Подробнее
Подробнее
Подробнее
/
Погрузитесь в продвинутый Computer Vision
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания • 3 месяца
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
/
Подробнее
Июнь 2025 • 4 месяца

CV Rocket 2.0

Подробнее
13 мая 2025
Погрузитесь в продвинутый Computer Vision
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Март 2025 • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Июнь 2025 • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Июль 2025 • 3 месяца
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания • 3 месяца
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Июнь 2025 • 4 месяца

CV Rocket 2.0

Подробнее
13 мая 2025

Телеграм-канал
DeepSchool

Короткие посты по теории ML/DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе