Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Курс CV Rocket

Скидка 15% до 31 октября
Cтарт — {{start_date}}
Продолжительность — 4 месяца
Погрузитесь в продвинутый Computer Vision: от сложностей и корнер-кейсов в «обычных» задачах до мультимодальных моделей и дизайна CV-систем

Курс подойдёт CV-инженерам всех грейдов

Junior

Middle

Senior

узнаете теорию и закрепите на практике
систематизируете знания и закроете пробелы
подсмотрите на практики других команд
Важно знать основы DL и работать с Python и PyTorch
1. Математика для ML и основы DL
Необходимо знать, что такое производная, матричное умножение, скалярное произведение, градиентный спуск, дифференцируемость, как работают оптимизаторы SGD/Adam, что такое кроссэнтропийная функция потерь
Будем писать функции и классы. Домашние задания будут на PyTorch, OpenCV, NumPy. Часть из них будет в py-скриптах
2. Базовое знание Python и PyTorch
Будем разбирать последние подходы в CV и сложные задачи, поэтому необходимо знать про работу свёртки и о других базовых понятиях
3. Опыт в Computer Vision
4. Навыки работы с данными
Нужно иметь опыт с данными: предобработка, визуализация, анализ

Программа

Лекция каждую неделю. После каждой темы — домашнее задание с фидбеком от лектора. Раз в 4−5 недель — Q&A-сессия для разбора вопросов и перерыв на каникулы.
4 месяца
13 лекций
13 заданий с фидбеком от преподавателей

01. Подготовка данных

Разберём основные источники открытых данных: научимся находить и курировать датасеты. Обсудим инструменты для inhouse-разметки и формирование ТЗ, а также внедрение авторазметки
  • Data-Centric AI — новый фокус в машинном обучении
  • Где все берут данные? Как собирать данные из интернета: веб-скрапинг
  • Разметка данных и инструменты для аннотации (Label Studio, CVAT)
Основные темы:
  • Когда данных нет — создаём сами: синтетические данные и диффузионные модели

02. Получение качественных данных

Научимся не просто собирать данные, а проектировать процесс их получения и поддерживать качество на всех этапах — от сбора до инференса
  • Активное обучение для эффективного использования разметки
  • Оценка и улучшение качества разметки: перекрёстная проверка, foundation-модели
  • Мониторинг данных в продакшене и обнаружение сдвигов распределения
  • Как проектировать сбор данных под задачу: сенсоры, триггеры, хранение
Основные темы:

03. Секреты успешных архитектур

Разберём устройство современных нейросетей: от свёрточных блоков до трансформеров и адаптивных голов
  • Адаптация больших моделей: LoRA, ControlNet, IP-Adapter
  • Эволюция архитектур: от ResNet к EfficientNet и Vision Transformers
  • Почему BatchNorm не всегда работает и какие есть альтернативы
  • Структура нейросети: feature extractor, neck, head
Основные темы:

04. Обучение метрики и быстрый векторный поиск

Научимся обучать модели, которые создают осмысленные векторные представления, и эффективно искать по ним в больших базах
  • Оценка качества: Precision@K, Recall@K, Closed vs Open set
  • Быстрый поиск: FAISS, Navigable Small Worlds, хэширование
  • Angular Loss и ArcFace для улучшения качества эмбеддингов
  • Metric Learning: обучение расстояний через contrastive и triplet loss
Основные темы:

05. Мультимодальные модели

Познакомимся с моделями, объединяющими зрение и язык: от CLIP до современных VLM и retrieval-систем
  • Выбор размерности эмбеддингов: Matryoshka Representation Learning
  • Как обучать мультимодальные модели на парах «изображение–текст»
  • Принцип работы CLIP и его модификаций (SigLIP, BLIP)
Основные темы:

06. Детекция объектов

Разберём эволюцию детекторов: от якорных моделей до трансформеров и openset-подходов
  • Openset-детекция с помощью foundation-моделей (Florence, GLEE)
  • DETR и гибридные архитектуры на основе трансформеров
  • Anchor-free подходы: CenterNet, YOLO11
  • One-stage vs two-stage детекторы: SSD, RetinaNet, Faster R-CNN
Основные темы:

07. Сегментация

Изучим методы сегментации: от классических U-Net до современных foundation-моделей и работы с высоким разрешением
  • Foundation-модели: Segment Anything (SAM) и промптинг
  • Работа с high-res изображениями и проблемными масками
  • Архитектуры: U-Net, Mask R-CNN, Mask2Former
  • Типы сегментации: семантическая, instance, panoptic
Основные темы:

08. Optical Character Recognition (OCR)

Разберём современные подходы к распознаванию текста: от классических пайплайнов до мультимодальных VLM
  • Выбор стратегии OCR в зависимости от задачи и данных
  • Современные VLM для OCR: PaliGemma, Qwen-VL, DocVLM
  • OCR-пайплайн: детекция + распознавание (FAST, CRNN, CTC)
Основные темы:

09. Поиск ошибок и интерпретируемость моделей

Научимся отлаживать обучение, находить аномалии и понимать, почему модель принимает те или иные решения
  • Интерпретация через attention, Grad-CAM, LIME, ProtoNets
  • Мониторинг активаций и выходов модели в продакшене
  • Поиск аномалий: Normalizing Flows, contrastive подходы
  • Диагностика проблем обучения: NaN, переобучение, плато
Основные темы:

10. Self-supervised Learning

Освоим методы обучения без разметки: от pretext-задач до современных SSL-алгоритмов вроде BYOL
  • Практические рекомендации: аугментации, batch size, linear evaluation
  • BYOL: архитектура, EMA, projector/predictor
  • Pretext-задачи: восстановление, контекст, инвариантность
  • Зачем нужен SSL и когда он лучше transfer learning
Основные темы:

11. Работа с видео

Изучим особенности видеоданных и архитектуры для их обработки: от 3D-CNN до VideoMAE и трансформеров
  • Fusion-стратегии для учёта времени
  • Foundation-модели для видео и их дообучение
  • Архитектуры: 3D CNN, R(2+1)D, ViViT, VideoMAE
  • Структура видео: кодеки, FPS, битрейт, I/P-кадры
Основные темы:

12. Задачи на видео

Погрузимся в прикладные задачи: трекинг, action recognition и multimodal-анализ
  • Метрики качества: HOTA, DetA, AssA
  • Action Recognition: от кадров до позы и аудио
  • Трекинг: SORT, Kalman Filter, матчинг, Re-ID
Основные темы:

13. Дизайн ML-систем

Научимся проектировать ML-решения как продукты: от формулировки проблемы до выбора метрик и гипотез
  • Построение дерева гипотез и метрик для принятия решений
  • Функциональные и нефункциональные требования к системе
  • Различие между проектом и продуктом в ML
Основные темы:

Как именно вы освоите каждый навык

Онлайн-лекции, где можно задавать вопросы, обсуждать сложные кейсы и дискутировать. В конце — анонимный тест для закрепления материала

01. Изучите теорию на zoom-лекции

1/5
2/5
После каждой темы — домашнее задание. По окончании обучения вы сделаете проект, который можно с гордостью показать коллегам

02. Сделаете практическое задание

3/5
Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

03. Получите разбор домашнего задания

4/5
Обсуждайте домашние задания, рабочие задачи или просто общайтесь. Кураторы курса всегда помогут решить проблемы и поделятся советом

04. Если возникнут трудности, мы оперативно поможем в чате

5/5
Раз в 4−5 недель спикеры и кураторы собираются в zoom, чтобы ответить на ваши вопросы, помочь с практикой, обсудить задачи

05. Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

Кто будет преподавать

Опытные инженеры будут вести Zoom-лекции и семинары, отвечать на ваши вопросы и ревьюить код
Тимлид команды распознавания лиц. Расскажет как решать metric learning задачи
Андрей Шадриков
Verigram
2GIS
Дмитрий Чудаков
Занимается CV и 3DCV в картах. Расскажет про детекцию и секреты успешных архитектур
НИИАС
Дмитрий Раков
Руководит командой ML, которая занимается разработкой беспилотных поездов в AO НИИАС
Занимается системой анализа видео-контента и генеративными картиночными моделями
Роман Филонов
ВК видео
Лаборатория Искусств и ИИ при Европейском Университете
Анастасия Старобыховская
Руководитель лаборатории. Создает проекты и исследования в области культурного и исторического наследия
Руководит процессами разметки медицинских данных и построения аналитики, улучшает пайплайны данных для подсчёта бизнес-метрик
Дарья Воронкина
Onecell
Тимлид CV в задачах real-time видеоаналитики. Расскажет про задачу трекинга: как подобрать модель под конкретную задачу
Илья Башаров
Sber
Wildberries
Глеб Рязанцев
Senior computer vision engineer. Работает в команде Поиска по фото
Руководит CV-направлением, проектирует системы в металлургии в НЛМК-IT
Виталий Угнивенко
НЛМК-IT
Специалист по машинному обучению, специализируется на компьютерном зрении и OCR задачах. Ранее — выпускник и преподаватель по ML в МФТИ.
Сейчас тренирует в Яндексе Vision Language Models читать и понимать текст на картинках.
Борис Зимка
Яндекс
verigram.ai
Андрей Шадриков
Тимлид команды распознавания лиц. Расскажет как решать metric learning задачи
2GIS
Дмитрий Чудаков
Занимается CV и 3DCV в картах. Расскажет про детекцию и секреты успешных архитектур
НИИАС
Дмитрий Раков
Работает над беспилотными поездами. Расскажет о трансформерах
ВК видео
Роман Филонов

Занимается системой анализа видео-контента и генеративными картиночными моделями
Анастасия Старобыховская
Лаборатория Искусств и ИИ при Европейском Университете
Должность: руководитель лаборатории. Деятельность: создание проектов и исследований в области культурного и исторического наследия
Onecell
Дарья Воронкина
Руководит процессами разметки медицинских данных и построения аналитики, улучшает пайплайны данных для подсчёта бизнес-метрик
Sber
Илья Башаров
Тимлид CV в задачах real-time видеоаналитики. Расскажет про задачу трекинга: как подобрать модель под конкретную задачу
Виталий Угнивенко
НЛМК-IT
Руководит CV-направлением, проектирует системы в металлургии в НЛМК-IT
Wildberries
Глеб Рязанцев
Senior computer vision engineer. Работает в команде Поиска по фото
Яндекс
Борис Зимка
Специалист по машинному обучению, специализируется на компьютерном зрении и OCR задачах. Ранее — выпускник и преподаватель по ML в МФТИ. Сейчас тренирует в Яндексе Vision Language Models читать и понимать текст на картинках.

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий
Налоговый вычет
получите 13% от стоимости курса после обучения
Оплата из-за рубежа
картой иностранного банка или другими удобными способами
Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты
Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Запишитесь в лист ожидания

Старт — {{start_date}}. Мы свяжемся, когда начнем собирать группу, расскажем о тарифах и подарим скидки на обучение первым участникам

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение
«Акцент на практическое применение — теперь есть четкое представление, как использовать подходы в своих разработках.»
Анна Степанова
(CV Rocket)
«Очень хорошо выстроены лекции. Всё вместе это дало некоторую интуицию, как решать задачи в этих областях»
Наталья Ковальчук
(CV Rocket)
(CV Rocket)
«Много практических примеров. Отличные домашние задания! Очень опытные лекторы с интересными историями из практики!»
Гузель Фейзханова
Дмитрий Сазыкин
«Благодарность лекторам за качественный подготовленный материал!»
(CV Rocket)
«Очень много идей взяла в рабочие проекты, прокачиваешься действительно хорошо»
Артур Дудник
«Курс превзошёл ожидания. Отличный набор практических навыков. Домашки хорошо подобраны. Спасибо! Вы супер!»
(CV Rocket)
Ирина Васендина
(CV Rocket)
LinkedIn
(CV Rocket)
LinkedIn
Александр Петров
«На собеседовании за счет того, что подчерпнул на курсе об устройстве OCR, вытянул»
«Курс плотный по занятиям и ДЗ, много заинтересованных преподавателей. ДЗ интересные и полезные»
Игорь Наумов
LinkedIn
(CV Rocket)
(CV Rocket)
Антон Дмитриев
«Углубил уже имеющиеся и получил новые знания. Потихоньку перетаскиваю в работу»
Артём Соломко
LinkedIn
«Был удивлен подробным код ревью домашних заданий, с объяснениями почему, при этом быстро»
«Хочу сказать, что это, пожалуй, лучший курс по ML, который я проходила (а у меня достаточно лет опыта в ML)»
Галина Альперович
(CV Rocket)
(CV Rocket)
«Из каждой лекции/семинара сделал себе список для возможного применения на работе»
Алексей Гаврилов
(CV Rocket)
«Акцент на практическое применение — теперь есть четкое представление, как использовать подходы в своих разработках.»
Анна Степанова
(CV Rocket)
«Очень хорошо выстроены лекции. Всё вместе это дало некоторую интуицию, как решать задачи в этих областях»
Наталья Ковальчук
(CV Rocket)
(CV Rocket)
«Много практических примеров. Отличные д/з! Очень опытные лекторы с интересными историями из практики!»
Гузель Фейзханова
Дмитрий Сазыкин
«Благодарность лекторам за качественный подготовленный материал!»
(CV Rocket)
«Очень много идей взяла в рабочие проекты, прокачиваешься действительно хорошо»
Артур Дудник
«Курс превзошёл ожидания. Отличный набор практических навыков. Домашки хорошо подобраны. Спасибо! Вы супер!»
(CV Rocket)
Ирина Васендина
LinkedIn
(CV Rocket)
(CV Rocket)
LinkedIn
Александр Петров
«На собеседовании за счет того, что подчерпнул на курсе об устройстве OCR, вытянул»
«Курс плотный по занятиям и ДЗ, много заинтересованных преподавателей. ДЗ интересные и полезные»
Игорь Наумов
LinkedIn
(CV Rocket)
(CV Rocket)
Антон Дмитриев
«Углубил уже имеющиеся и получил новые знания. Потихоньку перетаскиваю в работу»
«Был удивлен подробным код ревью домашних заданий, с объяснениями почему, при этом быстро»
Артём Соломко
LinkedIn
(CV Rocket)
(CV Rocket)
Галина Альперович
«Хочу сказать, что это, пожалуй, лучший курс по ML, который я проходила (а у меня достаточно лет опыта в ML)»
«Из каждой лекции/семинара сделал себе список для возможного применения на работе»
Алексей Гаврилов
LinkedIn
(CV Rocket)

FAQs

Когда проходят лекции и Q&A-сессии?

Лекции проходят по будням в 19:00 по московскому времени и длятся 1,5−2 часа. Q&A-сессии проходят после каждой 5-й лекции, время определяется индивидуально для каждого потока.

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?
Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru
Скидки не распространяются на оплату курса юр. лицами, поэтому при заполнении заявки указывайте полную стоимость.

Если у вас остались вопросы по курсу, напишите нам в Telegram

Наши программы

Поможем освоить востребованные на рынке знания, передав секреты и опыт практикующих инженеров и исследователей
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

{{start_date:deploy}} • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

{{start_date:speedup}} • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

{{start_date:3dcv}} • 3 месяца
Подробнее
Подробнее
Подробнее
/
Погрузитесь в продвинутый Computer Vision
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

{{start_date:gencv}} • 3 месяца
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
/
Подробнее
{{start_date:llm}} • 4 месяца

CV Rocket 2.0

Подробнее
{{start_date:cvrocket}}
Погрузитесь в продвинутый Computer Vision
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

{{start_date:deploy}} • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

{{start_date:speedup}} • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

{{start_date:3dcv}}
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

{{start_date:gencv}}
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
{{start_date:llm}} • 4 месяца

CV Rocket 2.0

Подробнее
{{start_date:cvrocket}}

Телеграм-канал
DeepSchool

Короткие посты по теории ML/DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе