Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Generative Computer Vision

.
Gen CV
Освойте теорию генеративных моделей и их обучение на практике

Курс для тех, кто уже работает в индустрии и хочет

Повысить ценность на рынке

Решать интересные задачи

Собеседоваться в генеративные команды

Успевать за индустрией

cможете работать в разных рынках, компаниях и командах
сможете работать в новой развивающейся области Computer Vision
разберётесь в теории и научитесь решать популярные задачи
узнаете, как работают SOTA решения и как ещё их можно применять
Super-Resolution, Text2Image, Image inpainting, Virtual try-on

Решать различные генеративные задачи

Чему вы научитесь

Обучать свои генеративные модели,
понимая, как они устроены

Обучать и тюнить собственные модели

Узнаете различные методы файн-тюнинга и добавления новых кондишенов: Textual Inversion, Dreambooth, Lora, ControlNet, IP-Adapter
Познакомитесь со множеством реализаций, методов и репозиториев вокруг SD

Работать с экосистемой Stable Diffusion

Разберётесь в теории генеративных моделей

От автокодировщиков и ганов до диффузионных моделей

Как именно вы освоите каждый навык

Лекции в записи на платформе — можно смотреть в удобное время, ставить на паузу и пересматривать

Изучите теорию из лекции

1.

1/3
2/3
После каждой лекции — домашнее задание для закрепления материала

Сделаете практическое задание

2.

3/3
Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

Получите разбор домашнего задания

3.

Программа

Программа рассчитана на 12 недель, ей нужно будет посвящать в среднем 8−12 часов в неделю
12
недель
11
лекций
8-12
часов в неделю

1. Введение в генеративный CV, VAE: часть 1

Темы лекции:
  • Таймлайн развития генеративных моделей
  • Примеры применения генеративных моделей
  • Общий фреймворк и семейство генеративных моделей: постановка задачи, зачем её решать, дивергенция, правдоподобия
  • AE → VAE → VQ-VAE
На практике:
  • Имплементировать и обучить VAE и VQ-VAE

2. VAE: часть 2

Темы лекции:
  • VQ-VAE-2
  • Инференс авторегрессионой моделью
  • Гумбель софтмакс
  • dVAE → DALLE-1
На практике:
  • Имплементировать и обучить dVAE
  • Обучить авторегрессионную модель для инференса

3. Основы GAN и разбор архитектур

Темы лекции:
  • Всё про GANы
  • Метрики: FID, SSIM, PSNR, Perceptual loss, LPIPS
  • Задача Super-Resolution: esrgan, real-esrgan
  • VQ-GAN → codeformer
На практике:
  • Имплементировать метрики PSNR, SSIM, LPIPS, FID
  • Обучить GAN для генерации на датасете лиц и для Super-Resolution

4. Введение в StyleGAN

Темы лекции:
  • Трюки в обучении GAN’ов
  • От ProGAN к StyleGAN2/StyleGAN2-Ada — краткий разбор архитектур
  • StyleGAN3
На практике:
  • Реализовать поиск интерпретируемых направлений в латентном пространстве StyleGAN2

5. Экосистема StyleGAN

Темы лекции:
  • Экосистема StyleGAN2
  • Кодирование лица, латентные пространства, манипуляции латентами в StyleGAN2
На практике:
  • Имплементировать и обучить метод кодирования в латентное пространство StyleGAN2

6. Теория диффузионных моделей

Темы лекции:
  • DDPM
  • DDIM
На практике:
  • Имплементировать и обучить диффузию на MNIST
  • Реализовать DDIM метод сэмплирования на инференсе

7. Применение диффузионных моделей и архитектуры

Темы лекции:
  • Conditional generation, classifier/classifier-free/attention guidance
  • Super-Resolution, inpaint, text2image
  • DALLE-2, cascade diffusion (Imagen), latent diffusion (stable diffusion)
На практике:
  • Имплементировать метод ускорения диффузии
  • Имплементировать различные методы guidance’а в сочетании с inpaint

8. Ускорение диффузии

Темы лекции:
  • Латентная диффузия
  • Генеративная трилемма
  • Диффузионный GAN
  • Дистилляция диффузии
На практике:
  • Реализовать метод ускорение диффузии DeepCache
  • Применения методов ускорения диффузии c помощью Diffusers

9. Stable diffusion

Темы лекции:
  • Общая архитектура Stable Diffusion
  • Различные версии Stable Diffusion
  • Экосистема Stable Diffusion
  • Имплементации Stable Diffusion
На практике:
  • Протестировать методы добавления контроля через Diffusers
  • Обучить один из методов файн-тюна Stable Diffusion
  • Методы файн-тюна Stable Diffusion (hypernetworks, textual inversion, dreambooth, loras)
  • Методы добавления контроля (ControlNet / IP-Adapter)

10. Видео диффузия

Темы лекции:
  • Проблемы видео и прошлые модели: Temporal Gans, Vae+transformers
  • Видео диффузия: основная идея, MagicVideo, Imagen, Sora
  • Файн-тюнинг text2image моделей: Make-a-video, Tune-a-video, Gen-1, AnimateDiff, Text2Video-Zero, ControlVideo

11. Virtual try-on

Темы лекции:
  • Способы решения задачи виртуальной примерки одежды: 3D, GAN и diffusion
  • State-of-the-art качество и текущие ограничения
На практике:
  • Запустить часть обсуждённых моделей и сравнить их между собой на новых данных

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах
Кирам Аль-Харба
Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии
Александр Ковальчук
Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей
Prequel
ZERO10
Илья Захаркин
Реализует 3D алгоритмы и обучает генеративные нейросети в примерке одежды. Расскажет про диффузионные модели для этой задачи
AIRI
Нина Коновалова
Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах
CompVis group LMU
Ольга Гребенькова
Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии
ZERO10
Илья Захаркин
Реализует 3D алгоритмы и обучает генеративные нейросети. Расскажет про диффузионные модели для виртуальной примерки одежды
Prequel
Александр Ковальчук
Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей
Кирам Аль-Харба
Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии
CompVis group LMU
Ольга Гребенькова
Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии
AIRI
Нина Коновалова
Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий
Налоговый вычет
получите 13% от стоимости курса после обучения
Оплата из-за рубежа
картой иностранного банка или другими удобными способами
Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты
Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Лист ожидания

Запишитесь в лист ожидания. Мы свяжемся, когда начнем собирать группу следующего потока, расскажем о тарифах и подарим скидку на обучение первым участникам.

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение
Мария Старцева
«Воспользовалась на работе некоторыми идеями и мне очень пригодился код для построения рабочих пайплайнов»
(CV Rocket)
«Курс оказался крайне полезным. Благодаря лекторам, тьюторам и создателям программы, я смог углубить свои знания»
Арсений Рылов
(3DCV)
Вячеслав Шульц
«Это уже мой третий курс в DeepSchool, поэтому я знал, что будет качественно. И мои ожидания полностью оправдались»
(GenCV)
«Курс впечатлил наполнением и помог закрыть пробелы изучения генеративного компьютерного зрения»
Алексей Андреев
(GenCV)
«Я давно понимал, что мне будут полезны знания в курсе. Но изучать это самому казалось, будет долго. Курс значительно сократил путь»
Илья Крепкий
(GenCV)
Айдар Валиев
«Удалось расширить кругозор и прокачать навыки. Я стал лучше понимать статьи по теме, участвовать в дискуссиях»
(GenCV)

FAQs

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?
Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru
Скидки не распространяются на оплату курса юр. лицами, поэтому при заполнении заявки указывайте полную стоимость.

На сколько часов рассчитана программа?

На сколько
часов рассчитана программа?
20 астрономических часов на лекции и ~30 часов практики или примерно 8 часов в неделю, что позволяет комфортно встроить обучение в рабочий график

Что я должен знать, чтобы начать обучение?

Основы Deep Learning и Computer Vision. Мы предполагаем, что вы уже знаете теорию нейросетей и решали задачи из области компьютерного зрения. Если вы сомневаетесь, подходит ли курс именно вам, напишите нам в телеграм Спросить в ТГ

Если у вас остались вопросы по курсу, напишите нам в Telegram

Наши программы

Поможем освоить востребованные на рынке знания, передав секреты и опыт практикующих инженеров и исследователей
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Март 2025 • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Июнь 2025 • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Июль 2025 • 3 месяца
Подробнее
Подробнее
Подробнее
/
Погрузитесь в продвинутый Computer Vision
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания • 3 месяца
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
/
Подробнее
Июнь 2025 • 4 месяца

CV Rocket 2.0

Подробнее
13 мая 2025
Погрузитесь в продвинутый Computer Vision
Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Март 2025 • 4 месяца
Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Июнь 2025 • 3 месяца
Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Июль 2025 • 3 месяца
Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания • 3 месяца
Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее
Подробнее
Подробнее
Подробнее
Подробнее
Июнь 2025 • 4 месяца

CV Rocket 2.0

Подробнее
13 мая 2025

Телеграм-канал
DeepSchool

Короткие посты по теории ML/DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе