Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Generative Computer Vision

.
Gen CV
Освойте теорию генеративных моделей и их обучение на практике

Курс для тех, кто уже работает в индустрии и хочет

Повысить ценность на рынке

Решать интересные задачи

Собеседоваться в генеративные команды

Успевать за индустрией

cможете работать в разных рынках, компаниях и командах
сможете работать в новой развивающейся области Computer Vision
разберётесь в теории и научитесь решать популярные задачи
узнаете, как работают SOTA решения и как ещё их можно применять
Super-Resolution, Text2Image, Image inpainting, Virtual try-on

Решать различные генеративные задачи

Чему вы научитесь

Обучать свои генеративные модели,
понимая, как они устроены

Обучать и тюнить собственные модели

Узнаете различные методы файн-тюнинга и добавления новых кондишенов: Textual Inversion, Dreambooth, Lora, ControlNet, IP-Adapter
Познакомитесь со множеством реализаций, методов и репозиториев вокруг SD

Работать с экосистемой Stable Diffusion

Разберётесь в теории генеративных моделей

От автокодировщиков и ганов до диффузионных моделей

Как именно вы освоите каждый навык

Лекции в записи на платформе — можно смотреть в удобное время, ставить на паузу и пересматривать

Изучите теорию из лекции

1.

1/3
2/3
После каждой лекции — домашнее задание для закрепления материала

Сделаете практическое задание

2.

3/3
Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

Получите разбор домашнего задания

3.

Программа

Программа рассчитана на 12 недель, ей нужно будет посвящать в среднем 8−12 часов в неделю
12
недель
11
лекций
8-12
часов в неделю

1. Введение в генеративный CV, VAE: часть 1

Темы лекции:
  • Таймлайн развития генеративных моделей
  • Примеры применения генеративных моделей
  • Общий фреймворк и семейство генеративных моделей: постановка задачи, зачем её решать, дивергенция, правдоподобия
  • AE → VAE → VQ-VAE
На практике:
  • Имплементировать и обучить VAE и VQ-VAE

2. VAE: часть 2

Темы лекции:
  • VQ-VAE-2
  • Инференс авторегрессионой моделью
  • Гумбель софтмакс
  • dVAE → DALLE-1
На практике:
  • Имплементировать и обучить dVAE
  • Обучить авторегрессионную модель для инференса

3. Основы GAN и разбор архитектур

Темы лекции:
  • Всё про GANы
  • Метрики: FID, SSIM, PSNR, Perceptual loss, LPIPS
  • Задача Super-Resolution: esrgan, real-esrgan
  • VQ-GAN → codeformer
На практике:
  • Имплементировать метрики PSNR, SSIM, LPIPS, FID
  • Обучить GAN для генерации на датасете лиц и для Super-Resolution

4. Введение в StyleGAN

Темы лекции:
  • Трюки в обучении GAN’ов
  • От ProGAN к StyleGAN2/StyleGAN2-Ada — краткий разбор архитектур
  • StyleGAN3
На практике:
  • Реализовать поиск интерпретируемых направлений в латентном пространстве StyleGAN2

5. Экосистема StyleGAN

Темы лекции:
  • Экосистема StyleGAN2
  • Кодирование лица, латентные пространства, манипуляции латентами в StyleGAN2
На практике:
  • Имплементировать и обучить метод кодирования в латентное пространство StyleGAN2

6. Теория диффузионных моделей

Темы лекции:
  • DDPM
  • DDIM
На практике:
  • Имплементировать и обучить диффузию на MNIST
  • Реализовать DDIM метод сэмплирования на инференсе

7. Применение диффузионных моделей и архитектуры

Темы лекции:
  • Conditional generation, classifier/classifier-free/attention guidance
  • Super-Resolution, inpaint, text2image
  • DALLE-2, cascade diffusion (Imagen), latent diffusion (stable diffusion)
На практике:
  • Имплементировать метод ускорения диффузии
  • Имплементировать различные методы guidance’а в сочетании с inpaint

8. Ускорение диффузии

Темы лекции:
  • Латентная диффузия
  • Генеративная трилемма
  • Диффузионный GAN
  • Дистилляция диффузии
На практике:
  • Реализовать метод ускорение диффузии DeepCache
  • Применения методов ускорения диффузии c помощью Diffusers

9. Stable diffusion

Темы лекции:
  • Общая архитектура Stable Diffusion
  • Различные версии Stable Diffusion
  • Экосистема Stable Diffusion
  • Имплементации Stable Diffusion
На практике:
  • Протестировать методы добавления контроля через Diffusers
  • Обучить один из методов файн-тюна Stable Diffusion
  • Методы файн-тюна Stable Diffusion (hypernetworks, textual inversion, dreambooth, loras)
  • Методы добавления контроля (ControlNet / IP-Adapter)

10. Видео диффузия

Темы лекции:
  • Проблемы видео и прошлые модели: Temporal Gans, Vae+transformers
  • Видео диффузия: основная идея, MagicVideo, Imagen, Sora
  • Файн-тюнинг text2image моделей: Make-a-video, Tune-a-video, Gen-1, AnimateDiff, Text2Video-Zero, ControlVideo

11. Virtual try-on

Темы лекции:
  • Способы решения задачи виртуальной примерки одежды: 3D, GAN и diffusion
  • State-of-the-art качество и текущие ограничения
На практике:
  • Запустить часть обсуждённых моделей и сравнить их между собой на новых данных

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах
Кирам Аль-Харба
Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии
Александр Ковальчук
Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей
Prequel
ZERO10
Илья Захаркин
Реализует 3D алгоритмы и обучает генеративные нейросети в примерке одежды. Расскажет про диффузионные модели для этой задачи
AIRI
Нина Коновалова
Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах
CompVis group LMU
Ольга Гребенькова
Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии
ZERO10
Илья Захаркин
Реализует 3D алгоритмы и обучает генеративные нейросети. Расскажет про диффузионные модели для виртуальной примерки одежды
Prequel
Александр Ковальчук
Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей
Кирам Аль-Харба
Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии
CompVis group LMU
Ольга Гребенькова
Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии
AIRI
Нина Коновалова
Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах

«C обратной связью»

Тариф с обратной связью по решению домашних заданий
Онлайн лекции
Что входит в курс:
57 000 ₽
5 260 ₽ / мес
Практические задания
11 лекций

«Я сам»

Для тех, кто хочет познакомиться
с фундаментом генеративного CV
Записи лекций
Что входит в курс:
45 000 ₽
4 150 ₽ / мес
Практические задания
11 лекций

Купить записи предыдущего потока

Проверка заданий от спикеров
Проверка заданий от спикеров

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение
Мария Старцева
«Воспользовалась на работе некоторыми идеями и мне очень пригодился код для построения рабочих пайплайнов»
«Хочу сказать, что это, пожалуй, лучший курс по ML, который я проходила (а у меня достаточно лет опыта в ML)»
Галина Альперович
«Курс оказался крайне полезным. Благодаря лекторам, тьюторам и создателям программы, я смог углубить свои знания»
Арсений Рылов
Ольга Чаганова
«После обучения стала ощущать себя намного увереннее, многие вещи стали понятнее, осталось только углублять знания»
(CV Rocket)
(3DCV)
(CV Rocket)
(CV Rocket)
«Курс максимально полезный лично для меня, систематизирует знания, не оставляет пробелов»
Дмитрий
(3DCV)
Александр
LinkedIn
«На собеседовании за счет того, что подчерпнул на курсе об устройстве OCR, вытянул»
(CV Rocket)

FAQs

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?
Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru

На сколько часов рассчитана программа?

На сколько
часов рассчитана программа?
20 астрономических часов на лекции и ~30 часов практики или примерно 8 часов в неделю, что позволяет комфортно встроить обучение в рабочий график

Что я должен знать, чтобы начать обучение?

Основы Deep Learning и Computer Vision. Мы предполагаем, что вы уже знаете теорию нейросетей и решали задачи из области компьютерного зрения. Если вы сомневаетесь, подходит ли курс именно вам, напишите нам в телеграм Спросить в ТГ

Телеграм-канал
DeepSchool

Короткие посты по теории ML/DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе