Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Телеграм-канал DeepSchool

Generative Computer Vision

.

Gen CV

Освойте теорию генеративных моделей и их обучение на практике

Курс для тех, кто уже работает в индустрии и хочет

Повысить ценность на рынке

Решать интересные задачи

Собеседоваться в генеративные команды

Успевать за индустрией

cможете работать в разных рынках, компаниях и командах

сможете работать в новой развивающейся области Computer Vision

разберётесь в теории и научитесь решать популярные задачи

узнаете, как работают SOTA решения и как ещё их можно применять

Super-Resolution, Text2Image, Image inpainting, Virtual try-on

Решать различные генеративные задачи

Чему вы научитесь

Обучать свои генеративные модели,
понимая, как они устроены

Обучать и тюнить собственные модели

Узнаете различные методы файн-тюнинга и добавления новых кондишенов: Textual Inversion, Dreambooth, Lora, ControlNet, IP-Adapter

Познакомитесь со множеством реализаций, методов и репозиториев вокруг SD

Работать с экосистемой Stable Diffusion

Разберётесь в теории генеративных моделей

От автокодировщиков и ганов до диффузионных моделей

Как именно вы освоите каждый навык

Лекции в записи на платформе — можно смотреть в удобное время, ставить на паузу и пересматривать

Изучите теорию из лекции

1.

1/3

←

→

2/3

←

→

После каждой лекции — домашнее задание для закрепления материала

Сделаете практическое задание

2.

3/3

←

→

Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

Получите разбор домашнего задания

3.

Программа

Программа рассчитана на 12 недель, ей нужно будет посвящать в среднем 8−12 часов в неделю

12

недель

11

лекций

8-12

часов в неделю

1. Введение в генеративный CV, VAE: часть 1

Темы лекции:

Таймлайн развития генеративных моделей

Примеры применения генеративных моделей

Общий фреймворк и семейство генеративных моделей: постановка задачи, зачем её решать, дивергенция, правдоподобия

AE → VAE → VQ-VAE

На практике:

Имплементировать и обучить VAE и VQ-VAE

2. VAE: часть 2

Темы лекции:

VQ-VAE-2

Инференс авторегрессионой моделью

Гумбель софтмакс

dVAE → DALLE-1

На практике:

Имплементировать и обучить dVAE

Обучить авторегрессионную модель для инференса

3. Основы GAN и разбор архитектур

Темы лекции:

Всё про GANы

Метрики: FID, SSIM, PSNR, Perceptual loss, LPIPS

Задача Super-Resolution: esrgan, real-esrgan

VQ-GAN → codeformer

На практике:

Имплементировать метрики PSNR, SSIM, LPIPS, FID

Обучить GAN для генерации на датасете лиц и для Super-Resolution

4. Введение в StyleGAN

Темы лекции:

Трюки в обучении GAN’ов

От ProGAN к StyleGAN2/StyleGAN2-Ada — краткий разбор архитектур

StyleGAN3

На практике:

Реализовать поиск интерпретируемых направлений в латентном пространстве StyleGAN2

5. Экосистема StyleGAN

Темы лекции:

Экосистема StyleGAN2

Кодирование лица, латентные пространства, манипуляции латентами в StyleGAN2

На практике:

Имплементировать и обучить метод кодирования в латентное пространство StyleGAN2

6. Теория диффузионных моделей

Темы лекции:

DDPM

DDIM

На практике:

Имплементировать и обучить диффузию на MNIST

Реализовать DDIM метод сэмплирования на инференсе

7. Применение диффузионных моделей и архитектуры

Темы лекции:

Conditional generation, classifier/classifier-free/attention guidance

Super-Resolution, inpaint, text2image

DALLE-2, cascade diffusion (Imagen), latent diffusion (stable diffusion)

На практике:

Имплементировать метод ускорения диффузии

Имплементировать различные методы guidance’а в сочетании с inpaint

8. Ускорение диффузии

Темы лекции:

Латентная диффузия

Генеративная трилемма

Диффузионный GAN

Дистилляция диффузии

На практике:

Реализовать метод ускорение диффузии DeepCache

Применения методов ускорения диффузии c помощью Diffusers

9. Stable diffusion

Темы лекции:

Общая архитектура Stable Diffusion

Различные версии Stable Diffusion

Экосистема Stable Diffusion

Имплементации Stable Diffusion

На практике:

Протестировать методы добавления контроля через Diffusers

Обучить один из методов файн-тюна Stable Diffusion

Методы файн-тюна Stable Diffusion (hypernetworks, textual inversion, dreambooth, loras)

Методы добавления контроля (ControlNet / IP-Adapter)

10. Видео диффузия

Темы лекции:

Проблемы видео и прошлые модели: Temporal Gans, Vae+transformers

Видео диффузия: основная идея, MagicVideo, Imagen, Sora

Файн-тюнинг text2image моделей: Make-a-video, Tune-a-video, Gen-1, AnimateDiff, Text2Video-Zero, ControlVideo

11. Virtual try-on

Темы лекции:

Способы решения задачи виртуальной примерки одежды: 3D, GAN и diffusion

State-of-the-art качество и текущие ограничения

На практике:

Запустить часть обсуждённых моделей и сравнить их между собой на новых данных

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах

Кирам Аль-Харба

Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии

Александр Ковальчук

Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей

Prequel

ZERO10

Илья Захаркин

Реализует 3D алгоритмы и обучает генеративные нейросети в примерке одежды. Расскажет про диффузионные модели для этой задачи

AIRI

Нина Коновалова

Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах

CompVis group LMU

Ольга Гребенькова

Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии

ZERO10

Илья Захаркин

Реализует 3D алгоритмы и обучает генеративные нейросети. Расскажет про диффузионные модели для виртуальной примерки одежды

Prequel

Александр Ковальчук

Разрабатывает генеративные пайплайны. Расскажет про построение и применение состязательных и диффузионных сетей

Кирам Аль-Харба

Генерирует людей для фэшн индустрии, объяснит, как работают GAN и диффузии

CompVis group LMU

Ольга Гребенькова

Разрабатывает алгоритмы применения генеративных моделей к 3D данным. Расскажет об ускорении диффузионных моделей и видео диффузии

AIRI

Нина Коновалова

Занимается генеративными походами в задачах 3D. Расскажет об основах GAN и архитектурах

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий

Налоговый вычет
получите 13% от стоимости курса после обучения

Оплата из-за рубежа
картой иностранного банка или другими удобными способами

Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты

Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Лист ожидания

Запишитесь в лист ожидания. Мы свяжемся, когда начнем собирать группу следующего потока, расскажем о тарифах и подарим скидку на обучение первым участникам.

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение

Мария Старцева

«Воспользовалась на работе некоторыми идеями и мне очень пригодился код для построения рабочих пайплайнов»

Читать отзыв полностью

(CV Rocket)

«Курс оказался крайне полезным. Благодаря лекторам, тьюторам и создателям программы, я смог углубить свои знания»

Арсений Рылов

Читать отзыв полностью

(3DCV)

Вячеслав Шульц

«Это уже мой третий курс в DeepSchool, поэтому я знал, что будет качественно. И мои ожидания полностью оправдались»

Читать отзыв полностью

(GenCV)

«Курс впечатлил наполнением и помог закрыть пробелы изучения генеративного компьютерного зрения»

Алексей Андреев

Читать отзыв полностью

(GenCV)

«Я давно понимал, что мне будут полезны знания в курсе. Но изучать это самому казалось, будет долго. Курс значительно сократил путь»

Илья Крепкий

Читать отзыв полностью

(GenCV)

Айдар Валиев

«Удалось расширить кругозор и прокачать навыки. Я стал лучше понимать статьи по теме, участвовать в дискуссиях»

Читать отзыв полностью

(GenCV)

FAQs

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?

Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru
Скидки не распространяются на оплату курса юр. лицами, поэтому при заполнении заявки указывайте полную стоимость.

На сколько часов рассчитана программа?

На сколько
часов рассчитана программа?

20 астрономических часов на лекции и ~30 часов практики или примерно 8 часов в неделю, что позволяет комфортно встроить обучение в рабочий график

Что я должен знать, чтобы начать обучение?

Основы Deep Learning и Computer Vision. Мы предполагаем, что вы уже знаете теорию нейросетей и решали задачи из области компьютерного зрения. Если вы сомневаетесь, подходит ли курс именно вам, напишите нам в телеграм Спросить в ТГ

Присоединиться