Телеграм-канал DS

Меню

Программа

Стоимость

Преподаватели

Главная

Вопросы

Отзывы

Объясним теорию, расскажем про основные сложности и поможем отточить знания на практике

Ускорение нейросетей

Старт — осенью 2025

Научитесь решать задачи эффективно

Курс для тех, кто уже работает в индустрии и хочет

Разобраться в теории

Освоить фреймворки

Поднять скиллы

Перенять опыт

Чтобы понимать, как работает каждый метод ускорения сетей

И оптимальным образом ускорять модели под каждый вычислитель

Освоить востребованный навык, чтобы поднять свою ценность

Узнать про все сложности от экспертов области

Узнаете, как устроен каждый алгоритм: дистилляция, прунинг, квантизация, матричные разложения и NAS

Ускорять инференс нейросетей

Чему вы научитесь

Ускорять инференс за счёт изменения архитектуры и утилизации вычислителя

Совмещать все методы воедино

Сможете комбинировать различные подходы и решать вытекающие трудности

Разберетесь в устройстве CPU, GPU, NPU и научитесь запускать сети на смартфонах и микрокомпьютерах

Запускать инференс на различных устройствах

Сохранять точность при ускорении

Создавать модели с высокой точностью и высоким fps даже на одноплатных компьютерах

Программа

Лекция каждую неделю. После каждой темы — домашнее задание с фидбеком от лектора. Раз в 4−5 недель — Q&A-сессия для разбора вопросов. После каждого блока курса есть перерыв на каникулы.

17

недель

13

лекций

13

заданий с фидбеком от преподавателей

Блок 1. База – 8 лекций

Научитесь ускорять инференс за счёт изменения архитектуры сети. Проведёте нейросеть через прунинг, квантизацию и дистилляцию. А ещё познакомитесь с ускорением сетей на популярных x86 CPU и GPU

1. Distillation

Метод для улучшения точности нейронной сети. При комбинации с другими методами — для ее ускорения

Темы лекции:

Дистилляция и DarkKnowledge

Функции потерь для дистилляции: MSE / KLD / MAE

Дистилляция для ускорения моделей

Дистилляция в классических CV-задачах: classification, detection, identification

На практике:

Научитесь дистиллировать сеть для сегментации людей

3. Low-Precision computing

Квантование нужно для представления нейронной сети через тип данных, меньший исходного. С его помощью она сможет использоваться на устройстве с малыми вычислительными ресурсами

Темы лекции:

8-ми битное квантование

Quantization aware training как способ улучшения качества нейронной сети

Нестандартные типы данных: fp16 / fp8 / bfloat16

На практике:

Научитесь пользоваться фреймворком квантования torch.quantization/qnnpack

Post-Train quantization как способ заквантовать сетку без головной боли

Cовременные методы квантования: HAWQ и HAWQ-v2

2. Pruning

Метод для сокращения вычислительных операций за счет выброса лишних нейронов

Темы лекции:

Критерии прунинга: L1 / L2 / taylor

Структурированный и неструктурированный прунинг

Фундаментальные свойства нейронной сети и lottery ticket hypothesis

На практике:

Научитесь прунить нейронную сеть с фреймворком для структурированного прунинга torch-pruning

8. Инференс на графическом ускорителе. Part 2

Инференс на графическом ускорителе нейронной сети

Темы лекции:

Cuda Event: как работают профилировщики на его основе

Cuda Event: как померить latency отдельных операций на конкретном примере

На практике:

Научитесь применять квантование на TRT

Профайлинг в торче

TensorRT: как посмотреть оптимизированный граф

TensorRT [advanced]: как запретить оптимизировать отдельные операции

7. Инференс на графическом ускорителе. Part 1

Инференс на графическом ускорителе нейронной сети

Темы лекции:

Особенности работы GPU

Принцип работы TensorRT

Понятие CudaGraph

На практике:

Научитесь применять квантование на TRT

6. Инференс на процессоре

Инференс на процессоре для ускорения нейронной сети

Темы лекции:

Базовое устройство процессора

x86 vs ARM: особенности инференса

На практике:

Научитесь пользоваться фреймворком для квантования OpenVINO

5. Эффективные архитектуры

Эффективные архитектуры нейронных сетей для решения самых разных задач

Темы лекции:

Общие эффективные ахитектуры: MobileOne, FastVit

Эффективные архитектуры для детекции, или жизнь без Yolo

Сегментация PIDNet и DDR-Net

Эффективный speech2text

4. NAS

Метод для оптимального подбора архитектуры сети под конкретные задачи

Темы лекции:

Дифференцируемый и недифференцируемый NAS

DARTs как основа всех методов для дифф прунинга

Суперсети и подархитектуры, их связь с прунингом

Способы обучения суперсетей

Zero-shot NAS

Блок 2. LLM – 2 лекции

Познакомитесь с методами ускорения, специфичными для больших языковых моделей

1. Основы ускорения LLM

Основные рабочие лошадки для ускорения LLM'ок

Темы лекции:

MemoryBound вычисления, или как сделать attention быстрее

Особенности квантования LLM

Современные методы и механизмы квантования: QuIP, QuIP#, AQLM

Sparse-перемножение матриц и принцип работы SparseGPT

На практике:

Изучите и сравните современные библиотеки для локального инфренса LLM

2. Специфичные методы ускорения LLM

Дополнительные механизмы ускорения с обзором небольших и крупных языковых моделей

Темы лекции:

Conditional Inference

Speculative decoding

Small Large Language Models

На практике:

Ускорите LLM с помощью этих методов

Современные opensource-фреймворки для ускорения: vLLM, TensorRT-LLM, GGML

Блок 3. Device – 3 лекции

Научитесь запускать нейронные сети на Android, iOS и микрокомпьютерах

CPU. Part 2: ARM + Android

Создание простого приложения на мобильном устройстве с использованием нейросетей и её запуск на конкретном девайсе

Темы лекции:

Особенности ОС Android

Что такое делегаты и какими они бывают

NN-API как основной делегат для запуска

Квантование TFLite

На практике:

Сравните ускорения разных нейронных сетей на мобильном телефоне

CPU. Part 3: ARM + iOS

То же самое, но на iPhone с его фреймворками для запуска

Темы лекции:

Устройство iOS

Фреймворк CoreML

Низкоуровневые фреймворки: Metal, BNNS, Accelerate

На практике:

Создадите свое приложение с ускоренной нейронной сетью

Микроконтроллеры

Одноплатники и их особенности для нейросетей

Темы лекции:

Устройство и ключевые особенности

Производители микрокомпьютеров

Проблемные слои

На практике:

Запустите нейронную сеть на RKNN-фреймворке для rock chip

Использование фреймворка MNN

Квантование в iOS

Общий workflow

Записаться

Как именно вы освоите каждый навык

Онлайн-лекции, где можно задавать вопросы, обсуждать сложные кейсы и дискутировать. В конце — анонимный тест для закрепления материала

Изучите теорию на zoom-лекции

1.

1/5

←

→

2/5

←

→

После каждой лекции — домашнее задание для закрепления материала

Сделаете практическое задание

2.

3/5

←

→

Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

Получите разбор домашнего задания

3.

4/5

←

→

Обсуждайте домашние задания, рабочие задачи или просто общайтесь. Кураторы курса всегда помогут решить проблемы и поделятся советом

Если возникнут трудности, мы оперативно поможем в чате

4.

5/5

←

→

Раз в 4−5 недель спикеры и кураторы собираются в zoom, чтобы ответить на ваши вопросы, помочь с практикой, обсудить задачи

Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

5.

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах

Александр Гончаренко

CTO в стартапе, занимается созданием R&D версий алгоритмов и проверкой первичных гипотез, которые потом допиливаются и идут во фреймворк

enot.ai

Intel

Артур Панюков

Добавляет в NLP фичи в инференс-фреймворк OpenVINO. Расскажет про особенности его работы и запуска сетей на CPU

ИТМО

Илья Ревин

Научит оптимизировать архитектуры нейросетей с помощью тензорной факторизации и аппроксимации

2GIS

Дмитрий Чудаков

Делает PhD по квантованию. Расскажет про Low-Precision computing

TapMobile

Дмитрий Гордин

Работал над видео-режимом в Android приложении Яндекс. Расскажет про работу с Android камерой, подключение OpenCV, инференс нейросетей

SkyEng

Илья Начевский

Занимается разработкой мультимодальных LLM агентов. Расскажет про ускорение LLM

enot.ai

Андрей Щербин

Имеет большой опыт в применении алгоритмов оптимизации к конкретным моделям. Расскажет про алгоритмы прунинга

Тимофей Науменко

Занимается примеркой часов и кроссовок в виртуальной реальности. До этого занимался алгоритмами автоматического поиска архитектур нейронных сетей

wanna.fashion

Prequel

Александр Ковальчук

Запускал генеративные модели на камере iOS устройства. Расскажет о конвертации нейросетей для мобильных устройств с iOS и их запуске через CoreML и TFLite

Игорь Калгин

Главный разработчик фреймворка ЕНОТ, программный архитектор. Поделится практическим опытом работы с TensorRT

enot.ai

Пётр Иванов

Занимается разработкой приложений на EDGE устройствах. Расскажет про эффективные архитектуры нейронных сетей

2GIS

Дмитрий Чудаков

Оптимизирует сети для быстрой работы на Edge устройствах. Научит ускорять сети

Александр Гончаренко

CTO в стартапе, занимается созданием R&D версий алгоритмов и проверкой первичных гипотез, которые потом допиливаются и идут во фреймворк

enot.ai

Intel

Артур Панюков

Добавляет в NLP фичи в инференс-фреймворк OpenVINO. Расскажет про особенности его работы и запуска сетей на CPU

enot.ai

Пётр Иванов

Занимается разработкой приложений на EDGE устройствах. Расскажет про эффективные архитектуры нейронных сетей

Игорь Калгин

Главный разработчик фреймворка ЕНОТ, программный архитектор. Поделится практическим опытом работы с TensorRT

enot.ai

ИТМО

Илья Ревин

Научит оптимизировать архитектуры нейросетей с помощью тензорной факторизации и аппроксимации

enot.ai

Андрей Щербин

Имеет большой опыт в применении алгоритмов оптимизации к конкретным моделям. Расскажет про алгоритмы прунинга

Тимофей Науменко

Занимается примеркой часов и кроссовок в виртуальной реальности. До этого занимался алгоритмами автоматического поиска архитектур нейронных сетей

wanna.fashion

TapMobile

Дмитрий Гордин

Работал над видео-режимом в Android приложении Яндекс. Расскажет про работу с Android камерой, подключение OpenCV, инференс нейросетей

SkyEng

Илья Начевский

Занимается разработкой мультимодальных LLM агентов. Расскажет про ускорение LLM

Александр Ковальчук

Запускал генеративные модели на камере iOS устройства. Расскажет о конвертации нейросетей для мобильных устройств с iOS и их запуске через CoreML и TFLite

Prequel

Что говорят наши выпускники

Истории глазами тех, кто успешно прошёл обучение

Мария Старцева

«Воспользовалась на работе некоторыми идеями и мне очень пригодился код для построения рабочих пайплайнов»

Читать отзыв полностью

«Я был удивлен уровнем сложности и глубины информации, которую я получил на лекциях. Это второй мой курс от этой команды»

Артём Соломко

«Курс оказался крайне полезным. Благодаря лекторам, тьюторам и создателям программы, я смог углубить свои знания»

Арсений Рылов

Читать отзыв полностью

Ольга Чаганова

«После обучения стала ощущать себя намного увереннее, многие вещи стали понятнее, осталось только углублять знания»

Читать отзыв полностью

(Ускорение)

(CV Rocket)

«Курс максимально полезный лично для меня, систематизирует знания, не оставляет пробелов»

Дмитрий

Читать отзыв полностью

(3DCV)

Александр

«На собеседовании за счет того, что подчерпнул на курсе об устройстве OCR, вытянул»

Читать отзыв полностью

(CV Rocket)

Виктор Юдин

«Курс крутой, много полезного узнал. Очень удобно, что по ускорению собрали все вместе, много тем охватили!»

Читать отзыв полностью

«Каждая лекция покрывает объёмный материал и включает практические рекомендации, которые можно применить»

Елизавета Носова

«Курс понравился: первая часть сильно ориентирована на прикладные DS задачи, мне показалась очень полезной»

Иван Петров

Читать отзыв полностью

(Ускорение)

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий

Налоговый вычет
получите 13% от стоимости курса после обучения

Оплата из-за рубежа
картой иностранного банка или другими удобными способами

Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты

Мы обучаем по лицензии Л035-01199-54/00734237 ↗

«База + LLM + Device»

13 лекций

«База + Device»

11 лекций

«База + LLM»

10 лекций

«База»

8 лекций

- Distillation

- Pruning

-

- Low-Precision computing

- NAS

- Эффективные архитектуры

- CPU x86

- GPU: основные методы

- NPU

- Ускорение NLP: осн. методы

- Ускорение NLP: совр. архитектуры

- CPU: ARM + Android

- CPU: ARM + iOS

- Микроконтроллеры

- Distillation

- Pruning

-

- Low-Precision computing

- NAS

- Эффективные архитектуры

- CPU x86

- GPU: основные методы

- NPU

~~- Ускорение NLP: осн. методы~~

~~- Ускорение NLP: совр. архитектуры~~

- CPU: ARM + Android

- CPU: ARM + iOS

- Микроконтроллеры

- Distillation

- Pruning

-

- Low-Precision computing

- NAS

- Эффективные архитектуры

- CPU x86

- GPU: основные методы

- NPU

- Ускорение NLP: осн. методы

- Ускорение NLP: совр. архитектуры

~~- CPU: ARM + Android~~

~~- CPU: ARM + iOS~~

~~- Микроконтроллеры~~

- Distillation

- Pruning

-

- Low-Precision computing

- NAS

- Эффективные архитектуры

- CPU x86

- GPU: основные методы

- NPU

~~- Ускорение NLP: осн. методы~~

~~- Ускорение NLP: совр. архитектуры~~

~~- CPU: ARM + Android~~

~~- CPU: ARM + iOS~~

~~- Микроконтроллеры~~

Тарифы

Проверка заданий от спикеров

Поддержка в чате

Семинары со спикерами

Каждый тариф включает в себя:

Практические задания

старт осенью 2025

Лист ожидания

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Лист ожидания

FAQs

Когда проходят лекции и семинары?

Лекции проходят по будням в 18:00 по московскому времени и длятся 1,5−2 часа. Q&A-сессии проходят после каждой 5-й лекции, время определяется индивидуально для каждого потока.

Смогу ли я оформить налоговый вычет?

Да, вы сможете оформить налоговый вычет за обучение, если вы являетесь налоговым резидентом России и оплачиваете подоходный налог. Подать документы на вычет можно в году, следующем за годом оплаты обучения. Подробнее о налоговом вычете за обучение можно прочитать на сайте ФНС

Может ли моя компания оплатить курс?

Моя компания может оплатить курс?

Да, мы подготовим счёт на полную или частичную оплату для юридического лица. Напишите на hello@deepschool.ru
Скидки не распространяются на оплату курса юр. лицами, поэтому при заполнении заявки указывайте полную стоимость.

На сколько часов рассчитана программа?

На сколько
часов рассчитана программа?

Курс включает 25 астрономических часов лекций и Q&A-сессий. С учетом времени на домашние задания, учеба будет занимать примерно 8 часов в неделю. После каждого блока курса есть перерыв на каникулы.

Что делать, если нет доступной GPU?

Если у вас нет в доступе машины с GPU, мы предоставим кредиты на аренду удаленной машины и подскажем, как настроить подключение к ней

Что я должен знать, чтобы начать обучение?

Основы Deep Learning и Machine learning. Мы предполагаем, что вы уже знаете теорию нейросетей. Если вы сомневаетесь, подходит ли курс именно вам, напишите нам в телеграм Спросить в ТГ

Присоединиться

Если у вас остались вопросы по курсу, напишите нам в Telegram

Написать в Telegram

Наши программы

Поможем освоить востребованные на рынке знания, передав секреты и опыт практикующих инженеров и исследователей

Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Март 2025 • 4 месяца

Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Июнь 2025 • 3 месяца

Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Июль 2025 • 3 месяца

Подробнее

/

Погрузитесь в продвинутый Computer Vision

Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания • 3 месяца

Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее

/

Подробнее

Июнь 2025 • 4 месяца

CV Rocket 2.0

Подробнее

13 мая 2025

Погрузитесь в продвинутый Computer Vision

Наведите порядок в репозиториях, научитесь создавать и деплоить DL-сервисы

Деплой DL-сервисов

Август 2025 • 4 месяца

Научитесь ускорять модели и адаптировать инференс под CPU, GPU и NPU

Ускорение нейросетей

Осень 2025 • 3 месяца

Узнайте, как решают задачи в VR/AR, беспилотниках и цифровых двойниках

3D Computer Vision

Лист ожидания

Освойте теорию генеративных моделей и их обучение на практике

Generative Computer Vision

Лист ожидания

Теория, инференс, ускорение и актуальные подходы в LLM

LLM

Подробнее

25 июня • 4 месяца

CV Rocket 2.0

Подробнее

Октябрь 2025

Телеграм-канал DeepSchool

Короткие посты по теории ML/DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе

Открыть Телеграм

Политика конфиденциальности

Есть вопросы, на которые вы не нашли ответы? Напишите нам в Telegram, ответим на все интересующие вопросы

Написать в Тelegram

Научитесь решать задачи эффективно

Курс для тех, кто уже работает в индустрии и хочет

Разобраться в теории

Освоить фреймворки

Поднять скиллы

Перенять опыт

Ускорять инференс нейросетей

Чему вы научитесь

Совмещать все методы воедино

Запускать инференс на различных устройствах

Сохранять точность при ускорении

Программа

Блок 1. База – 8 лекций

Блок 2. LLM – 2 лекции

Блок 3. Device – 3 лекции

Как именно вы освоите каждый навык

Изучите теорию на zoom-лекции

1.

Сделаете практическое задание

2.

Получите разбор домашнего задания

3.

Если возникнут трудности, мы оперативно поможем в чате

4.

Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

5.

Кто будет преподавать

Что говорят наши выпускники

После обучения

Чат выпускников

Сертификат о прохождении обучения

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

«База + LLM + Device»

«База + Device»

«База + LLM»

«База»

Тарифы

старт осенью 2025

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

FAQs

Когда проходят лекции и семинары?

Смогу ли я оформить налоговый вычет?

Может ли моя компания оплатить курс?

На сколько часов рассчитана программа?

Что делать, если нет доступной GPU?

Что я должен знать, чтобы начать обучение?

Если у вас остались вопросы по курсу, напишите нам в Telegram

Наши программы

Деплой DL-сервисов

Ускорение нейросетей

3D Computer Vision

Generative Computer Vision

LLM

CV Rocket 2.0

Деплой DL-сервисов

Ускорение нейросетей

3D Computer Vision

Generative Computer Vision

LLM

CV Rocket 2.0

Телеграм-канал DeepSchool

Телеграм-канал DeepSchool