Осталось 3/10 мест со скидкой 16%

LLM System Design

Научитесь создавать LLM-системы: от поиска по базе знаний и саппорт-агентов до речевой аналитики и мультиагентных систем

Записаться Смотреть программу

Старт 15 июля Продолжительность 3 месяца

Курс для тех, кто планирует или уже строит LLM-системы

DL-инженеры

Научитесь строить системы целиком от распределения входной нагрузки до мониторинга ключевых метрик. Сможете говорить с разработчиками на одном языке и строить дорожную карту развития ваших сервисов.

ML-инженеры и аналитики

Научитесь строить LLM-приложения, которые решают востребованные задачи: поиск по базе знаний, чат-бот, автономные ИИ-сотрудники — поймёте, как устроены системы изнутри, чтобы с пониманием дела улучшать их работу.

Backend-разработчики

Разберётесь в специфике LLM-приложений: когда какую модель использовать и что есть кроме LLM, векторный поиск, метрики, трейсинг, агентские системы — сможете говорить с ML/DL командой на одном языке и строить дорожную карту развития ваших сервисов.

После курса вы сможете:

Вайбкодить Использовать кодинг-агентов

Настроите окружение для эффективной работы кодинг-агентов над проектом. Узнаете, как сэкономить время на разработке.

Решать задачу customer support

Разберёте архитектуру решения: балансировка нагрузки, классификация интента, генерация ответа, трейсинг, агентский подход — и реализуете каждый шаг в проекте.

Создавать мультиагентные системы

Соберёте мультиагентную систему, используя современные подходы и инструменты как в популярных Hermes, OpenClaw, Claude Code, etc.

Поднимать self-host LLM

Развернёте свою LLM на vLLM / SGLang с квантованием и автоскейлом. Соберёте офлайн-пайплайн анализа голосовых записей.

Строить поиск по базе знаний

Соберёте RAG-сервис: от ванильной версии до гибридного поиска, способного держать нагрузку.

Настраивать observability

Чтобы сделать систему прозрачной: следить за ключевыми метриками и прицельно улучшать приложение.

Программа

4 проекта
11 лекций

Курс собран из четырёх проектов. Для каждого разбираем архитектуру и собираем работающий прототип — на лекциях и семинарах. Лекция каждую среду; посередине курса — неделя перерыва (26 августа).

15 июля Вводная встреча Встреча

Знакомимся с группой, разбираем формат курса, проекты и домашние задания. Отвечаем на все вопросы перед стартом

Поиск по базе знаний

Собираем сервис семантического поиска по корпоративной базе: от ванильного RAG до гибридных схем и Page Index. Проходим путь от 1 до 100 RPS без переписывания с нуля.
- 22 июля Code-ассистенты Лекция
  Настраиваем окружение для кодинг-агента
  
  Coding-агент vs автокомплит и чат: обзор инструментов (Codex, Claude Code, Cursor)
  
  Настройка на проекте: режимы, права доступа, окружения
  
  AGENTS.md и документация для агента
  
  MCP, скиллы и команды под частые задачи
  
  Частые ошибки в работе с агентом
  
  Разбор задач на реальном проекте: от постановки до кода
- 29 июля Архитектура сервиса поиска по базе Лекция
  Учимся создавать поиск по базе знаний
  
  Где живёт база
  
  Где живёт сервис поиска
  
  Как они связываются
  
  Ванильный RAG
- 5 августа Улучшение поиска Лекция
  Доводим поиск до действительно работающей версии
  
  Полнотекстовый поиск
  
  Гибридный поиск
  
  Page Index — заранее готовим LLM-кой краткие содержания в дереве, чтобы поиск стал умнее
  
  От v0 до v3: что меняется при росте нагрузки от 1 до 100 RPS
Клиентский саппорт

Делаем мультиагентный саппорт: классифицируем интент, ищем в базе, отвечаем, эскалируем оператору. С observability, метриками качества и guardrails — чтобы выпускать в продакшн, а не только демо-стенд.
- 12 августа Архитектура саппорта Семинар
  Разбираем архитектуру саппорта
  
  Точка входа в сервис
  
  Классификация интентов
  
  Кластеризация и дерево поиска
  
  Генерация ответа
  
  Observability и трейсинг
- 19 августа Мультиагентный вариант Семинар
  Разбираем мультиагентную версию саппорта
  
  Декомпозиция: интент-классификатор, retriever, ответчик, эскалатор
  
  Граф диалога: переходы по состояниям, уточняющие вопросы клиенту, варианты ответов
  
  Когда вместо одного промпта нужно несколько ролей
  
  Маршрутизация: какой агент берёт следующую реплику
  
  Совместная память агентов о клиенте
- 2 сентября LLM-Observability Лекция
  Учимся делать LLM-систему прозрачной
  
  Трейсинг и спаны
  
  OpenTelemetry для LLM
  
  LLM-метрики
  
  Оценка качества
  
  Guardrails и safety
  
  Feedback loops
  
  Prompt management
Речевая аналитика и боты

Self-host LLM под свою задачу + офлайн-аналитика звонков: ASR → диаризация → LLM-анализ. Структурированный JSON-выход, который ложится в дашборды и даёт инсайты бизнесу.
- 9 сентября Self-host LLM Лекция
  Разворачиваем собственную LLM
  
  Когда self-host оправдан: данные, лимиты, стоимость на масштабе
  
  Выбор модели под задачу: 7B / 30B / 70B+
  
  Инфраструктура инференса: vLLM, SGLang, TensorRT-LLM
  
  Квантование: AWQ, GPTQ, FP8 — что и когда теряем
  
  GPU и память: что нужно под нужный контекст и батч
  
  Эксплуатация: автоскейл, обновление весов, мониторинг
- 16 сентября Офлайн-аналитика разговоров Лекция
  Учимся локально работать с аудио-доменом
  
  Пайплайн: запись → ASR → диаризация → нормализация → LLM-анализ
  
  Выбор ASR: Whisper, GigaAM, коммерческие
  
  LLM-задачи на транскриптах: тематика, эмоции, скрипт оператора, причина обращения
  
  Структурированный выход: JSON-схемы, валидация
  
  Масштаб: батчинг, очереди, стоимость
  
  Дашборды и инсайты
Мультиагентный ИИ-разработчик

Универсальный агент общего назначения: tools, MCP, ReAct, память и sandbox. Сравниваем с Cursor, Claude Code и Hermes и собираем своего на семинаре в конце курса.
- 23 сентября Агенты Лекция
  Общая лекция по современным подходам в агентах
  
  Когда агент нужен, а когда вреден
  
  Function calling: дизайн tool'ов, описания, схемы аргументов
  
  MCP: зачем, как меняет архитектуру интеграций
  
  ReAct и вариации: Plan-and-Execute, Reflexion
  
  Память: краткосрочная, долгосрочная (векторная), эпизодическая
  
  Fallback'и и обработка ошибок tool'ов
  
  Sandbox для запуска кода агентом
  
  Стоимость и латентность
- 30 сентября Разбор агентских систем (Hermes, Claude, etc) Лекция
  Изучаем лучшие решения для агентских систем в индустрии
  
  Что общего у Cursor, Claude Code, Hermes, OpenClaw
  
  Дизайн system prompt и роли агента
  
  Управление контекстом: компактация, scratchpad, постоянная память
  
  Дизайн tool'ов: гранулярность и чёткие описания
  
  Безопасность и sandbox для исполнения кода
  
  Эвалы для агентов: как ловить регрессии в недетерминированной системе
- 7 октября Собираем агента Семинар
  Показываем наглядно, как собрать агента на Python
  
  Сравниваем существующие фреймворки
  
  Реализуем ReAct-подход
  
  Подключаем MCP и инструменты
  
  Работа с памятью
  
  Реализуем популярные сценарии

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах.

Денис Солдатов

TheWatch / LinkedIn

Backend-разработчик. Активно использует агентов для разработки, научит настраивать окружение для агента.

Артём Бардаков

Kaiten, Lead AI Engineer

ex Техлид робота Макса на Госуслугах. Расскажет, как решать задачу саппорта.

Александр Абугалиев

СКБ Контур / LinkedIn

Внедряет RAG в сервисы компании. Расскажет, как создать работающий RAG.

Азер Шахвердиев

Контур, Lead ML Engineer / LinkedIn

Руководит NLP лабораторией в Контуре. На курсе расскажет про self-host LLM и LLM-observability в проде.

Формат и расписание

12 недель, по средам. Старт 15 июля, финиш 7 октября. Посередине — неделя перерыва с 26 августа.

лекций и семинаров

Каждую среду в Zoom — живая лекция или семинар. С возможностью задать вопрос спикеру в эфире.

проекта

Каждый проект — домашка с ревью спикеров и кураторов. На выходе — работающие прототипы в вашем коде.

365

дней доступа

Все лекции в записи и материалы — доступны в течение года после старта. Слайды, код-примеры, ссылки на ресурсы.

24/7

чат с авторами

Закрытый Telegram-чат с потоком и авторами. Ответы на вопросы, помощь по ДЗ, обсуждение архитектур.

Что нужно знать

Необходимы базовые знания Python и LLM.

Уверенный Python Знакомы с async/await, классами, типизацией.
Опыт работы с REST API Понимаете, как делать HTTP-запросы, обрабатывать ошибки, работать с JSON.
Базовое понимание LLM Знаете, что такое токен, эмбеддинг, prompt. Пользовались агентами или LLM-чатом.
DL/ML-знания — не обязательны Программа построена так, чтобы её могли пройти разработчики без ML-бэкграунда.

После обучения

Чат выпускников

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Сертификат о прохождении обучения

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней, если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий

Налоговый вычет
получите 13% от стоимости курса после обучения

Оплата из-за рубежа
картой иностранного банка или другими удобными способами

Может оплатить компания. Мы принимаем оплату от юрлиц — если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты

Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Стоимость

Осталось 3/10 мест

Стоимость курса

79 000₽

от 14 755 ₽/мес

95 000 ₽

~~от 17 745 ₽/мес~~

Всего 10 мест со скидкой 16 000 ₽
Зафиксировать условия можно предоплатой
Остаток оплачиваете до старта курса
Предоплату можно вернуть в любой момент

Забронировать место Забронировать в рассрочку

Скидка действует только для физических лиц! Для оплаты от юрлица напишите на почту b2b@deepschool.ru или в поддержку @deepschool_support (тг).

Частые вопросы

Сколько времени нужно тратить в неделю?

В зависимости от опыта 5–8 часов в неделю: 1.5–2 часа на лекцию или семинар + 3–6 часов на практику.
Что, если пропущу лекцию?

Все лекции доступны в записи на следующее утро. Если возникнут вопросы, их всегда можно задать спикерам в чате группы.
Можно ли вернуть предоплату?

Да, предоплату 20 000 ₽ можно вернуть в любой момент до начала курса, достаточно написать нам по любым контактам.
Что с доступом к записям и материалам после курса?

Доступ к записям и материалам — 365 дней с момента старта курса. Чат потока остаётся открытым и после — общение и обмен опытом продолжаются.
Как вернуть деньги после старта курса?

До начала третьей лекции можно вернуть всю сумму, после — соразмерно неизученному материалу.
Можно оплатить от ИП / ООО? Будет ли договор и закрывающие документы?

Да, напишите нам на b2b@deepschool.ru или в телеграм: @deepschool_support — подготовим документы и ответим на все вопросы.
Действует ли скидка при оплате от юр. лица?

Скидки действуют только на оплату от физических лиц (карта, рассрочка, СБП), для юр. лиц скидки не действуют. Если важно использовать скидку и условия в вашей компании это позволяют, можно оплатить от физ. лица и после восполнить затраты у работодателя — мы подготовим договор, акт и чек об оплате для вашей бухгалтерии.