Осталось 3/10 мест со скидкой 16%

LLM System Design

Научитесь создавать LLM-системы: от поиска по базе знаний и саппорт-агентов до речевой аналитики и мультиагентных систем

Старт 15 июля Продолжительность 3 месяца

Курс для тех, кто планирует или уже строит LLM-системы

DL-инженеры

Научитесь строить системы целиком от распределения входной нагрузки до мониторинга ключевых метрик. Сможете говорить с разработчиками на одном языке и строить дорожную карту развития ваших сервисов.

ML-инженеры и аналитики

Научитесь строить LLM-приложения, которые решают востребованные задачи: поиск по базе знаний, чат-бот, автономные ИИ-сотрудники — поймёте, как устроены системы изнутри, чтобы с пониманием дела улучшать их работу.

Backend-разработчики

Разберётесь в специфике LLM-приложений: когда какую модель использовать и что есть кроме LLM, векторный поиск, метрики, трейсинг, агентские системы — сможете говорить с ML/DL командой на одном языке и строить дорожную карту развития ваших сервисов.

После курса вы сможете:

01

Вайбкодить Использовать кодинг-агентов

Настроите окружение для эффективной работы кодинг-агентов над проектом. Узнаете, как сэкономить время на разработке.

02

Решать задачу customer support

Разберёте архитектуру решения: балансировка нагрузки, классификация интента, генерация ответа, трейсинг, агентский подход — и реализуете каждый шаг в проекте.

03

Создавать мультиагентные системы

Соберёте мультиагентную систему, используя современные подходы и инструменты как в популярных Hermes, OpenClaw, Claude Code, etc.

04

Поднимать self-host LLM

Развернёте свою LLM на vLLM / SGLang с квантованием и автоскейлом. Соберёте офлайн-пайплайн анализа голосовых записей.

05

Строить поиск по базе знаний

Соберёте RAG-сервис: от ванильной версии до гибридного поиска, способного держать нагрузку.

06

Настраивать observability

Чтобы сделать систему прозрачной: следить за ключевыми метриками и прицельно улучшать приложение.

Программа

Курс собран из четырёх проектов. Для каждого разбираем архитектуру и собираем работающий прототип — на лекциях и семинарах. Лекция каждую среду; посередине курса — неделя перерыва (26 августа).

  1. Поиск по базе знаний

    Собираем сервис семантического поиска по корпоративной базе: от ванильного RAG до гибридных схем и Page Index. Проходим путь от 1 до 100 RPS без переписывания с нуля.

    • 22 июля Code-ассистенты Лекция

      Настраиваем окружение для кодинг-агента

      • Coding-агент vs автокомплит и чат: обзор инструментов (Codex, Claude Code, Cursor)
      • Настройка на проекте: режимы, права доступа, окружения
      • AGENTS.md и документация для агента
      • MCP, скиллы и команды под частые задачи
      • Частые ошибки в работе с агентом
      • Разбор задач на реальном проекте: от постановки до кода
    • 29 июля Архитектура сервиса поиска по базе Лекция

      Учимся создавать поиск по базе знаний

      • Где живёт база
      • Где живёт сервис поиска
      • Как они связываются
      • Ванильный RAG
    • 5 августа Улучшение поиска Лекция

      Доводим поиск до действительно работающей версии

      • Полнотекстовый поиск
      • Гибридный поиск
      • Page Index — заранее готовим LLM-кой краткие содержания в дереве, чтобы поиск стал умнее
      • От v0 до v3: что меняется при росте нагрузки от 1 до 100 RPS
  2. Клиентский саппорт

    Делаем мультиагентный саппорт: классифицируем интент, ищем в базе, отвечаем, эскалируем оператору. С observability, метриками качества и guardrails — чтобы выпускать в продакшн, а не только демо-стенд.

    • 12 августа Архитектура саппорта Семинар

      Разбираем архитектуру саппорта

      • Точка входа в сервис
      • Классификация интентов
      • Кластеризация и дерево поиска
      • Генерация ответа
      • Observability и трейсинг
    • 19 августа Мультиагентный вариант Семинар

      Разбираем мультиагентную версию саппорта

      • Декомпозиция: интент-классификатор, retriever, ответчик, эскалатор
      • Граф диалога: переходы по состояниям, уточняющие вопросы клиенту, варианты ответов
      • Когда вместо одного промпта нужно несколько ролей
      • Маршрутизация: какой агент берёт следующую реплику
      • Совместная память агентов о клиенте
    • 2 сентября LLM-Observability Лекция

      Учимся делать LLM-систему прозрачной

      • Трейсинг и спаны
      • OpenTelemetry для LLM
      • LLM-метрики
      • Оценка качества
      • Guardrails и safety
      • Feedback loops
      • Prompt management
  3. Речевая аналитика и боты

    Self-host LLM под свою задачу + офлайн-аналитика звонков: ASR → диаризация → LLM-анализ. Структурированный JSON-выход, который ложится в дашборды и даёт инсайты бизнесу.

    • 9 сентября Self-host LLM Лекция

      Разворачиваем собственную LLM

      • Когда self-host оправдан: данные, лимиты, стоимость на масштабе
      • Выбор модели под задачу: 7B / 30B / 70B+
      • Инфраструктура инференса: vLLM, SGLang, TensorRT-LLM
      • Квантование: AWQ, GPTQ, FP8 — что и когда теряем
      • GPU и память: что нужно под нужный контекст и батч
      • Эксплуатация: автоскейл, обновление весов, мониторинг
    • 16 сентября Офлайн-аналитика разговоров Лекция

      Учимся локально работать с аудио-доменом

      • Пайплайн: запись → ASR → диаризация → нормализация → LLM-анализ
      • Выбор ASR: Whisper, GigaAM, коммерческие
      • LLM-задачи на транскриптах: тематика, эмоции, скрипт оператора, причина обращения
      • Структурированный выход: JSON-схемы, валидация
      • Масштаб: батчинг, очереди, стоимость
      • Дашборды и инсайты
  4. Мультиагентный ИИ-разработчик

    Универсальный агент общего назначения: tools, MCP, ReAct, память и sandbox. Сравниваем с Cursor, Claude Code и Hermes и собираем своего на семинаре в конце курса.

    • 23 сентября Агенты Лекция

      Общая лекция по современным подходам в агентах

      • Когда агент нужен, а когда вреден
      • Function calling: дизайн tool'ов, описания, схемы аргументов
      • MCP: зачем, как меняет архитектуру интеграций
      • ReAct и вариации: Plan-and-Execute, Reflexion
      • Память: краткосрочная, долгосрочная (векторная), эпизодическая
      • Fallback'и и обработка ошибок tool'ов
      • Sandbox для запуска кода агентом
      • Стоимость и латентность
    • 30 сентября Разбор агентских систем (Hermes, Claude, etc) Лекция

      Изучаем лучшие решения для агентских систем в индустрии

      • Что общего у Cursor, Claude Code, Hermes, OpenClaw
      • Дизайн system prompt и роли агента
      • Управление контекстом: компактация, scratchpad, постоянная память
      • Дизайн tool'ов: гранулярность и чёткие описания
      • Безопасность и sandbox для исполнения кода
      • Эвалы для агентов: как ловить регрессии в недетерминированной системе
    • 7 октября Собираем агента Семинар

      Показываем наглядно, как собрать агента на Python

      • Сравниваем существующие фреймворки
      • Реализуем ReAct-подход
      • Подключаем MCP и инструменты
      • Работа с памятью
      • Реализуем популярные сценарии

Кто будет преподавать

Опытные инженеры. Каждый расскажет про задачу, с которой несколько лет работал в коммерческих проектах.

Денис Солдатов

Денис Солдатов

TheWatch / LinkedIn

Backend-разработчик. Активно использует агентов для разработки, научит настраивать окружение для агента.

Артём Бардаков

Артём Бардаков

Kaiten, Lead AI Engineer

ex Техлид робота Макса на Госуслугах. Расскажет, как решать задачу саппорта.

Александр Абугалиев

Александр Абугалиев

СКБ Контур / LinkedIn

Внедряет RAG в сервисы компании. Расскажет, как создать работающий RAG.

Азер Шахвердиев

Азер Шахвердиев

Контур, Lead ML Engineer / LinkedIn

Руководит NLP лабораторией в Контуре. На курсе расскажет про self-host LLM и LLM-observability в проде.

Формат и расписание

12 недель, по средам. Старт 15 июля, финиш 7 октября. Посередине — неделя перерыва с 26 августа.

11

лекций и семинаров

Каждую среду в Zoom — живая лекция или семинар. С возможностью задать вопрос спикеру в эфире.

4

проекта

Каждый проект — домашка с ревью спикеров и кураторов. На выходе — работающие прототипы в вашем коде.

365

дней доступа

Все лекции в записи и материалы — доступны в течение года после старта. Слайды, код-примеры, ссылки на ресурсы.

24/7

чат с авторами

Закрытый Telegram-чат с потоком и авторами. Ответы на вопросы, помощь по ДЗ, обсуждение архитектур.

Что нужно знать

Необходимы базовые знания Python и LLM.

После обучения

Чат выпускников

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Сертификат о прохождении обучения

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней, если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий

Налоговый вычет
получите 13% от стоимости курса после обучения

Оплата из-за рубежа
картой иностранного банка или другими удобными способами

Может оплатить компания. Мы принимаем оплату от юрлиц — если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты

Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Стоимость

Осталось 3/10 мест

Стоимость курса

79 000
от 14 755 ₽/мес
95 000 ₽
от 17 745 ₽/мес
  • Всего 10 мест со скидкой 16 000 ₽
  • Зафиксировать условия можно предоплатой
  • Остаток оплачиваете до старта курса
  • Предоплату можно вернуть в любой момент
Забронировать место Забронировать в рассрочку

Скидка действует только для физических лиц! Для оплаты от юрлица напишите на почту b2b@deepschool.ru или в поддержку @deepschool_support (тг).

Частые вопросы

Телеграм-канал DeepSchool

Короткие посты по теории ML / DL, полезные библиотеки и фреймворки, вопросы с собеседований и советы, которые помогут в работе.

Открыть Телеграм