Есть вопросы по курсу?

напишите нам в Telegram, ответим на все вопросы

Телеграм-канал DeepSchool

LLM Pro

Cтарт — в октябре 2025

Онлайн-курс

Соберёте полноценные LLM-системы с учётом требований к качеству и нагрузке, разберёте сложные кейсы и дизайны NLP-решений

вы NLP-инженер, дата-сайентист или разработчик

Работает с текстами

Этот курс для тех, кто:

Хочет расти

решать более сложные задачи, уверенно проходить интервью

но не собирал из них полноценные системы

Умеет обучать модели

и хочет быстро запустить надёжное NLP-решение

Делает продукт или стартап

Понимает: prompt-инженерии и API уже недостаточно

пора строить своё

Важны базовые знания по NLP и опыт работы с LLM

1. Математика для ML и понимание устройства DL

Необходимо знать, что такое производная, матричное умножение, скалярное произведение, градиентный спуск, дифференцируемость, как работают оптимизаторы SGD/Adam, что такое кроссэнтропийная функция потерь, как работает backpropagation

Будем писать функции и классы на Python. Нужно уметь использовать базовые pytorch-классы, такие как nn.Linear, nn.Dropout, torch.softmax, оптимизаторы из torch.optim, уметь написать training loop

2. Базовое знание Python и PyTorch

5. Понимание базовых NLP-задач

Токенизация, классификация, генерация текста, оценка близости текстов через вектора

Self-attention, positional encoding, механизмы кодирования/декодирования, на какие задачи учится BERT и GPT

6. Знание архитектуры трансформеров

7. Базовое знание того, как обучаются LLM

8. Базовое представление об устройстве AI-агентов

Предобучение, supervised fine-tuning, алайнмент (включая метод DPO)

3. Знание основ NLP

4. Знание архитектуры LLM

Что вы получите от курса:

Научитесь проектировать и запускать NLP-системы под реальные продуктовые задачи

Освоите адаптацию LLM и эмбеддингов под специфичный домен и «живые» данные

Построите AI-агентов с нуля — на основе сценариев, функций и взаимодействия с внешней средой

Поймёте, как собирать и размечать датасеты, даже если данных почти нет

Сможете собрать свою RAG-систему: от ретривера и реранкера до генератора и оценки качества

Разберёте реальные кейсы и научитесь применять похожие подходы в своих проектах

Получите фундамент для уверенного прохождения NLP system design интервью и перехода на следующий грейд

Разберётесь, как решать задачи классификации, поиска, кластеризации и NER — с ограничениями продакшн-среды

Программа

Лекция каждую неделю. После каждой темы — домашнее задание с фидбеком от лектора. Раз в 4−5 недель — Q&A-сессия для разбора вопросов. В середине курса есть перерыв на каникулы.

3 месяца

9 лекций

9 заданий с фидбеком от преподавателей

01. Архитектура систем текстовой классификации

Разберём ключевые архитектурные паттерны современных систем текстовой классификации. Вспомним, как использовать BERT и его альтернативы, обсудим подходы с дообучаемыми головами и дистилляцией больших моделей. Поговорим о способах работы с меняющимся распределением данных и техниках, которые помогают строить более устойчивые модели

Эвристики и итеративное улучшение

Работа с данными при их дефиците

Генеративный классификатор с reasoning

Дистилляция LLM в компактную модель

Дообучаемые головы

BERT и альтернативы

Основные темы:

02. Построение доменных текстовых эмбеддингов

Углубимся в работу с эмбеддингами: от дообучения собственного BERT под специфичный домен до использования triplet loss и contrastive learning. Рассмотрим практики, как строить эмбеддинги для сложных структур. Обсудим, когда и как адаптировать эмбеддеры к новым распределениям данных

Существующие открытые эмбеддеры

Доменная адаптация эмбеддеров

Matching задач через эмбеддинги

Профили и последовательности

Triplet loss, contrastive learning

BERT и альтернативы

Основные темы:

03. Кластеризация текстов: в офлайне и в реальном времени

Изучим, как кластеризовать тексты в офлайне и в потоке. Обсудим популярные методы визуализации и алгоритмы кластеризации, включая нейросетевые. Разберём решения на примере кейсов

Архитектура и инфраструктура онлайн-кластеризации

Бинарные автоэнкодеры

Онлайн кластеризация

UMAP, T-SNE, LSH

Основные темы:

04. Сбор данных и разметка: от формулировки задачи до крауда

Разберёмся, как правильно ставить задачи и собирать датасеты под реальные задачи. Поговорим про активное обучение, разметку через кластеризацию и LLM, а также про лучшие практики работы с краудплатформами

Крауд: Toloka, MTurk

Инструкции, ханипоты, проверка качества

Selfinstruct, LIMA

Active learning

Разметка через LLM и кластеризацию

Критичность и массовость ошибок

Постановка задач и требования к данным

Основные темы:

05. Named Entity Recognition: от BERT до генеративных моделей

Рассмотрим подходы к извлечению сущностей из текста: от эвристик до BERT и генеративных моделей. Научимся мерить качество, решать проблемы со смещением данных и использовать LLM как инструмент для разметки и обучения

Разбор кейсов

Метрики качества

LLM в разметке и дообучении

Дообучение и адаптация под домен

BERT vs генеративные подходы

Постановка задачи и проблемы NER

Основные темы:

06. Адаптация LLM под домен

Углубимся в методы адаптации LLM под специфические задачи и домены. Обсудим посттрейнинг, SFT, настройку токенизатора, а также принципы alignment’а. На реальных кейсах разберём, как подходить к адаптации системно

Работа с галлюцинациями

Разбор кейсов

Чистка и генерация датасетов

Alignment через данные

Supervised Fine-tuning (SFT)

Токенизаторы и continious pretrain

Посттрейнинг на домен

Основные темы:

07. Проектирование систем текстового поиска

Научимся проектировать поисковые системы от базовых принципов до продвинутых техник. Обсудим dense retrieval, hybrid search, построение индексов, персонализацию и мультимодальный поиск

Мультимодальный поиск

Фактчекинг

Персонализация, расширение запросов

Elasticsearch, FAISS

Sentence-BERT, DPR

TF-IDF, BM25

Основные темы:

08. Advanced RAG: создание и тюнинг продакшн-систем

Разберём продвинутые подходы к созданию и улучшению RAG-систем. От ретривера и реранкера до генератора и архитектуры всего пайплайна. Покажем, как бороться с галлюцинациями, ускорять работу и планировать нагрузку

Предсказание качества до генерации

Оптимизация под железо

Достоверность, краткость, ссылки

Кэш, дистилляция, стриминг

Память и сложные базы знаний

Генерация ответов, SFT, posttraining

Подстройка эмбеддера и реранкера

RAG: структура и этапы

Основные темы:

09. AI-агенты: как построить рабочего ассистента с нуля

Разберёмся, как построить AI-агента, даже если вначале нет ничего. Поговорим про сбор данных, дообучение моделей под function calls, использование text2sql, а также alignment и обучение через среду с критериями успеха

Alignment для агентов

Кейсы и подходы к обучению

Критерии успешности

Генерация траекторий через среду

Сценарии взаимодействия

Text2SQL

Function calls

Основные темы:

Записаться

Как именно вы освоите каждый навык

Онлайн-лекции, где можно задавать вопросы, обсуждать сложные кейсы и дискутировать. В конце — анонимный тест для закрепления материала

Изучите теорию на zoom-лекции

1.

1/5

←

→

2/5

←

→

После каждой лекции — домашнее задание для закрепления материала

Сделаете практическое задание

2.

3/5

←

→

Каждое домашнее задание проверит лектор и даст исчерпывающий фидбэк

Получите разбор домашнего задания

3.

4/5

←

→

Обсуждайте домашние задания, рабочие задачи или просто общайтесь. Кураторы курса всегда помогут решить проблемы и поделятся советом

Если возникнут трудности, мы оперативно поможем в чате

4.

5/5

←

→

Раз в 4−5 недель спикеры и кураторы собираются в zoom, чтобы ответить на ваши вопросы, помочь с практикой, обсудить задачи

Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

5.

Кто будет преподавать

Опытные инженеры будут вести Zoom-лекции и семинары, отвечать на ваши вопросы и ревьюить код

Yandex /

Занимается обучением Multimodal Large Language Models. Работал в команде претрейна в Яндекс, до этого в Abby и Сбер

Илья Димов

Yandex, ex. VK /

Улучшает качество быстрых генеративных ответов в Нейро-Поиске

Дмитрий Калашников

Егор Смирнов

Разрабатывает и внедряет модели в ML команде Поиска AliExpress

AliExpress Russia

ecom.tech /

DS в поиске Самоката и Мегамаркета, занимается задачами построения текстовых векторных моделей ранжирования и отбора кандидатов

Василий Висков

Yandex, ex. VK /

Работает над генеративными моделями и RAG — отвечает за систему, когда и какие модели должны отвечать на запросы пользователей

Алексей Яндутов

Сергей Воробьёв

Масштабирует обучение LLM. Ускоряет эксперименеты и улучшает инфрастуктуру в задчах NLP

Сергей Воробьёв

Масштабирует обучение LLM. Ускоряет эксперименеты и улучшает инфрастуктуру в задчах NLP

Yandex /

Илья Димов

Занимается обучением Multimodal Large Language Models. Работал в команде претрейна в Яндекс, до этого в Abby и Сбер

ecom.tech /

Василий Висков

DS в поиске Самоката и Мегамаркета, занимается задачами построения текстовых векторных моделей ранжирования и отбора кандидатов

Yandex, ex. VK /

Дмитрий Калашников

Улучшает качество быстрых генеративных ответов в Нейро-Поиске

AliExpress Russia

Егор Смирнов

Разрабатывает и внедряет модели в ML команде Поиска AliExpress

Улучшает качество быстрых генеративных ответов в Нейро-Поиске

Алексей Яндутов

Yandex, ex. VK /

После обучения

Чат выпускников

Сертификат о прохождении обучения

Вы попадаете в чат выпускников — чат с опытными инженерами, где мы проводим литклубы, random coffee и обсуждаем вопросы с работы

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Полный возврат стоимости в первые 14 дней,
если поймёте, что программа вам не подходит. Если примете решение позже, вернём деньги за вычетом уже пройденных занятий

Налоговый вычет
получите 13% от стоимости курса после обучения

Оплата из-за рубежа
картой иностранного банка или другими удобными способами

Может оплатить компания. мы принимаем оплату от юрлиц, если хотите, чтобы работодатель оплатил ваше обучение, пусть ваши представители напишут нам на b2b@deepschool.ru для оформления документов и оплаты

Мы обучаем по лицензии Л035-01199-54/00734237 ↗

Запишитесь в лист ожидания

Старт — в октябре 2025. Мы свяжемся, когда начнем собирать группу, расскажем о тарифах и подарим скидки на обучение первым участникам. Количество мест ограничено

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

Истории глазами тех, кто успешно прошел обучение

«Мои ожидания оправдались на 120% и я смог закрепить уже имевшиеся знания и пополнить новыми!

Михаил Пузицкий

Есть вопросы по курсу?

LLM Pro

Этот курс для тех, кто:

Что вы получите от курса:

Программа

01. Архитектура систем текстовой классификации

02. Построение доменных текстовых эмбеддингов

03. Кластеризация текстов: в офлайне и в реальном времени

04. Сбор данных и разметка: от формулировки задачи до крауда

05. Named Entity Recognition: от BERT до генеративных моделей

06. Адаптация LLM под домен

07. Проектирование систем текстового поиска

08. Advanced RAG: создание и тюнинг продакшн-систем

09. AI-агенты: как построить рабочего ассистента с нуля

Как именно вы освоите каждый навык

Изучите теорию на zoom-лекции

1.

Сделаете практическое задание

2.

Получите разбор домашнего задания

3.

Если возникнут трудности, мы оперативно поможем в чате

4.

Или приходите на онлайн-встречи с кураторами, чтобы обсудить вопрос голосом

5.

Кто будет преподавать

После обучения

Чат выпускников

Сертификат о прохождении обучения

Доступ к материалам курса на один год

Комфортные условия для вашей учёбы

Запишитесь в лист ожидания

Доступен налоговый вычет

Может оплатить компания

Полный возврат в первые 14 дней

Принимаем оплату из-за рубежа

Что говорят наши выпускники

FAQs

Когда проходят лекции и Q&A-сессии?

Смогу ли я оформить налоговый вычет?

Может ли моя компания оплатить курс?

Если у вас остались вопросы по курсу, напишите нам в Telegram

Наши программы

Деплой DL-сервисов

Ускорение нейросетей

3D Computer Vision

Generative Computer Vision

LLM

CV Rocket 2.0

Деплой DL-сервисов

Ускорение нейросетей

3D Computer Vision

Generative Computer Vision

LLM

CV Rocket 2.0

Телеграм-канал DeepSchool

Телеграм-канал DeepSchool