...
Data Scientist (CV)
Теперь я умею
Я пришел на этот курс, чтобы
...
{01} Создавать полноценные сервисы
FastAPI
DI-контейнеры
CI/CD
My goals:
My skills now:
Docker
Ansible
Linting, PyTest
Prometheus, Grafana
Sentry
Упаковывать свои приложения в Docker и быть уверенным, что заработает не только на моем компьютере
Тестировать и собирать свое приложение при каждом коммите, а также деплоить по одной кнопке в UI, когда сочту нужным
Разворачивать свои приложения на удаленном сервере одной командой
Создавать REST API сервисы с инференсом нейросетей на асинхронном фреймворке
Внедрять и подменять зависимости
Собирать метрики приложения с помощью Prometheus, визуализировать их в Grafana и настраивать алерты на пороговые значения
Быстро узнавать об ошибках на проде
Проверять код на стилевые ошибки при помощи линтера и не тратить на них время (свое и коллеги) на ревью. А также покрывать свое приложение юнит и интеграционными тестами и быть уверенным, что хотябы на базовых сценариях оно не сломается:)
{02} Работать в ML/DL команде
ClearML
Catalyst/Lightning
DALI
DVC
Максимально утилизировать ресурсы GPU, проводя часть препроцессинга на карте
Использовать фреймворк, который позволяет унифицировать моделинг в команде, снизить бас-фактор и ускорить проведение экспериментов
Версионировать датасеты, модели, тяжелые артефакты и избегать дублирования файлов на серверах при работе в команде
Логировать конфиги экспериментов, визуализировать метрики, лоссы, таблицы с возможностью делиться результатами и сравнивать эксперименты
{03} Решать различные CV задачи
Distillation, Pruning
Toloka
Classic CV
Segmentation
Face Recognition
Quantization
Detection
OCR
Сегментировать классы на изображениях
Избавляться от избыточности float в нейросетях, ужимая нейроны нейросети в более легкий и быстрый int8
Удалять наименее важные слои из нейросети и использовать тяжелые сети для обучения более легких и быстрых моделей
Собирать чистые и дешевые данные с нуля
Решать задачу детекции объектов
Распознавать текст на картинких с помощью CRNN
Использовать классические методы компьютерного зрения для улучшения работы нейросетей или для обработки изображений без нейросетей вовсе
Чтобы получить «Гроза Релизов», нужно открыть:
- Docker
- CI/CD
- Ansible
- Linting, PyTest
Achievements:
ONNX, TRT, JIT
Конвертировать сети в различные форматы, чтобы ускорять инференс, избегать зависимостей и использовать модели на портативных устройствах
Чтобы получить «Бэкендер», нужно открыть:
- Fast API
- DI-контейнеры
- Ansible
- Linting, PyTest
Чтобы получить «Знаток своего прода», нужно открыть:
- Prometheus, Grafana
- Sentry
- Ansible
- Linting, PyTest
Чтобы получить «Командный игрок», нужно открыть:
- DALI
- Catalyst/Lightning
- DVC
- ClearML
Чтобы получить «Алхимик», нужно открыть:
- ONNX, TRT, JIT
Чтобы получить «На все руки мастер», нужно открыть:
- Face Recognition
- Segmentation
- Detection
- OCR
Чтобы получить «Быстрее ветра», нужно открыть:
- Quantization
- Distillation, Pruning
- Ansible
- Linting, PyTest
Чтобы получить «Укротитель толпы», нужно открыть:
- Toloka
Чтобы получить «Гуру постпроцессинга», нужно открыть:
- Segmentation
- Classic CV
Решать задачу классификации с большим количеством классов: будь то люди, животные или товары на полках в магазине
Чтобы получить «Супермен», нужно получить все ачивки
Программа курса
Detailed schedule
27.12 (вт)
18:00 МСК
27.12 (вт)
18:00 МСК
Ускорение инференса
Дима Чудаков
Дима расскажет как фьюзить, прунить, дистиллировать и квантовать сети — а также как комбинировать эти подходы.
10.01 (вт)
18:00 МСК
10.01 (вт)
18:00 МСК
Детекция, трекинг
Дима Чудаков
Дима напомнит как устроены детекторы: от RCNN до anchor-free детекторов. И научит решать задачу трекинга объектов.
16.01 (пн)
18:00 МСК
16.01 (пн)
18:00 МСК
Идеальное Резюме
Альбина Хабибулина
Альбина расскажет как правильно покидать предыдущее место работы, представить себя на новом и что происходит на рынке DS сейчас.
17.01 (вт)
18:00 МСК
17.01 (вт)
18:00 МСК
Face Recognition
Андрей Шадриков
Андрей расскажет про метрик лернинг, решения из коробки, вспомнит «классические» методы и поделится советами и трюками.
24.01 (вт)
18:00 МСК
24.01 (вт)
18:00 МСК
Классический CV
Влад Тюшников
Влад расскажет про то как устроены камеры, что такое апертура и экспозиция и как они влияют на изображение, какие есть методы бинаризации, чем полезны морфологические преобразования в вашей работе и как решать задачу детекции через сегментацию.
31.01 (вт)
18:00 МСК
31.01 (вт)
18:00 МСК
OCR
Тимур Фатыхов
Тимур расскажет лекцию про распознавание текста (OCR). Поговорим про известные подходы и разберем самый популярный из них поподробнее.
07.02 (вт)
18:00 МСК
07.02 (вт)
18:00 МСК
GAN
Дмитрий Чудаков
Дима расскажет как устроен данный подход обучения и разберет несколько популярных архитектур: StyleGAN, CycleGAN, ESRGAN.
14.02 (вт)
18:00 МСК
14.02 (вт)
18:00 МСК
Диффузионные модели
Кирам Аль-Харба
Кирам из mannequin.com расскажет про диффузионные модели: как их учат, как адаптируют под задачи inpainting и super-resolution и как устроены нашумевшие DALL-E2, Imagen и Stable Diffusion.