MLOps: навыки машинного обучения для потоковых данных и распределенной среды

Курсы

Программирование
MS SQL Server Developer Java Developer. Professional Highload Architect C++ Developer. Basic Специализация C++ Developer C++ Developer. Professional HTML/CSS Kotlin Developer. Basic VR/AR - разработчик Microservice Architecture Software Architect PostgreSQL для администраторов баз данных и разработчиков PHP Developer. Professional Web-разработчик на Python Agile Project Manager Unity Game Developer. Professional C# Developer Flutter Mobile Developer Python Developer. Basic Python Developer. Professional Базы данных iOS Developer. Professional React.js Developer Scala-разработчик Специализация iOS Разработчик программных роботов (RPA) на базе UiPath и PIX Kotlin Backend Developer Node.js Developer Symfony Framework PHP Developer. Basic Буткемп Java Groovy Developer
Специализации Курсы в разработке Подготовительные курсы Подписка
+7 499 938-92-02
Курс переработан
Партнер курса
логотип партнера
Курс переработан

MLOps

Практический курс по инструментам и технологиям работы с большими данными.

Длительность обучения:

5 месяцев

4 ак. часа в нед.

Формат:

Online

Начало занятий:

29 ноября

Дни занятий:

Вт 20:00, Чт 20:00

Что даст вам этот курс

Данный курс даст вам понимание того, как устроен процесс внедрения ML-решения от идеи до вывода его в прод. Преподаватели поделятся лучшими практиками и инструментами MLOps, которые устоялись в современной индустрии.

Каждый модуль вы будете закреплять на практике, выполняя домашнее задание. В конце обучения вас ждет финальный проект, который позволит обобщить все полученные знания и пополнить портфолио. Он может быть выполнен в рамках рабочих задач на вашем датасете или быть учебным проектом, основанным на данных, предоставляемых OTUS.

Для кого этот курс?

Для специалистов по Машинному обучению или Software инженеров, которые хотят научиться использовать современные инструменты MLOps для развертывания их решений в проде.

Для обучения вам понадобятся базовые навыки работы с данными. Предлагаем посмотреть Карту курсов направления Data Science в OTUS, чтобы сориентироваться в необходимом уровне подготовки.

Вы научитесь:

  • Использовать стандартные инструменты ML-конвейеров в распределенной среде;
  • Разрабатывать собственные блоки для ML-конвейеров;
  • Адаптировать ML-алгоритмы к распределенной среде и инструментам big data;
  • Использовать Spark, SparkML, Spark Streaming;
  • Разрабатывать алгоритмы потоковой подготовки данных для машинного обучения;
  • Обеспечивать контроль качества на всех этапах движения ML-решений в промышленную эксплуатацию;
  • Использовать инструменты Kubernetes и Docker для развертывания ML-решений в проде.

Востребованность специалистов

Один из главных трендов в современном мире - автоматизация процессов обучения и валидации, которая, в некотором роде обесценивает работу классического Data Scientist. Все движется к тому, что даже неспециалист сможет сделать fit-predict. Поэтому уже сейчас в цене те, кто имеют хотя бы поверхностные инженерные навыки.

Особенности курса

 

Много практики работы с данными

Практика в Yandex Cloud: отработаете практические навыки на виртуальных стендах и освоите работу с одной из популярных российских облачных платформ

Широкий спектр навыков от распределенного ML и потоковой обработки данных до вывода в продакшн

Актуальные инструменты и технологии: Kubernetes, Spark, Python, Docker

Живое общение с экспертами на вебинарах и в чате Slack

Преподаватели

Павел Филонов
Ex-Data Science Manager в Kaspersky
Данила Слепов
Дмитрий Бугайченко
Управляющий директор в Сбербанке
Фаррух Кушназаров
Ping'an- iTutorGroup, Sr. Data Scientist
Александр Миленькин
Максим Мигутин
Андрей Канашов
Senior Data Scientist в OZON
Вадим Заигрин
Ведущий эксперт по технологиям, Сбербанк
Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital
Занимается развитием Data Science команды, которая предоставляет для продуктов и сервисов компании функционал на основе машинного обучения.

В роли Data Scientist участвовал в разработке Kaspersky MLAD и MDR AI Analyst.

В роли разработчика C++ участвовал в создании MaxPatrol SIEM.

В течение многих лет преподает computer science дисциплины в МГТУ ГА.

Автор серии докладов про ML, С++, управление DS проектами и развитии команды. Член ПК конференции C++ Russia.

Руководитель программы
Проектирует AI-системы, разрабатывает архитектуру MLOps платформ,
помогает создавать инструменты и налаживать процессы для Data Scientist-ов и аналитиков.

С 2002 года выводил на рынок и развивал IT/Telecom решения в международных компаниях:
IPG-Photonics (ИРЭ-Полюс), Ciena, Т-Платформы, Netcracker, Huawei, Glowbyte. Опыт дизайна и разработки новых продуктов, технической поддержки продаж, управления сложными IT-проектами в крупных компаниях и стартапах.

Консультировал финансовые организации, страховые компании, ритейл по вопросам методологии разработки и внедрения продуктов на базе моделей машинного обучения.

MLE-консультант InterX
Физтех с красным дипломом
Обладатель сертификатов ITIL и Certified Integrator Secure Cloud Services

Преподаватель
Специалист по работе с большими данными и машинному обучению. В течение 8 лет работал в «Одноклассники.ru». Руководил командой OK Data Lab (лаборатория для исследователей в области big data и machine learning).

Анализ больших данных в Одноклассниках стал уникальным шансом совместить теоретическую подготовку и научный фундамент с разработкой реальных, востребованных продуктов. С 2019 года работает в Сбербанке на должности управляющего директора. Выступает в роли лидера кластера разработки платформы рекомендательных систем дивизиона массовой персонализации.

Окончил Санкт-Петербургский государственный университет в 2004 году, там же защитил кандидатскую по формально-логическим методам в 2007. Почти 9 лет проработал в аутсорсинге, не теряя контакта с университетом и научной средой.

Преподаватель
- к.т.н. по направлению Мат.моделирование и комплекс программ;
- 10+ лет опыта работы в сфере ИТ;
- 5+ лет опыта в проектах машинного обучения, глубокого обучения и искусственного интеллекта в различных областях;
- более 2-х лет педагогического опыта;
- 10+ научных публикаций.

Преподаватель
Старший менеджер по работе с большими данными в X5 Retail Group.
Ранее старший аналитик в Асна, data scientist в Gero и биоинформатик в Insilico Medicine.

Около 6 лет в IT. Выпускник МФТИ.

Преподаватель
Более 5-ти лет опыта в индустрии Данных & Аналитики в роли внешнего консультанта (IBM) и in-house лидера Data Engineering и Data Science-проектов (Альфа-Банк, Yum! Brands).
Сферы интересов: построение end-to-end аналитических систем, внедрение инструментов Машинного обучения в промышленную эксплуатацию, Рекомендательные системы, MPP-базы данных.
Образование: МГУ им. Ломоносова, математическая кафедра Экономического факультета

Работает в лидирующем российском маркетплейсе OZON. Занимался задачами с использованием как классического Machine Learning, так и Deep Learning алгоритмов с использованием нейронных сетей в задачах NLP и CV, а также проведением различных аналитических исследований:

- Задачи NLP (Topic Modeling, NER) и CV (face detection, instance segmentation, semantic segmentation, age/gender classification) для анализа социальных сетей
- Кластерный анализ целевых аудитории (clustering)
- Прогнозирование бизнес-метрик (classical ML)
- Аудиторное профилирование и персонализация рекламы

Самостоятельно занимался изучением Machine Learning. Знает, что нужно для освоения новой профессии и какие при этом возникают вопросы.

Последние несколько лет работаю с большими данными как разработчик, Data Engineer и Data Scientist. Проекты в банках, телеком и розничных компаниях. Опыт работы с Hadoop (Cloudera, Hortonworks), MPP-системами (Teradata, Vertica), фреймворком Spark и Google Cloud Platform. Большой опыт в IT-инфраструктуре. Поработав и как Data Scientist, и как Data Engineer, понимаю, что без Data Engineer'а Data Scientist'у делать нечего.

Место работы: Сбербанк. Управление развития Корпоративной аналитической платформы. Ведущий эксперт по технологиям.

Образование: МИЭМ, специальность: прикладная математика.

Otus Certified Educator

20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Павел
Филонов
Данила
Слепов
Дмитрий
Бугайченко
Фаррух
Кушназаров
Александр
Миленькин
Максим
Мигутин
Андрей
Канашов
Вадим
Заигрин
Анатолий
Бурнашев

Преподаватели

Павел Филонов
Ex-Data Science Manager в Kaspersky
Занимается развитием Data Science команды, которая предоставляет для продуктов и сервисов компании функционал на основе машинного обучения.

В роли Data Scientist участвовал в разработке Kaspersky MLAD и MDR AI Analyst.

В роли разработчика C++ участвовал в создании MaxPatrol SIEM.

В течение многих лет преподает computer science дисциплины в МГТУ ГА.

Автор серии докладов про ML, С++, управление DS проектами и развитии команды. Член ПК конференции C++ Russia.

Руководитель программы
Данила Слепов
Проектирует AI-системы, разрабатывает архитектуру MLOps платформ,
помогает создавать инструменты и налаживать процессы для Data Scientist-ов и аналитиков.

С 2002 года выводил на рынок и развивал IT/Telecom решения в международных компаниях:
IPG-Photonics (ИРЭ-Полюс), Ciena, Т-Платформы, Netcracker, Huawei, Glowbyte. Опыт дизайна и разработки новых продуктов, технической поддержки продаж, управления сложными IT-проектами в крупных компаниях и стартапах.

Консультировал финансовые организации, страховые компании, ритейл по вопросам методологии разработки и внедрения продуктов на базе моделей машинного обучения.

MLE-консультант InterX
Физтех с красным дипломом
Обладатель сертификатов ITIL и Certified Integrator Secure Cloud Services

Преподаватель
Дмитрий Бугайченко
Управляющий директор в Сбербанке
Специалист по работе с большими данными и машинному обучению. В течение 8 лет работал в «Одноклассники.ru». Руководил командой OK Data Lab (лаборатория для исследователей в области big data и machine learning).

Анализ больших данных в Одноклассниках стал уникальным шансом совместить теоретическую подготовку и научный фундамент с разработкой реальных, востребованных продуктов. С 2019 года работает в Сбербанке на должности управляющего директора. Выступает в роли лидера кластера разработки платформы рекомендательных систем дивизиона массовой персонализации.

Окончил Санкт-Петербургский государственный университет в 2004 году, там же защитил кандидатскую по формально-логическим методам в 2007. Почти 9 лет проработал в аутсорсинге, не теряя контакта с университетом и научной средой.

Преподаватель
Фаррух Кушназаров
Ping'an- iTutorGroup, Sr. Data Scientist
- к.т.н. по направлению Мат.моделирование и комплекс программ;
- 10+ лет опыта работы в сфере ИТ;
- 5+ лет опыта в проектах машинного обучения, глубокого обучения и искусственного интеллекта в различных областях;
- более 2-х лет педагогического опыта;
- 10+ научных публикаций.

Преподаватель
Александр Миленькин
Старший менеджер по работе с большими данными в X5 Retail Group.
Ранее старший аналитик в Асна, data scientist в Gero и биоинформатик в Insilico Medicine.

Около 6 лет в IT. Выпускник МФТИ.

Преподаватель
Максим Мигутин
Более 5-ти лет опыта в индустрии Данных & Аналитики в роли внешнего консультанта (IBM) и in-house лидера Data Engineering и Data Science-проектов (Альфа-Банк, Yum! Brands).
Сферы интересов: построение end-to-end аналитических систем, внедрение инструментов Машинного обучения в промышленную эксплуатацию, Рекомендательные системы, MPP-базы данных.
Образование: МГУ им. Ломоносова, математическая кафедра Экономического факультета

Андрей Канашов
Senior Data Scientist в OZON
Работает в лидирующем российском маркетплейсе OZON. Занимался задачами с использованием как классического Machine Learning, так и Deep Learning алгоритмов с использованием нейронных сетей в задачах NLP и CV, а также проведением различных аналитических исследований:

- Задачи NLP (Topic Modeling, NER) и CV (face detection, instance segmentation, semantic segmentation, age/gender classification) для анализа социальных сетей
- Кластерный анализ целевых аудитории (clustering)
- Прогнозирование бизнес-метрик (classical ML)
- Аудиторное профилирование и персонализация рекламы

Самостоятельно занимался изучением Machine Learning. Знает, что нужно для освоения новой профессии и какие при этом возникают вопросы.

Вадим Заигрин
Ведущий эксперт по технологиям, Сбербанк
Последние несколько лет работаю с большими данными как разработчик, Data Engineer и Data Scientist. Проекты в банках, телеком и розничных компаниях. Опыт работы с Hadoop (Cloudera, Hortonworks), MPP-системами (Teradata, Vertica), фреймворком Spark и Google Cloud Platform. Большой опыт в IT-инфраструктуре. Поработав и как Data Scientist, и как Data Engineer, понимаю, что без Data Engineer'а Data Scientist'у делать нечего.

Место работы: Сбербанк. Управление развития Корпоративной аналитической платформы. Ведущий эксперт по технологиям.

Образование: МИЭМ, специальность: прикладная математика.

Otus Certified Educator

Анатолий Бурнашев
Эксперт Центра практик обеспечения надёжности в MTS.Digital
20+ лет на проектах заказной разработки в ИТ.
Десятки успешных проектов, в том числе - по государственным контрактам.
Опыт разработки и внедрения ERP-систем, open-source решений, поддержка высоконагруженных приложений.
Преподаватель курсов по Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, а так же наставник курса HighLoad

Отзывы

Павел
Кравченя
Я преподаю дисциплины Computer Science и Machine Learning в вузе. С целью углубить знания в области практического применения методов машинного обучения, я решил пройти курс «MLOps».

Курс очень насыщенный, рассматривается большое число тем, связанных как с методами анализа данных, так и со способами вывода их в прод. При этом уделяется внимание не только инженерным навыкам, но и комплексному подходу к решению задач, затрагивающему особенности их постановки с точки зрения бизнеса, интерпретации и анализа полученного решения, проведения A/B-тестирования.

На курсе рассмотрена как работа с большими данными, так и методы анализа данных небольшого объема. Большое внимание уделяется современным инструментам дата-аналитиков и дата-инженеров, преподаватели делятся своим опытом их применения на практике.

При всех преимуществах курса, я не могу обойти стороной недостатки:
1. Некоторые домашние задания не совсем ясно сформулированы, требовалось обращаться за разъяснениями. Складывается впечатление, что задания и лекции готовили специалисты, которые не общались друг с другом. Следовало бы сделать преемственность заданий, когда новая задача опирается на результаты предыдущей.

2. Курсы OTUS позиционируются как имеющие тесную связь с индустрией. Логично ожидать, что студентам в качестве выпускных проектов предложат задачи от партнеров в такой же постановке, с которой сталкиваются их сотрудники, чтобы получить представление о востребованных задачах, специфических требованиях к ним и «подводных камнях». Такая задача на курсе была только одна.

3. На защите выпускных проектов, согласно обещаниям организаторов, можно получить рекомендации экспертов. Но на нашей защите присутствовал только руководитель курса. Было бы логично пригласить нескольких специалистов, чтобы оценить работы комплексно, с позиций навыков тех, кто решает подобные задачи ежедневно.

Несмотря на недостатки, я положительно оцениваю курс. Он помог мне структурировать имеющиеся знания, приобрести новые и познакомиться с серьезными специалистами. Все вопросы можно обсудить с преподавателями в Slack, даже после курса. Выражаю благодарность преподавателям и организаторам за полезный курс и всестороннюю поддержку!
Читать целиком
Павел
Кравченя
Я преподаю дисциплины Computer Science и Machine Learning в вузе. С целью углубить знания в области практического применения методов машинного обучения, я решил пройти курс «MLOps».

Курс очень насыщенный, рассматривается большое число тем, связанных как с методами анализа данных, так и со способами вывода их в прод. При этом уделяется внимание не только инженерным навыкам, но и комплексному подходу к решению задач, затрагивающему особенности их постановки с точки зрения бизнеса, интерпретации и анализа полученного решения, проведения A/B-тестирования.

На курсе рассмотрена как работа с большими данными, так и методы анализа данных небольшого объема. Большое внимание уделяется современным инструментам дата-аналитиков и дата-инженеров, преподаватели делятся своим опытом их применения на практике.

При всех преимуществах курса, я не могу обойти стороной недостатки:
1. Некоторые домашние задания не совсем ясно сформулированы, требовалось обращаться за разъяснениями. Складывается впечатление, что задания и лекции готовили специалисты, которые не общались друг с другом. Следовало бы сделать преемственность заданий, когда новая задача опирается на результаты предыдущей.

2. Курсы OTUS позиционируются как имеющие тесную связь с индустрией. Логично ожидать, что студентам в качестве выпускных проектов предложат задачи от партнеров в такой же постановке, с которой сталкиваются их сотрудники, чтобы получить представление о востребованных задачах, специфических требованиях к ним и «подводных камнях». Такая задача на курсе была только одна.

3. На защите выпускных проектов, согласно обещаниям организаторов, можно получить рекомендации экспертов. Но на нашей защите присутствовал только руководитель курса. Было бы логично пригласить нескольких специалистов, чтобы оценить работы комплексно, с позиций навыков тех, кто решает подобные задачи ежедневно.

Несмотря на недостатки, я положительно оцениваю курс. Он помог мне структурировать имеющиеся знания, приобрести новые и познакомиться с серьезными специалистами. Все вопросы можно обсудить с преподавателями в Slack, даже после курса. Выражаю благодарность преподавателям и организаторам за полезный курс и всестороннюю поддержку!
Читать целиком

Необходимые знания

Программирование:

  - опыт разработки на python;
  - построение веб-сервисов на python.

ML:

  - понимание терминологии машинного обучения;
  - опыт использования python для решения задач ML.

Технологии:

  - Linux;
  - Docker;
  - Git.
Корпоративное обучение для ваших сотрудников
>
Программа обучения
В процессе обучения вы получите комплексные знания и навыки.
C 29 ноября
Тема 1. Вводное занятие
Тема 2. Цели и метрики ML проектов
Тема 3. Организация исходного кода
Тема 4. Взаимодействие с командой
Тема 5. Практика. Формирование процессов команды
C 20 декабря
Тема 6. Облачные провайдеры
Тема 7. Базовые блоки инфраструктуры
Тема 8. Собственная инфраструктура
Тема 9. Хранение кода и CI/CD
Тема 10. Практика. Настройка облачной инфраструктуры
Тема 11. Биллинг и Identity and Access Management
C 10 января
Тема 12. Выбор хранилища. HDFS/S3/DataBase/etc
Тема 13. Сбор данных по расписанию. AirFlow
Тема 14. Сбор данных на потоке. Kafka
Тема 15. Валидация данных
Тема 16. Обнаружение сдвигов в данных
Тема 17. Подготовка и обогащение данных
Тема 18. Извлечение признаков
Тема 19. Версионирование данных. DVC
Тема 20. Практика. Конвейер подготовки данных
C 9 февраля
Тема 21. Воспроизводимость и версионирование. MLFlow
Тема 22. Перенос ML алгоритмов в распределенную среду
Тема 23. Популярные фреймворки в распределенной среде
Тема 24. Подбор гиперпараметров и AutoML
Тема 25. Практика. Регулярное переобучение
C 28 февраля
Тема 26. Стратегии валидации моделей
Тема 27. Анализ моделей
Тема 28. Интерпретируемость
Тема 29. A/B-тестирование
Тема 30. Практика. Автоматическая валидация
C 16 марта
Тема 31. Пакетный режим работы
Тема 32. Асинхронный потоковый режим
Тема 33. Синхронный режим
Тема 34. Подготовка артефактов
Тема 35. Развертывание в k8s
Тема 36. Обновление моделей
C 6 апреля
Тема 37. Инструменты и метрики. Prometheus
Тема 38. Поиск отклонений и сдвигов в данных
Тема 39. Построение обратной петли
Тема 40. Алертинг
C 20 апреля
Тема 41. Выбор темы и организация проектной работы
Тема 42. Консультация по проектам и домашним заданиям
Тема 43. Защита проектных работ
Скачать подробную программу
Выпускной проект
Выпускной проект — возможность закрепить навыки, наработанные в процессе обучения. Вам на выбор будет предоставлено 2 варианта:
  • взять свою задачу и свои данные;

  • разработать и развернуть на Spark рекомендательную систему.

Процесс обучения

Всё обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Слаке курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары идут дважды в неделю по 2 академических часа (то есть астрономических 1,5 часа). Все вебинары сохраняются и в записи в вашем личном кабинете. Домашнее задание выдается в среднем по 1 на модуль.
Получить консультацию
Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы


  • получите материалы по всем занятиям (видеозаписи занятий, презентации, примеры кодов);

  • научитесь работать с большими данными в продакшне;

  • сможете использовать Spark, SparkML, Spark Streaming;

  • научитесь адаптировать ML-алгоритмы к распределенной среде и инструментам big data;

  • получите сертификат об окончании курса;

  • получите приглашение пройти собеседование в компаниях-партнерах (в случае успешного обучения на курсе).

Дата выдачи сертификата: 3 июня 2023 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «MLOps»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «MLOps»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Прошедшие открытые вебинары
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Мониторинг моделей машинного обучения в MLFlow
Александр Миленькин
День открытых дверей
1 декабря 2021 года в 20:00
Для доступа к прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на e-mail, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Партнеры ждут выпускников этого курса

Стоимость обучения
Cтоимость указана для оплаты физическими лицами
85 000 ₽
Продолжительность
5 месяцев
Начало занятий
29 ноября