Machine Learning. Advanced
Продвинутые приемы для практикующих
Data Scientists
27 октября
Advanced
5 месяцев
Онлайн
Вт/Пт 20:00 Мск
Для кого этот курс?
- Для аналитиков, освоите методы машиного обучения и нучитесь строить прогнозы
- Для программистов, получите опыт построения end-to-end пайплайнов и выводы в production
- Для Data Scientists, курс расширит ваши возможности и поможет продвинуться дальше по карьерному пути
Сравнение с курсом Machine Learning. Professional
Необходимые знания
- Python на уровне «писал свои небольшие проекты»
- Знакомство с экосистемой для машинного обучения (pandas, numpy, sklearn)
- Знание и понимание базовых принципов и алгоритмов машинного обучения
- Знание математического анализа (вычисление производных сложных функций)
- Знание линейной алгебры (матричные операции и собственные вектора)
- Знание теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений).

Что даст вам этот курс?
Вы освоите такие продвинутые темы как Байесовские методы и обучение с подкреплением, освоив как теоретическую часть, так и их применение на реальных кейсах.
Отдельный модуль посвящен работе в production: настройке окружения, оптимизации кода, построению end-to-end пайплайнов и внедрению решений.
Карта курсов направления Data Science в OTUS
После прохождения курса вы сможете:
- Настраивать окружение и писать production код, готовый к внедрению
- Работать с AutoML подходами и понимать ограничения в их применении
- Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
- Решать нестандартные задачи, связанные с рекомендательными системами, временными рядами и графами
Live coding
Почти каждый вебинар курса проходит в формате Live coding, где преподаватель начинает с «чистого листа» — пустого Jupyter ноутбука, имея на руках лишь задачу и набор данных. Мы программируем, ошибаемся, обсуждаем, исправляем ошибки и получаем решение с нуля, чтобы вы видели реальный процесс работы с данными, а не стерильные готовые ноутбуки.
Процесс обучения
Трудоустройство
- Получите помощь с оформлением резюме, портфолио и сопроводительного письма
- Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
ML engineer
Работодатели курса
Интерактивные вебинары
2 занятия по 2 ак. часа в неделю. Доступ к записям и материалам остается у вас навсегда.Практика
Домашние задания + проектная работа, которая усилит ваше портфолио.
Активное комьюнити
Курс сопровождается чатом в Telegram для общения преподавателей и студентов.
Программа
Advanced Machine Learning. AutoML
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 3: Advanced Data Preprocessing. Categorical Encodings
Тема 4: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 5: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 6: Поиск нечетких дублей
Тема 7: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Production
Второй модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: REST-архитектура: Flask API
Тема 2: Docker: Структура, применение, деплой
Тема 3: Kubernetes, контейнерная оркестрация
Тема 4: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Временные ряды
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Рекомендательные системы. Задача ранжирования
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Рекомендательные системы 1. Explicit feedback
Тема 2: Рекомендательные системы 2. Implicit feedback
Тема 3: Задача ранжирования - Learning to rank
Тема 4: Практическое занятие по рекомендательным системам. Surpsise!
Тема 5: Q&A
Графы
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification
Тема 4: Практическое занятие: Хейтеры в Twitter
Bayesian Learning, PyMC
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Байесовская сеть доверия: практическое занятие
Тема 7: Практическое занятие по логит-регрессии
Reinforcement Learning
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Q&A
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Бонус: Поиск Data Science работы
Тема 3: Предзащита проектных работ №1
Тема 4: Предзащита проектный работ №2
Тема 5: Защита проектных работ
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Проектная работа
Мы стремимся, чтобы студенты самостоятельно выбирали темы для выпускных проектов, а не работали по шаблонным заготовкам. В результате все работы получаются уникальными исследовательскими проектами по машинному обучению, о которых с большим интересом можно рассказывать во время собеседований или даже публиковать статьи.
Например:Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Ближайшие мероприятия
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Результаты: Вы поймете когда необходимы пайплайны и как они формируются. Изучите применение стандартных модулей sklearn для формирования пайплайнов и их визуализации.
Кому подходит этот урок:
- IT-специалистам которые хотят освоить продвинутые методы ML и поддержки моделей в продакшен;
- Дата-сайентистам, желающим углубиться в профессию и получить продвижение в команде;
- Тем кто самостоятельно изучает Data Science и настраивается на серьезную работу в этой области.
- Какие преимущества дают Байесовские A/B тесты по сравнению с обычными (интерпретируемость, эффективность и другие)
- Как проводить Байесовские A/B тесты
- Как работать с Байесовскми моделями в PyMC3
Кому подходит этот урок:
- Начинающим и продолжающим специалистам в области аналитики данных или аналитики продукта
- Тем, кто уже знаком с A/B тестированием, но хочет углубить свои знания
Результат урока:
- Познакомитесь с основами A/B тестирования
- Научитесь делать дизайн эксперимента для A/B теста
- Узнаете как определить, что тест шел достаточно времени
- Познакомитесь с критериями принятия решения по эксперименту
- Получите новый, простой и эффективный инструмент для A/B тестирования
Прошедшие
мероприятия
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Корпоративное обучение для ваших сотрудников
- Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
- Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
- OTUS проверяет знания студентов перед стартом обучения и после его завершения
- Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
- Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
- OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год
Отзывы
Сертификат о прохождении курса
OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS.

После обучения вы:
- Получите материалы по пройденным занятиям (видеозаписи курса, дoполнительные материалы, финальный проект для добавления в портфолио)
- Повысите свою ценность и конкурентоспособность как IT-специалист
Machine Learning. Advanced
Стоимость в рассрочку
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно