Machine Learning. Advanced

Продвинутые приемы для практикующих
Data Scientists

27 октября

Advanced

5 месяцев

Онлайн

Вт/Пт 20:00 Мск

Для кого этот курс?

  • Для аналитиков, освоите методы машиного обучения и нучитесь строить прогнозы
  • Для программистов, получите опыт построения end-to-end пайплайнов и выводы в production
  • Для Data Scientists, курс расширит ваши возможности и поможет продвинуться дальше по карьерному пути

Сравнение с курсом Machine Learning. Professional

Необходимые знания

  • Python на уровне «писал свои небольшие проекты»
  • Знакомство с экосистемой для машинного обучения (pandas, numpy, sklearn)
  • Знание и понимание базовых принципов и алгоритмов машинного обучения
  • Знание математического анализа (вычисление производных сложных функций)
  • Знание линейной алгебры (матричные операции и собственные вектора)
  • Знание теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений).

 

При поддержке
логотип партнера

Что даст вам этот курс?

Вы освоите продвинутые методы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle/ Senior позициях и справляться с нестандартными задачами.

Вы освоите такие продвинутые темы как Байесовские методы и обучение с подкреплением, освоив как теоретическую часть, так и их применение на реальных кейсах.

Отдельный модуль посвящен работе в production: настройке окружения, оптимизации кода, построению end-to-end пайплайнов и внедрению решений.

Карта курсов направления Data Science в OTUS

После прохождения курса вы сможете:

  • Настраивать окружение и писать production код, готовый к внедрению
  • Работать с AutoML подходами и понимать ограничения в их применении
  • Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
  • Решать нестандартные задачи, связанные с рекомендательными системами, временными рядами и графами

Live coding


Почти каждый вебинар курса проходит в формате Live coding, где преподаватель начинает с «чистого листа» — пустого Jupyter ноутбука, имея на руках лишь задачу и набор данных. Мы программируем, ошибаемся, обсуждаем, исправляем ошибки и получаем решение с нуля, чтобы вы видели реальный процесс работы с данными, а не стерильные готовые ноутбуки.

Процесс обучения

Обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя. Вебинары проводятся 2 раза в неделю по 2 ак. часа и сохраняются в записи в личном кабинете. Вы можете посмотреть их в любое удобное для вас время. В ходе обучения вы будете выполнять домашние задания. Каждое из них посвящено одному из компонентов вашего выпускного проекта. После выполнения всех домашних заданий вы получите готовый выпускной проект.

Трудоустройство

  • Получите помощь с оформлением резюме, портфолио и сопроводительного письма
  • Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров

ML engineer

Перспективы направления
Средний уровень зарплат в Москве:
100 000Junior+ специалист
200 000Middle+ специалист
350 000Senior специалист
1580
актуальных вакансий

Работодатели курса

Формат обучения

Интерактивные вебинары

2 занятия по 2 ак. часа в неделю. Доступ к записям и материалам остается у вас навсегда.

Практика


Домашние задания + проектная работа, которая усилит ваше портфолио.

Активное комьюнити

Курс сопровождается чатом в Telegram для общения преподавателей и студентов.

Программа

Advanced Machine Learning. AutoML

В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.

Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury

Тема 2: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas

Тема 3: Advanced Data Preprocessing. Categorical Encodings

Тема 4: Featuretools - а вы что, за меня и признаки придумывать будете?

Тема 5: H2O и TPOT - а вы что, за меня и модели строить будете?

Тема 6: Поиск нечетких дублей

Тема 7: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей

Production

Второй модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.

Тема 1: REST-архитектура: Flask API

Тема 2: Docker: Структура, применение, деплой

Тема 3: Kubernetes, контейнерная оркестрация

Тема 4: Практическое занятие по работе в проде: деплой докера в Yandex Cloud

Временные ряды

Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.

Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh

Тема 2: Unsupervised подходы: Кластеризация временных рядов

Тема 3: Unsupervised подходы: Сегментация временных рядов

Рекомендательные системы. Задача ранжирования

В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.

Тема 1: Рекомендательные системы 1. Explicit feedback

Тема 2: Рекомендательные системы 2. Implicit feedback

Тема 3: Задача ранжирования - Learning to rank

Тема 4: Практическое занятие по рекомендательным системам. Surpsise!

Тема 5: Q&A

Графы

В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.

Тема 1: Введение в графы: основные понятия. NetworkX, Stellar

Тема 2: Анализ графов и интерпретация. Community Detection

Тема 3: Link Prediction и Node Classification

Тема 4: Практическое занятие: Хейтеры в Twitter

Bayesian Learning, PyMC

В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.

Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование

Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings

Тема 3: Байесовское АB-тестирование

Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов

Тема 5: Практическое занятие по GLM

Тема 6: Байесовская сеть доверия: практическое занятие

Тема 7: Практическое занятие по логит-регрессии

Reinforcement Learning

Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.

Тема 1: Введение в обучение с подкреплением

Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой

Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация

Тема 4: Markov Decision Process, Value function, Bellman equation

Тема 5: Value iteration, Policy iteration

Тема 6: Monte Carlo Methods

Тема 7: Temporal Difference (TD) и Q-learning

Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning

Тема 9: Q&A

Проектная работа

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Выбор темы проекта

Тема 2: Бонус: Поиск Data Science работы

Тема 3: Предзащита проектных работ №1

Тема 4: Предзащита проектный работ №2

Тема 5: Защита проектных работ

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Проектная работа


Мы стремимся, чтобы студенты самостоятельно выбирали темы для выпускных проектов, а не работали по шаблонным заготовкам. В результате все работы получаются уникальными исследовательскими проектами по машинному обучению, о которых с большим интересом можно рассказывать во время собеседований или даже публиковать статьи.

Например:

Преподаватели

Руководитель курса

Мария Тихонова

Senior Data Scientist, преподаватель

SberDevices, ВШЭ

Александр Сизов

Эксперт Machine/Deep learning (к.ф.-м.н.)

Дмитрий Сергеев

Head of R&D

WeatherWell

Андрей Канашов

Senior Data Scientist

BestDoctor

Анатолий Бурнашев

SRE expert

MTS Digital

Виталий Сидоренко

Senior Data Scientist

Магнит

Раиль Сулейманов

Machine Learning Engineer

Garage IT

Максим Бекетов

Аспирант

ФКН ВШЭ

Евгений Романов

Data Scientist

Газпромбанк

Андрей Коняев

Data Scientist (NLP)

2k GmbH - text2knowledge

Валентин Шкулов

Data Scientist

Meson Capital Partners

Игорь Стурейко

Teamlead, главный инженер (к.ф.-м.н.)

НИИгазэкономика

Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания

Ближайшие мероприятия

Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.

Построение эффективных пайплайнов с помощью sklearn
Игорь Стурейко
Вебинар посвящен построению легко масштабируемых пайплайнов для обработки данных и формирования прогноза в несколько строк с помощью модуля piplines из библиотеки sklearn. Вы узнаете, как писать код быстрее и эффективнее, как можно сократить количество кода в 4 раза при решении задачи классификации, а так же как визализировать работу вашего кода. Вы научитесь эффективным подходам, которые позволят вам выделяться на фоне остальных data scientist'ов, которые пишут плохой код.

Результаты: Вы поймете когда необходимы пайплайны и как они формируются. Изучите применение стандартных модулей sklearn для формирования пайплайнов и их визуализации.

Кому подходит этот урок:
- IT-специалистам которые хотят освоить продвинутые методы ML и поддержки моделей в продакшен;
- Дата-сайентистам, желающим углубиться в профессию и получить продвижение в команде;
- Тем кто самостоятельно изучает Data Science и настраивается на серьезную работу в этой области.
...
12 октября в 17:00
Открытый вебинар
Байесовское А/B-тестирование
Максим Бекетов
Вы узнаете:
- Какие преимущества дают Байесовские A/B тесты по сравнению с обычными (интерпретируемость, эффективность и другие)
- Как проводить Байесовские A/B тесты
- Как работать с Байесовскми моделями в PyMC3

Кому подходит этот урок:
- Начинающим и продолжающим специалистам в области аналитики данных или аналитики продукта
- Тем, кто уже знаком с A/B тестированием, но хочет углубить свои знания

Результат урока:
- Познакомитесь с основами A/B тестирования
- Научитесь делать дизайн эксперимента для A/B теста
- Узнаете как определить, что тест шел достаточно времени
- Познакомитесь с критериями принятия решения по эксперименту
- Получите новый, простой и эффективный инструмент для A/B тестирования
...
19 октября в 17:00
Открытый вебинар

Прошедшие
мероприятия

Мария Тихонова
Открытый вебинар
Методы коллаборативной фильтрации для рекомендательных систем: изучаем SVD алгоритм
Борис Цейтлин
Открытый вебинар
Байесовское А/B-тестирование
Для доступа ко всем прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Корпоративное обучение для ваших сотрудников

Отус помогает развивать высокотехнологичные Команды. Почему нам удаётся это делать успешно:
  • Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
  • Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
  • OTUS проверяет знания студентов перед стартом обучения и после его завершения
  • Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
  • Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
  • OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год

Отзывы

Сергей Новожилов

11.11.2020
Учусь в Otus на курсе ML Advanced, доволен очень. Преподают из всех уголков мира, по Zoom, вроде привык уже к удалёнке, но всё равно поражает. - По-настоящему классные специалисты. - Цена курсов разумная. Я когда покупал первый раз, долго и недоверчиво выяснял, как, если что не так, вернуть деньги. На мой взгляд, Отусу было бы выгодно поагрессивнее записывать на курс, потом, после 3-го занятия, скажем, решать вопрос с оплатой, а то на покупку кота в мешке 50к многие не решатся выложить. Сейчас не жалею, буду еще брать курсы у них. Из пожеланий: - получше с записью вебинаров разобраться, чтобы технических сбоев было поменьше, корпоративный Zoom это вроде позволяет

IGOR GARAEV

11.11.2020
Добрый день! курс дал обширные знания и заложил основания в новых областях : байесовского вывода, многоруких бандитов ,A/B тестирования,  временных рядов (кластеризация, вейвлеты, FFT ) и RL.     В постоянно меняющихся условиях бизнеса и новых ограничений(например:GDPR,IOS14 к системе трекинга, новые требования 2022 google к трекингу)  - происходит бурное развитие новых инструментов и подходов в маркетинге и продукте, которые  требует понимания и применения вышеперечисленных тем.      Данный курс под руководством инструктора - позволил  освоить теоретический материал и закрепить его на практике с помощью большого количества показанных примеров и домашних заданий.  Это фундамент позволит мне самостоятельно далее развиваться в данной области и применять на практике в  бизнесе.

Владислав Лещинский

22.12.2021
Ну конечно обогатил копилку знаний. При некоторых нареканиях по форме преподавания, содержательно было хорошо это стало уже понятно когда смотришь на курс целиком. Остались мысли на додумывание в части попробовать применить в работе, а это точно значит, что информация ценная.

Mark Mzhachikh

18.02.2022
Благодарен курсу за то, что узнал о существовании coursera. А если серьезно, то большое спасибо Марии Тихоновой - очень глубокое понимание предметной области + огромный преподавательский талант, просто восторг.

Сертификат о прохождении курса

OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS.

После обучения вы:

  • Получите материалы по пройденным занятиям (видеозаписи курса, дoполнительные материалы, финальный проект для добавления в портфолио)
  • Повысите свою ценность и конкурентоспособность как IT-специалист

Частые вопросы

Что, если в середине курса я не смогу продолжать обучение?
У вас есть право одного бесплатного трансфера в другую группу
Обязательно ли защищать выпускной проект?
Для получения сертификата OTUS необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем.
С какого момента я смогу заниматься трудоустройством?
Получить карьерную консультацию вы сможете уже в начале обучения. Остальные опции: помощь с резюме, добавление резюме в нашу базу специалистов и т.д. будут доступны после окончания обучения.
Я могу вернуть деньги?
Да, вы можете сделать возврат средств пропорционально оставшимся месяцам обучения.