Machine Learning. Advanced
Продвинутые приемы для практикующих
Data Scientists, желающих повысить свой профессиональный уровень до Middle+ /Senior
31 января 2024
Advanced
5 месяцев
Онлайн
Ср/Пт 20:00 Мск
Для кого этот курс?
Для специалистов в области Data Science и машинного обучения, решающих разнообразные исследовательские задачи и проблемы бизнеса: ранжирование, поиск одинаковых товаров, классификация изображений, динамическое ценообразования, оптимизация логистики, прогнозирование торговли и многие другие. Курс даст сложные и широко применимые навыки.
- Для аналитиков, освоите самые продвинутые методы машиного обучения и научитесь строить прогнозы
- Для программистов, получите опыт построения end-to-end пайплайнов и выводы в production
- Для Data Scientists, курс расширит ваши возможности и поможет продвинуться дальше по карьерному пути
Нужен курс для повторения и систематизации знаний?
Начните с Machine Learning Professional
Сравнение с курсом Machine Learning. Professional
Необходимые знания
- Уверенное знание Python
- Знакомство с основными библиотеками машинного обучения (pandas, sklearn, numpy)
- Знание и понимание базовых принципов и алгоритмов машинного обучения
- Знание математического анализа (вычисление производных сложных функций)
- Знание линейной алгебры (матричные операции и собственные вектора)
- Знание теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений).
Подходит ли эта программа именно вам?
Пройдите тест, чтобы определить свой уровень знаний.
Что даст вам этот курс?
Вы освоите такие продвинутые темы как Байесовские методы и обучение с подкреплением, освоив как теоретическую часть, так и их применение на реальных кейсах.
Отдельный модуль посвящен работе в production: настройке окружения, оптимизации кода, построению end-to-end пайплайнов и внедрению решений.
После прохождения курса вы сможете:
- Настраивать окружение и писать production код, готовый к внедрению
- Работать с AutoML подходами и понимать ограничения в их применении
- Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
- Решать нестандартные задачи, связанные с рекомендательными системами, временными рядами и графами
Проекты для портфолио
В течение курса вы выполните несколько проектов для портфолио и научитесь грамотно презентовать результаты своих работ, чтобы проходить собеседования. Для выпускного проекта вы можете взять один из предложенных преподавателем вариантов или реализовать свою идею.
Процесс обучения
Вебинары проводятся 2 раза в неделю по 2 ак. часа и сохраняются в записи в личном кабинете. Вы можете посмотреть их в любое удобное для вас время.
В ходе обучения вы будете выполнять домашние задания. Каждое из них посвящено одному из компонентов вашего выпускного проекта.
После выполнения всех домашних заданий вы получите готовый выпускной проект.
Портфолио
Индивидуальная разработка проектной работыОптимальная нагрузка
Возможность совмещать учебу с работойПерспективы
Сможете претендовать на позицию Data Scientist Middle+ / Senior Трудоустройство
- Получите помощь с оформлением резюме, портфолио и сопроводительного письма
- Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
ML engineer
Работодатели курса
Интерактивные вебинары
2 онлайн-трансляции по 2 ак. часа в неделю. Доступ к записям и материалам остается навсегдаПрактика
Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии
Активное комьюнити
Чат в Telegram для общения преподавателей и студентов
Программа
Production
Второй модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: REST-архитектура: Flask API
Тема 2: Docker: Структура, применение, деплой
Тема 3: Kubernetes, контейнерная оркестрация
Тема 4: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Временные ряды
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Тема 4: Прогнозирование временных рядов
Рекомендательные системы. Задача ранжирования
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Рекомендательные системы на практике.
Тема 2: Проблема холодного старта. Метод поиска ближайших соседей.
Тема 3: SVD и ALS алгоритмы.
Тема 4: Практическое занятие по рекомендательным системам. Двухуровневая модель.
Тема 5: Обзор нейросетевых моделей
Графы
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification
Тема 4: Практическое занятие: Хейтеры в Twitter
Bayesian Learning, PyMC
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Практическое занятие по логит-регрессии
Тема 7: Байесовская сеть доверия: практическое занятие
Reinforcement Learning
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Q&A
Advanced Machine Learning. AutoML
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 3: Advanced Data Preprocessing. Categorical Encodings
Тема 4: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 5: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 6: Поиск нечетких дублей
Тема 7: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Бонус: Поиск Data Science работы
Тема 3: Предзащита проектных работ №1
Тема 4: Предзащита проектный работ №2
Тема 5: Защита проектных работ
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Проектная работа
Мы стремимся, чтобы студенты самостоятельно выбирали темы для выпускных проектов, а не работали по шаблонным заготовкам. В результате все работы получаются уникальными исследовательскими проектами по машинному обучению, о которых с большим интересом можно рассказывать во время собеседований или даже публиковать статьи.
Например:Полученные в итоге артефакты усилят ваше резюме.
Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Ближайшие мероприятия
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Результаты урока:
- Познакомитесь с задачей рекомендательных систем.
- Изучите подходы на основе Sматричнычных разложений для построения рекомендательной системы.
- Примените алгоритмы SVD и ALS на практике
Кому подходит этот урок:
- продвинутым IT-специалистам, практикующим ML
- Дата-сайентистам, желающим углубиться в профессию
- Тем кто самостоятельно изучает Data Science и уже изучил основные методы ML
Прошедшие
мероприятия
Возможность пройти вступительное тестирование повторно появится только через 3 дня
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Корпоративное обучение для ваших сотрудников
- Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
- Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
- OTUS проверяет знания студентов перед стартом обучения и после его завершения
- Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
- Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
- OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год
Отзывы
Сертификат о прохождении курса
OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения курса вы получите сертификат OTUS.

После обучения вы:
- Получите материалы по пройденным занятиям (видеозаписи курса, дoполнительные материалы, финальный проект для добавления в портфолио)
- Создадите своё портфолио проектов, которое поможет при прохождении собеседований
- Повысите свою ценность и конкурентоспособность как IT-специалист
- Получите сертификат об окончании курса
Machine Learning. Advanced
Стоимость в рассрочку
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Пройдите тестирование и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно