Специальная цена
Продвинутые ML приемы для Data Scientists, желающих повысить свой профессиональный уровень до Middle+
27 февраля
Advanced
6 месяцев
Онлайн
Вт/Пт 20:00 Мск
Пройдите короткий тест, который проверяет ваше знание пререквизитов, а именно математики и питона, которые понадобятся вам на курсе

Middle+/Senior Machine Learning Engineer (ML Engineer)
Middle+/Senior Data Scientist
Общение с преподавателями на вебинарах, переписки в закрытом телеграм-чате, развёрнутые ответы при проверке домашних заданий
Нейросетевые языковые модели и практические методы применения LLM и фундаментальных моделей.
Тема 1: Нейросетевые языковые модели и стратегии генерации текста
Тема 2: Машинный перевод и seq2seq
Тема 3: Архитектура Transformer и концепция attention mechanism
Тема 4: Transfer learning; BERT model
Тема 5: Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 6: Towards ChatGPT
Тема 7: Теория промптинга LLM
Тема 8: Sentence-transformers
Тема 9: Langchain
Тема 10: RAG - генерация на основе базы знаний
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Тема 4: Прогнозирование временных рядов
Тема 5: Поиск аномалий во временных рядах
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Введение в теорию рекомендательных систем и их практическое применение
Тема 2: Проблема холодного старта. Метод поиска ближайших соседей
Тема 3: SVD и ALS алгоритмы
Тема 4: Практическое занятие по рекомендательным системам. Двухуровневая модель
Тема 5: Обзор нейросетевых моделей
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Практическое занятие по логит-регрессии
Тема 7: Байесовская сеть доверия: практическое занятие
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Deep Q-Network (DQN) алгоритм
Тема 10: Deep Policy Gradient (PG) алгоритм
Тема 11: Actor-Critic алгоритм
Модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: REST-архитектура: Flask API
Тема 3: Docker: Структура, применение, деплой
Тема 4: Сети и Docker compose
Тема 5: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Тема 6: Колоночные БД и объектные хранилища
Тема 7: Версионирование данных. DVC
Тема 8: Воспроизводимость и версионирование. MLFlow
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 2: Advanced Data Preprocessing. Categorical Encodings
Тема 3: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 4: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 5: Поиск нечетких дублей
Тема 6: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Предзащита проектных работ №1
Тема 3: Предзащита проектный работ №2
Тема 4: Защита проектных работ
Студенты выбирают темы выпускных проектов сами, а не работают по шаблонным заготовкам. Все выпускные проекты на курсе это ценные исследования для ML. Вот некоторые из них:
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
OTUS осуществляет лицензированную образовательную деятельность. Вы получите сертификат о прохождении обучения, а также можете получить удостоверение о повышении квалификации.
Удостоверение о повышении квалификации: если вы успешно защитили выпускной проект и готовы предоставить копию документа о высшем или среднем профессиональном образовании
Доступ к учебным материалам курса
Ваш личный проект, который поможет проходить собеседования
Стоимость в рассрочку со скидкой