Курс переработан

Специализация

Machine Learning

С нуля до Middle ML инженера (Data Scientist) за 12 месяцев

25 апреля

Basic

12 месяцев

Онлайн

Для кого?

Сфера IT: для системных аналитиков, разработчиков, тестировщиков, инженеров

Прочие сферы: для всех специалистов, которые могут и хотят освоить ML

Вы освоите:

  • Python с 0 до качественного уровня
  • ML-библиотеки: pandas, numpy, matplotlib, seaborn, scipy, sklearn
  • Систему управления версиями Git
  • SQL (от простых функций до оконных)
  • A/B тестирование
  • Deep Learning (PyTorch, реккурентные сети и другое)
  • NLP (парсинг и анализ текстовых данныx) 
  • Анализ временных рядов 
  • Рекомендательные системы

Посмотрите записи защит итоговых проектов наших студентов:  
YouTube Machine Learning

Необходимые знания

Специальных знаний не требуется.
Однако базовые знания линейной алгебры, математического анализа, теории вероятностей и математической статистики помогут вам быстрее усваивать программу.

Подходит ли программа именно вам?

Менеджер поможет разобраться! 

Какой результат вы получите?

Обучение состоит из 2х ступеней и интенсива: 1 ступень длится 5,5 месяцев, 2 ступень длится 5,5 месяцев + интенсив продолжительностью 1 месяц

Начало обучения
29 января
  • Для тех, кто хочет с нуля сделать карьеру в направлении Machine Learning
Ступень 1
Пн 20:00, Ср 20:00
Junior
  • Освоите Python для Data Science
  • Вспомните математику и научитесь использовать ее для работы с моделями
  • Сможете строить основные модели машинного обучения
Ступень 2
Вт 20:00, Чт 20:00
Middle
  • Создаете модели машинного обучения, используя базовые и продвинутые приемы ML
  • Можете выполнять полный pipeline работ: от подготовки датасета до анализа результатов и подготовки к production
  • Готовы к решению практических задач по машинному обучению
  • Имеете портфолио проектных работ
  • Умеете обучать нейросети для работы с изображениями и текстами

Мощная теория

У нас преподают кандидаты наук и стараются дать основательную базу для Вашего роста в профессии. 

Классные преподаватели


Мы собрали в команду неравнодушных преподавателей, которые умеет четко и понятно донести информацию. 

Актуальная программа


Курс регулярно обновляется и актуализируется. Вы получите самые востребованные и рабочие фреймворки с пониманием как они применяются в рабочей среде.

Трудоустройство

  • Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
  • Карьерные мероприятия в сообществе
    Публичный разбор резюме
    Публичное прохождение собеседования и воркшопы

Data Scientist

Перспективы направления
Средний уровень зарплат в Москве:
100 000Junior+ специалист
200 000Middle+ специалист
350 000Senior специалист
1580
актуальных вакансий

Работодатели специализции

Формат обучения

Интерактивные вебинары


2 занятия по 2 ак.часа в неделю
Доступ к записям и материалам остается навсегда

Хардкорная практика

Учитесь на реальных датасетах и тренируйтесь строить полные пайплайны работы с данными

Активное комьюнити


Общайтесь с преподавателями голосом на вебинарах и в telegram группе

Групповые менторские консультации

На курсе предусмотрено менторское сопровождение в виде групповых разборов домашних заданий.

 Вы выполняете домашнее задание

Ментор проверяет его в личном кабинете, делает ревью и дает развернутый фидбэк

На занятии ментор отвечает на часто возникающие вопросы, проводит подробный разбор работ студентов и объясняет каждый этап выполнения

С ментором также можно общаться по домашнему заданию в чате. Он даст вам обратную связь по итогам проверки и направит вас в нужное русло 

Программа

Ступень 1. Junior

Вы получите навыки Python, математический фундамент и понимание основных принципов и кейсов ML. И сделаете свою первую проектную работу.

Введение в Python

В данном модуле познакомимся с базовыми структурами данных и операторами Python. Изучим азы работы с shell и git.

Тема 1: Настройка окружения для работы

Тема 2: Базовые типы и структуры данных

Тема 3: Работа с функциями и данными

Тема 4: Управляющие конструкции

Тема 5: Групповая менторская консультация

Введение в Python. ООП, модули, базы данных

В данном модуле познакомимся с ООП в Python, научимся применять основные принципы ООП и разделять на модули.

Тема 1: Git, shell

Тема 2: Основы ООП

Тема 3: Продвинутый ООП, исключения

Тема 4: Продвинутый ООП, продолжение

Тема 5: Модули и импорты

Тема 6: Тесты

Тема 7: Знакомство со встроенными модулями

Тема 8: Файлы и сеть

Тема 9: Практика

Основы Python для ML и работа с базами данных

В данном модуле познакомимся с библиотекой numpy, pandas. Научимся работать с многообразием библиотек визуализации данных в Python.

Тема 1: Основы NumPy

Тема 2: Основы Pandas

Тема 3: Визуализация данных

Тема 4: Практика: Построение датасета для дальнейшего моделирования из сырых данных

Тема 5: Бонус: Обзор про базы данных, SQL и теорию множеств. Таблицы, представления, простые выборки

Тема 6: Бонус: Join, exists, вложенные запросы, group by, having

Тема 7: Бонуc: Оконные функции в SQL, виды и область применения

Теоретический минимум для ML: математика, линал, статистика

В данном модуле вы изучите разделы матричной алгебры для решения систем линейных уравнений и для векторного анализа. Познакомитесь с основными методами оптимизации функций (максимизации/минимизации), также научимся аппроксимировать значение функции, чтобы ускорять вычисления в Python при работе с данными. Научитесь формулировать и тестировать гипотезы, в том числе А/B-тестирование.

Тема 1: Матрицы. Основные понятия и операции

Тема 2: Основы линейной алгебры: базис, отображение

Тема 3: Матричные разложения. Практика в Python

Тема 4: Дифференцирование и оптимизация функций

Тема 5: Практика. Дифференцирование и оптимизация функций

Тема 6: Метод наименьших квадратов

Тема 7: Аксиоматика теории вероятностей. Случайные величины и их свойства

Тема 8: Многомерные случайные величины. ЦПТ. Практика

Тема 9: Основные понятия статистики. Точечные оценки

Тема 10: Проверка гипотез (AБ тестирование)

Тема 11: Исследование зависимостей: номинальные, порядковые и количественные величины

Тема 12: Практика. Исследование зависимостей: номинальные, порядковые и количественные величины

Основные методы машинного обучения

В данном модуле рассмотрим задачи, которые направлены на проверку гипотез, поиск оптимальных решений с помощью искусственного интеллекта.

Тема 1: Введение в машинное обучение

Тема 2: Задача регрессии. Линейная регрессия

Тема 3: Задача классификации. Метод ближайших соседей

Тема 4: Выбор темы проекта

Тема 5: Логистическая регрессия

Тема 6: Деревья решений

Тема 7: Ансамбли моделей

Тема 8: Feature engineering & advanced preprocessing

Тема 9: Практика

Проектная работа

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Консультация в формате предзащиты

Тема 2: Защита проекта

Ступень 2. Junior+ / Middle

Вы последовательно освоите современные инструменты анализа данных и сможете на профессиональном уровне создавать модели машинного обучения. Чтобы лучше закрепить навыки, вы будете практиковаться: использовать каждый алгоритм в работе с реальными данными. Ступень 2 заканчивается масштабной проектной работой, примеры защит вы можете посмотреть на нашем YouTube канале.

Продвинутые методы машинного обучения: обучение с учителем

Первый модуль познакомит вас с различными продвинутыми моделями машинного обучения для задач обучения с учителем (регрессия и классификация), начиная от классических методов деревьев решений и заканчивая продвинутыми методами градиентного бустинга.

Тема 1: Вводный урок. Программа курса. Повторение основных концепций машинного обучения

Тема 2: Метод градиентного спуска

Тема 3: Повторение основных понятий задачи классификации на практике: EDA, cross-validation, метрики качества

Тема 4: Деревья решений

Тема 5: Ансамбли моделей

Тема 6: Градиентный бустинг

Тема 7: Метод опорных векторов

Продвинутые методы машинного обучения: обучение без учителя

Второй модуль посвящен алгоритмам для задачи обучения без учителя, в нем вы познакомитесь с различными способами кластеризации, такими как алгоритм k средних и DBSAN, методами снижения размерности и методами работы с новым типом данных - графами.

Тема 1: Методы уменьшения размерности

Тема 2: Обучение без учителя. K-means

Тема 3: Обучение без учителя. Иерархическая кластеризация. DB-Scan

Тема 4: Поиск аномалий в данных

Тема 5: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей

Тема 6: Алгоритмы на графах

Тема 7: Алгоритмы на графах: продолжение

Введение в Deep Learning

В этом модуле мы коснёмся методов Deep Learning и работы с нейронными сетями. Вы узнаете принципы работы и обучения нейронных сетей, а также освоите нейросетевые архитектуры для работы с изображениями (сверточные нейросети) и последовательностями (рекурретные нейросети).

Тема 1: Введение в нейросети

Тема 2: PyTorch. Часть 1

Тема 3: Продвинутые методы оптимизации, backpropagation и обучение нейронных сетей

Тема 4: Борьба с переобучение нейросетей, взрыв и затухание градиентов

Тема 5: PyTorch. Часть 2

Тема 6: Сверточные сети (Convolutional Neural Networks)

Тема 7: Рекуррентные сети

Сбор данных. Анализ текстовых данных

В этом модуле вы научитесь работать с одним из самых распространенных типов данных - текстом. Мы разберём различные способы предобработки текста, которые позволяют использовать его в качестве признаков для моделей машинного обучения. Мы изучим такие полезные задачи, как тематическое моделирование, распознавание именованных сущностей (NER) и работу с векторными представлениями слов. Также вы научитесь заниматься парсингом данных, который позволит вам собирать и создавать свои собственные уникальные датасеты для анализа.

Тема 1: Сбор данных

Тема 2: Предобработка и токенизация

Тема 3: Векторные представления слов, работа с предобученными эмбеддингами

Тема 4: Понятие языковой модели, RNN для работы с текстом

Тема 5: Архитектура трансформер

Тема 6: Transfer Learning. Архитектура BERT

Тема 7: Named Entity Recognition

Тема 8: Тематическое моделирование

Анализ временных рядов

В этом модуле вы познакомитесь с еще одним распространенным типом данных - временными рядами. Мы разберем как классические методы работы с временными рядами, включая ARIMA-модель, так и продвинутые способы извлечения признаков и применения машинного обучения. Также мы научимся решать задачу кластеризации, используя временные ряды, на примере финансовых котировок.

Тема 1: Анализ временных рядов. Часть 1: Постановка задачи, простейшие методы. ARIMA-модель

Тема 2: Анализ временных рядов. Часть 2: Извлечение признаков и применение моделей машинного обучения. Автоматическое прогнозирование

Тема 3: Анализ временных рядов Часть 3: Кластеризация временных рядов (ищем связанные котировки акций)

Рекомендательные системы

В этом модуле мы будем работать с различными типами рекомендательных систем. Разберем постановку задачи, познакомимся с популярными метриками качества и основными видами моделей рекомендательных систем. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.

Тема 1: Введение в рекомендательные системы

Тема 2: Простые рекомендательные модели. Коллаборативная фильтрация

Тема 3: Контентная фильтрация, гибридные подходы. Ассоциативные правила

Тема 4: Методы матричной факторизации

Тема 5: Практическое занятие по рекомендательным системам

Проектная работа

Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.

Тема 1: Выбор темы и организация проектной работы

Тема 2: Предзащита проектных работ

Тема 3: Защита проектных работ

Ступень 3. Карьерная информация

Подготовимся к поиску работу и определимся со стратегией поиска

Карьера в DS

Тема 1: Бонус: Стратегия поиска и подготовка CV, net-work

Тема 2: Бонус: Как сделать тестовые занятия и как подготовиться к интервью

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Проектная работа

Cпециализация - не просто курс. Обучение cостоит из двух больших блоков: ML Basic, ML Professional + ML Ops. У каждого блока свой выпускной проект. Задача выпускной работы: создать модель машинного обучения. Мы приветствуем творческий подход, а потому не даём шаблонных заданий. Так вы привнесёте в ML-сферу ценную разработку, а портфолио дополните конкурентоспособным проектом.

Посмотрите записи защит итоговых проектов наших студентов:  
YouTube Machine Learning

Преподаватели

Руководитель

Мария Тихонова

PhD Computer Science, Senior Data Scientist

SberDevices, ВШЭ

Евгений Ревняков

( к.т.н.) Senior software engineer

Exness

Антон Витвицкий

(к.ф.-м.н.) Director of Computer Vision

Boost Arria NLG

Виталий Сидоренко

Senior Data Scientist

Магнит

Борис Цейтлин

Senior ML Scientist

Planet Farms

Глеб Карпов

Исследователь

Skoltech Computational Intelligence Laboratory

Максим Бекетов

Аспирант

ФКН ВШЭ

Евгений Романов

Data Scientist

Газпромбанк

Александр Брут-Бруляко

DS инженер (к.э.н.)

Сбер GigaLegal

Константин Алексин

Специалист по прогнозному моделированию

СБЕР

Алексей Кисляков

(д.э.н., к.т.н.) преподаватель/ученый-исследователь

Российская академия народного хозяйства и государственной службы при Президенте РФ (Владимирский филиал)

Вероника Иванова

Data Scientist

Домклик

Дмитрий Гайнуллин

Machine Learning Engineer

AIC

Игорь Стурейко

(к.ф.-м.н.) Teamlead, главный инженер

НИИгазэкономика

Валерий Валов

EdTech

Преподаватель

Кирилл Панфилов

Блогер, программист

[dirty_python]

Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания

Прошедшие
мероприятия

Мария Тихонова
Открытый вебинар
Мы похожи на соседей: алгоритм kNN в задачах классификации
Мария Тихонова
Открытый вебинар
Учимся готовить данные для ML-моделей
Оставьте заявку, чтобы получить доступ ко всем записям прошедших мероприятий. Записи всех мероприятий появятся в этом блоке

Корпоративное обучение для ваших сотрудников

Отус помогает развивать высокотехнологичные Команды. Почему нам удаётся это делать успешно:
  • Курсы OTUS верифицированы крупными игроками ИТ-рынка и предлагают инструменты и практики, актуальные на данный момент
  • Студенты работают в группах, могут получить консультации не только преподавателей, но и профессионального сообщества
  • OTUS проверяет знания студентов перед стартом обучения и после его завершения
  • Простой и удобный личный кабинет компании, в котором можно видеть статистику по обучению сотрудников
  • Сертификат нашего выпускника за 5 лет стал гарантом качества знаний в обществе
  • OTUS создал в IT более 120 курсов по 7 направлениям, линейка которых расширяется по 40-50 курсов в год

Диплом о профессиональной переподготовке

OTUS осуществляет лицензированную образовательную деятельность. В конце прохождения специализации вы получите сертификат OTUS и официальный диплом о получении новой специальности.

Почему специализация выгоднее, чем отдельные курсы?

  • Стоимость ниже, чем покупка курсов по отдельности
  • Диплом о профессиональной переподготовке
  • Расширенная опция помощи с трудоустройством

Частые вопросы

Что понадобится для обучения?
Программа предусмотрена для новичков и дает все необходимые базовые знания. Поэтому для занятий вам понадобится только компьютер.
Чем Специализация отличается от других курсов?
По окончании курса Специализации выдается диплом государственного образца о профессиональной переподготовке.
Почему стоит выбрать учебу в Otus?
Образовательная экспертиза Otus доказана более 6 лет успешной специализации на обучении в IT. Наша фишка — продвинутые программы для специалистов с опытом и быстрый запуск курсов по новым набирающим популярность технологиям. Мы уже обучили более 20 000 студентов, и будем рады помочь освоить вам новые навыки.
Что является наиболее ценным по мнению выпускников курса?
Домашние задания сопровождаются письменной обратной связью, и вы всегда можете задать вопрос в закрытый чат группы или голосом на вебинаре. А для защиты итогового проекта у вас будет несколько этапов, где вы сможете получить консультацию по проекту от Марии Тихоновой и преодолеть трудности его выполнения.