Machine learning: современные методы анализа данных и инструменты Data Science

Курсы

Программирование
Разработчик Java
-20%
Fullstack разработчик JavaScript Архитектор высоких нагрузок Android-разработчик. Продвинутый курс
-20%
Android-разработчик. Базовый курс
-20%
Разработчик программных роботов (RPA) на базе UiPath и PIX
-20%
Алгоритмы для разработчиков
-20%
Agile Project Manager в IT
-20%
Разработчик на Spring Framework
-20%
iOS Разработчик. Продвинутый курс v 2.0.
-10%
PostgreSQL
-10%
Разработчик игр на Unity
-21%
VOIP инженер
-30%
Разработчик Java Enterprise MS SQL Server разработчик ReactJS/React Native-разработчик Разработчик голосовых ассистентов и чат-ботов Архитектура и шаблоны проектирования
Специализации Курсы в разработке Подготовительные курсы
+7 499 110-61-65
Специальная цена

Machine learning

Best Practice по машинному обучению для успешной карьеры в Data Science. Курс для людей со знанием высшей математики и знакомых с Python. Подготовка к соревнованиям на Kaggle.
Подойдет ли мне этот курс?

Длительность

5 месяцев

Начало

28 мая

Занятия

Чт 20:00, Вт 20:00

Общая стоимость

100 000 ₽ 85 000 ₽

В месяц

22 500 ₽

В кредит:

22500 ₽ в месяц

Хочу дешевле
Общая стоимость
100 000 ₽ 85 000 ₽
В месяц: 22 500 ₽
В кредит: 85000 ₽
в месяц
Продолжительность
5 месяцев, 4 академ. часа в неделю
Чт 20:00, Вт 20:00
Начало занятий
28 мая
Что даст вам этот курс

За 5 месяцев мы последовательно познакомимся с современными методами анализа данных. Курс позволит не просто поверхностно изучить принципы работы алгоритмов машинного обучения, а на профессиональном уровне освоить и применять в работе все этапы работы с данными, понимая, как, когда и зачем они используются.

Проекты для портфолио
В процессе обучения студенты разработают несколько мощных проектов для портфолио, которые обязательно оценят потенциальные работодатели, и научатся грамотно презентовать результаты своих работ.

Дополнительные преимущества
В программу также входит изучение редких и важных тем, которые обычно упускаются из внимания других курсов, но очень ценятся работодателями:
— построение систем для автоматического поиска аномалий;
— Machine Learning для прогнозирования временных рядов;
— end-to-end pipelin’ы по работе с данными, готовые к внедрению в production
— Подготовка к соревнованиям на Kaggle

Для кого этот курс
Профессиональная программа разработана специально для разработчиков и аналитиков, которые хотят значительно расширить свои возможности и получить необходимый набор знаний и навыков для смены своей профессии.

Три бонусных урока по Matlab от компании "Экспонента"
— Предобработка и подготовка данных для машинного обучения в MATLAB
— Автоматизация машинного обучения в MATLAB
— Работа с большими данными в MATLAB
Преподаватели
Дмитрий Сергеев
Senior Data Scientist в Oura
Дмитрий Музалевский
Lead Data Scientist в Koerber Digital
Валерий Бабушкин
Директор по моделированию и анализу данных в X5 Retail Group/советник в Yandex
Андрей Сухобок
Research Associate, Aalto University, Finland
Антон Лоскутов
Data Scientist в Mail.Ru Group
Павел Рословец
Ведущий инженер по Digital Twin и Predictive Maintenance, ЦИТМ Экспонента
Практикует машинное обучение и анализ данных с 2012 года. В настоящий момент работает Senior Data Scientist-ом в компании ŌURA Health Oy.
Работал в компании ZeptoLab, где занимался всеми проектами, связанными с машинным обучением. Получает степень магистра в университете Aalto в Финляндии.

Преподавал машинное обучение и анализ данных в Центре Математических Финансов МГУ, был приглашенным лектором на Факультете Компьютерных Наук НИУ ВШЭ и различных летних школах.

Образование: Эконом-мат РЭУ им. Плеханова, ЦМФ МГУ, ДПО ФКН ВШЭ “Практический анализ данных и машинное обучение”, MSc Aalto University

Стек/интересы: Python, Machine Learning, Time Series, Anomaly Detection, Open Data, ML for social good

Более 7 лет опыта в области анализа данных и машинного обучения. Опыт работы и проектов в различных индустриях: телеком, онлайн-ритейл, банковская сфера, финтех и медтех.

В настоящий момент работает в компании Koerber Digital GmbH, Берлин. Занимает позицию Lead Data Scientist и ведет работу команды, занимающейся аналитикой больших объемов данных и машинным обучением для производственных предприятий и B2B компаний.

Образование: бакалавриат МГТУ им.Баумана "Компьютерный анализ и интерпретация данных"; магистратура НИУ МАИ "Математические методы в экономике и маркетинге".

Валерий Бабушкин входит в ТОП-30 лучших специалистов по Data Science в мире по рейтингу Kaggle.

Работает директором по моделированию и анализу данных в X5 Retail Group, является советником в Яндексе, а также преподает в ВШЭ введение в Data Science.

Активный участник и победитель соревнований Kaggle, имеет статус Competitions Grandmaster.

После учебы в Московском политехе (тогда — МИХМ) окончил магистратуру по мехатронике Университета прикладных наук в Карлсруэ (Германия).

Специалист по машинному обучению и участник проекта по анализу текстов в Институте Гайдара. Получает степень магистра по Machine Learning в университете Aalto в Финляндии.

Занимался рядом проектов на стыке двух дисциплин (машинного обучения и экономики). Работал в отделе Deloitte Analytics Institute в компании Deloitte (отдел разрабатывал продукты на основе машинного обучения для внутренних нужд компании и внешних заказчиков). Также занимался анализом GPS-данных различного транспорта для ЦОДД Москвы.

Имеет разносторонний бэкграунд и широкий спектр интересов: Python, Machine Learning, Natural Language Processing, Neural Networks, Statistical Modelling.

Образование:
— НИУ ВШЭ, «Математические методы анализа экономики»;
— Центр математических финансов МГУ им. М.В. Ломоносова, программа «Анализ Данных»;
— ДПО ФКН НИУ ВШЭ, программа «Deep Learning: расширенный курс»;
— Aalto University (Finland), MSc, Machine Learning.

Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Сейчас заканчивает обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.

Читал лекции по машинному обучению в проекте Open Data Science, сейчас проводит авторский курс по машинному обучению внутри Mail.Ru. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

Ведущий инженер по анализу данных главного представителя MathWorks в России. Занимался разработкой сертификации специалистов Matlab. Проводит тренинги по Matlab Simulink в России по следующим направлениям «Системы управления», «Анализ данных», «Машинное обучение», «Кодогенерация».

Участник конкурса Ice Vision по построению нейросетей «Распознавание дорожных знаков в зимнем городе» с использованием Matlab. Команда вошла в 10-ку лучших.

С 2010 года занимался разработкой и моделированием в космической отрасли. Также участвовал в реализации консалтинговых проектов крупных компаний.

Дмитрий
Сергеев
Дмитрий
Музалевский
Валерий
Бабушкин
Андрей
Сухобок
Антон
Лоскутов
Павел
Рословец
Преподаватели
Дмитрий Сергеев
Senior Data Scientist в Oura
Практикует машинное обучение и анализ данных с 2012 года. В настоящий момент работает Senior Data Scientist-ом в компании ŌURA Health Oy.
Работал в компании ZeptoLab, где занимался всеми проектами, связанными с машинным обучением. Получает степень магистра в университете Aalto в Финляндии.

Преподавал машинное обучение и анализ данных в Центре Математических Финансов МГУ, был приглашенным лектором на Факультете Компьютерных Наук НИУ ВШЭ и различных летних школах.

Образование: Эконом-мат РЭУ им. Плеханова, ЦМФ МГУ, ДПО ФКН ВШЭ “Практический анализ данных и машинное обучение”, MSc Aalto University

Стек/интересы: Python, Machine Learning, Time Series, Anomaly Detection, Open Data, ML for social good

Дмитрий Музалевский
Lead Data Scientist в Koerber Digital
Более 7 лет опыта в области анализа данных и машинного обучения. Опыт работы и проектов в различных индустриях: телеком, онлайн-ритейл, банковская сфера, финтех и медтех.

В настоящий момент работает в компании Koerber Digital GmbH, Берлин. Занимает позицию Lead Data Scientist и ведет работу команды, занимающейся аналитикой больших объемов данных и машинным обучением для производственных предприятий и B2B компаний.

Образование: бакалавриат МГТУ им.Баумана "Компьютерный анализ и интерпретация данных"; магистратура НИУ МАИ "Математические методы в экономике и маркетинге".

Валерий Бабушкин
Директор по моделированию и анализу данных в X5 Retail Group/советник в Yandex
Валерий Бабушкин входит в ТОП-30 лучших специалистов по Data Science в мире по рейтингу Kaggle.

Работает директором по моделированию и анализу данных в X5 Retail Group, является советником в Яндексе, а также преподает в ВШЭ введение в Data Science.

Активный участник и победитель соревнований Kaggle, имеет статус Competitions Grandmaster.

После учебы в Московском политехе (тогда — МИХМ) окончил магистратуру по мехатронике Университета прикладных наук в Карлсруэ (Германия).

Андрей Сухобок
Research Associate, Aalto University, Finland
Специалист по машинному обучению и участник проекта по анализу текстов в Институте Гайдара. Получает степень магистра по Machine Learning в университете Aalto в Финляндии.

Занимался рядом проектов на стыке двух дисциплин (машинного обучения и экономики). Работал в отделе Deloitte Analytics Institute в компании Deloitte (отдел разрабатывал продукты на основе машинного обучения для внутренних нужд компании и внешних заказчиков). Также занимался анализом GPS-данных различного транспорта для ЦОДД Москвы.

Имеет разносторонний бэкграунд и широкий спектр интересов: Python, Machine Learning, Natural Language Processing, Neural Networks, Statistical Modelling.

Образование:
— НИУ ВШЭ, «Математические методы анализа экономики»;
— Центр математических финансов МГУ им. М.В. Ломоносова, программа «Анализ Данных»;
— ДПО ФКН НИУ ВШЭ, программа «Deep Learning: расширенный курс»;
— Aalto University (Finland), MSc, Machine Learning.

Антон Лоскутов
Data Scientist в Mail.Ru Group
Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Сейчас заканчивает обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.

Читал лекции по машинному обучению в проекте Open Data Science, сейчас проводит авторский курс по машинному обучению внутри Mail.Ru. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

Павел Рословец
Ведущий инженер по Digital Twin и Predictive Maintenance, ЦИТМ Экспонента
Ведущий инженер по анализу данных главного представителя MathWorks в России. Занимался разработкой сертификации специалистов Matlab. Проводит тренинги по Matlab Simulink в России по следующим направлениям «Системы управления», «Анализ данных», «Машинное обучение», «Кодогенерация».

Участник конкурса Ice Vision по построению нейросетей «Распознавание дорожных знаков в зимнем городе» с использованием Matlab. Команда вошла в 10-ку лучших.

С 2010 года занимался разработкой и моделированием в космической отрасли. Также участвовал в реализации консалтинговых проектов крупных компаний.

Отзывы
5
Александр
Кудинов
Очень хочу поблагодарить Дмитрия Сергеева за отношение к предмету и желание научить и поделиться опытом. Его лекции всегда полезны и интересны. Другой преподаватель просто читает презентацию. Возможно, он хороший специалист, но объяснять и разбирать материал у него не получается. Уверен, не только я им не доволен. До обучения в OTUS я много лет проработал звукорежиссёром на телевидении. Занимался, в основном, спортивными трансляциями. В 2015-ом решил попробовать заняться разработкой ПО. Выбрал C++, т.к. хотел и хочу заниматься real-time обработкой звука, VST plugin'ами и т.п. Но в России таких вакансий крайне мало. Книги, бесплатные онлайн курсы, потом курс разработчика C++ на OTUS.
Потом - работа звукоинженером в Samsung на проекте Bixby - это их голосовой помощник. После Bixby - желание заняться исследованиями и разработкой в области синтеза и распознавания речи - не NLP, а именно ASR и TTS. Таких вакансий, увы, тоже немного. Соответственно, Python, машинное обучение, нейронные сети.
Поэтому сейчас - подряд два курса от OTUS. Всеми тремя курсами доволен, т.к. в изучении появляется система, мотивация к самостоятельному изученю материала, опыт и общение со специалистами, их реальный опыт и оценка наших навыков.
Результаты обучения, в любом случае есть. Это - прежде всего, новые знания и навыки, адекватная оценка и уверенность в своём уровне подготовки.
Работу мечты, да и компанию мечты пока не нашёл. Изучаю рынок, прохожу собеседования, выполняю тестовые задания.
Читать целиком
Сергей
Масленников
Я работал и работю в настоящий момент в банковской сфере в области нагрузочного тестирования. Я выбрал курс “Machine learning”, чтобы систематизировать свои знания в этой области, которые получил самостоятельно. Результат обчуения считаю успешным.Что понравилось:
- Лекции ведут отличные специалисты в своей области.
- Обратная связь от преподавателей.
- Дистанционное обучение. Позволяет экономить время.
- Тестовое задание перед записью на курс. Позволяет оценить свои знания перед записью или сэкономить деньги.
Не понравилось:
- Некоторые домашние задания не имеют детального описания, что необходимо сделать.
- Перенос лекций в одностороннем порядке. Так как ранее был установлен график проведения лекций, я смог под него подстроить свое расписание. Перенос лекции на другой день часто не позволяет пристуствовать на этой лекции и задать в режиме онлайн имеющиеся вопросы.
- Первым заданием обучения является заполнения своего резюме. Я, как и думаю большинство записавшихся на крус, заинтересовано в получению работы по специальности пройденного курса, но резюме рассылаются без учета этого интереса и компании приглашают на собеседовании по опыту, указанного в резюме.
Читать целиком
Наталья
Глактионова
Самое главное впечатление от курсов: очень нравится, ни одной минуты не пожалела, что записалась. Плюсы: преподаватели стараются, отвечают на вопросы, всегда уточняют все ли понятно. Также приятно, что даже когда время вышло, не убегают, а отвечают спокойно и подробно. Мой любимый преподаватель Дмитрий Сергеев, очень нравится его подача, интересные лекции. Шикарно, когда в ноутбуки вставляют ссылки на полезные материалы. Минусы: иногда барахлит звук на лекциях. Есть какая-то трудность с ДЗ, по умолчанию оно невнятное и только после запроса на лекции или в слаке добавляют подробное описание.
Читать целиком
Василий
Курочкин
Шёл на курс с целью научиться использовать на практике машинное обучение в Python (до этого несколько лет решал аналогичные задачи в системе SAS Enterprise Miner, а на новом месте работы доступен только Python). Цели своей достиг, на новой работе быстро втянулся и успешно прошел испытательный срок.
Плюсы курса:
1) Ориентация на практику. Минимум занудства, максимум реальной работы.
2) Преподаватели из индустрии. Знают, что актуально, рассказывают интересные кейсы, дают ценные советы.
Минусы курса:
1) Преподаватели из индустрии. Ребята крутые специалисты но (пока) не все из них крутые преподаватели.
Было несколько тем, которые бы я вряд ли осознал, не имея предыдущего опыта.
В общем и целом впечатления от курса и организаторов положительные, как закончу этот курс пойду еще учиться на нейронные сети.
Читать целиком
Виталий
Русакевич
Курс интересный, много практики. Хотя по ощущениям многовато домашних заданий, не успеваешь сконцентрироваться, тщательней обдумать выполнение заданий и заодно осмыслить теорию, почитать что-то сверх материала. Может быть имело бы смысл их уменьшить штук до 13-15. По мне идеально одно задание на неделю в среднем.

Полезно, что проходили темы не на прямую связанные с машинным обучением, например - pipeline, парсинг.

Нравится подача материала Дмитрием Сергеевым тем, что темы начинает объяснять с простого на пальцах, постепенно увеличивая сложность.
Также очень хорошо, что Дмитрий Музалевский даёт обратную связь при проверке дз, подсказывает где можно что-то еще улучшить в будущем, задает направление. Ну либо подчеркивает, что сделано отлично)

Может быть ещё бы добавил при прохождении каких-либо алгоритмов на занятиях объяснение где в каких моделях стоит на какие параметры обращать больше внимания, а на какие нет в конкретных часто используемых библиотеках. Что требует настройки, а что нет. Понятно, что в документации всё есть, но она не всегда понятна обычному не опытному человеку. Потому как в итоге работать придется с этими библиотеками, поэтому подробности не помешали бы.

Было бы круто сделать интергацию резюме с hh или каким-нибудь моим кругом, поскольку очень не охото копи-пастить оттуда резюме, и при внесении изменений в hh, оно бы поменялось и у вас.
Ну и надеюсь, что ваш сервис поможет найти работу связанную с машинным обучением)
Читать целиком
Александр
Кудинов
Очень хочу поблагодарить Дмитрия Сергеева за отношение к предмету и желание научить и поделиться опытом. Его лекции всегда полезны и интересны. Другой преподаватель просто читает презентацию. Возможно, он хороший специалист, но объяснять и разбирать материал у него не получается. Уверен, не только я им не доволен. До обучения в OTUS я много лет проработал звукорежиссёром на телевидении. Занимался, в основном, спортивными трансляциями. В 2015-ом решил попробовать заняться разработкой ПО. Выбрал C++, т.к. хотел и хочу заниматься real-time обработкой звука, VST plugin'ами и т.п. Но в России таких вакансий крайне мало. Книги, бесплатные онлайн курсы, потом курс разработчика C++ на OTUS.
Потом - работа звукоинженером в Samsung на проекте Bixby - это их голосовой помощник. После Bixby - желание заняться исследованиями и разработкой в области синтеза и распознавания речи - не NLP, а именно ASR и TTS. Таких вакансий, увы, тоже немного. Соответственно, Python, машинное обучение, нейронные сети.
Поэтому сейчас - подряд два курса от OTUS. Всеми тремя курсами доволен, т.к. в изучении появляется система, мотивация к самостоятельному изученю материала, опыт и общение со специалистами, их реальный опыт и оценка наших навыков.
Результаты обучения, в любом случае есть. Это - прежде всего, новые знания и навыки, адекватная оценка и уверенность в своём уровне подготовки.
Работу мечты, да и компанию мечты пока не нашёл. Изучаю рынок, прохожу собеседования, выполняю тестовые задания.
Читать целиком
Сергей
Масленников
Я работал и работю в настоящий момент в банковской сфере в области нагрузочного тестирования. Я выбрал курс “Machine learning”, чтобы систематизировать свои знания в этой области, которые получил самостоятельно. Результат обчуения считаю успешным.Что понравилось:
- Лекции ведут отличные специалисты в своей области.
- Обратная связь от преподавателей.
- Дистанционное обучение. Позволяет экономить время.
- Тестовое задание перед записью на курс. Позволяет оценить свои знания перед записью или сэкономить деньги.
Не понравилось:
- Некоторые домашние задания не имеют детального описания, что необходимо сделать.
- Перенос лекций в одностороннем порядке. Так как ранее был установлен график проведения лекций, я смог под него подстроить свое расписание. Перенос лекции на другой день часто не позволяет пристуствовать на этой лекции и задать в режиме онлайн имеющиеся вопросы.
- Первым заданием обучения является заполнения своего резюме. Я, как и думаю большинство записавшихся на крус, заинтересовано в получению работы по специальности пройденного курса, но резюме рассылаются без учета этого интереса и компании приглашают на собеседовании по опыту, указанного в резюме.
Читать целиком
Наталья
Глактионова
Самое главное впечатление от курсов: очень нравится, ни одной минуты не пожалела, что записалась. Плюсы: преподаватели стараются, отвечают на вопросы, всегда уточняют все ли понятно. Также приятно, что даже когда время вышло, не убегают, а отвечают спокойно и подробно. Мой любимый преподаватель Дмитрий Сергеев, очень нравится его подача, интересные лекции. Шикарно, когда в ноутбуки вставляют ссылки на полезные материалы. Минусы: иногда барахлит звук на лекциях. Есть какая-то трудность с ДЗ, по умолчанию оно невнятное и только после запроса на лекции или в слаке добавляют подробное описание.
Читать целиком
Василий
Курочкин
Шёл на курс с целью научиться использовать на практике машинное обучение в Python (до этого несколько лет решал аналогичные задачи в системе SAS Enterprise Miner, а на новом месте работы доступен только Python). Цели своей достиг, на новой работе быстро втянулся и успешно прошел испытательный срок.
Плюсы курса:
1) Ориентация на практику. Минимум занудства, максимум реальной работы.
2) Преподаватели из индустрии. Знают, что актуально, рассказывают интересные кейсы, дают ценные советы.
Минусы курса:
1) Преподаватели из индустрии. Ребята крутые специалисты но (пока) не все из них крутые преподаватели.
Было несколько тем, которые бы я вряд ли осознал, не имея предыдущего опыта.
В общем и целом впечатления от курса и организаторов положительные, как закончу этот курс пойду еще учиться на нейронные сети.
Читать целиком
Виталий
Русакевич
Курс интересный, много практики. Хотя по ощущениям многовато домашних заданий, не успеваешь сконцентрироваться, тщательней обдумать выполнение заданий и заодно осмыслить теорию, почитать что-то сверх материала. Может быть имело бы смысл их уменьшить штук до 13-15. По мне идеально одно задание на неделю в среднем.

Полезно, что проходили темы не на прямую связанные с машинным обучением, например - pipeline, парсинг.

Нравится подача материала Дмитрием Сергеевым тем, что темы начинает объяснять с простого на пальцах, постепенно увеличивая сложность.
Также очень хорошо, что Дмитрий Музалевский даёт обратную связь при проверке дз, подсказывает где можно что-то еще улучшить в будущем, задает направление. Ну либо подчеркивает, что сделано отлично)

Может быть ещё бы добавил при прохождении каких-либо алгоритмов на занятиях объяснение где в каких моделях стоит на какие параметры обращать больше внимания, а на какие нет в конкретных часто используемых библиотеках. Что требует настройки, а что нет. Понятно, что в документации всё есть, но она не всегда понятна обычному не опытному человеку. Потому как в итоге работать придется с этими библиотеками, поэтому подробности не помешали бы.

Было бы круто сделать интергацию резюме с hh или каким-нибудь моим кругом, поскольку очень не охото копи-пастить оттуда резюме, и при внесении изменений в hh, оно бы поменялось и у вас.
Ну и надеюсь, что ваш сервис поможет найти работу связанную с машинным обучением)
Читать целиком
Необходимые знания
Для прохождения программы необходимы:
— навыки программирования на Python (опыт написания собственных функций),
— знания математического анализа (вычисление производных сложных функций),
— знания линейной алгебры (матричные операции и собственные вектора),
— знания теории вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, нормального закона распределения).
Подготовительный курс

  • Основные возможности языка Python

  • Создание сайтов на Django

  • Библиотеки для анализа данных

  • Общение в чате с преподавателем

  • Подготовка к курсам "Web-разработчик на Python" и "Разработчик Python"

Записаться
Процесс обучения
Образовательный процесс происходит ONLINE в формате вебинаров (язык преподавания — русский). В рамках курса слушателям предлагаются к выполнению домашние задания, которые позволяют применить на практике знания, полученные на занятиях. По каждому домашнему заданию преподаватель дает развернутый фидбек. В течение всего учебного процесса преподаватель находится в едином коммуникационном пространстве с группой, т. е. при обучении слушатель может задавать преподавателю уточняющие вопросы по учебным материалам.
Программа обучения
Модуль 1
Основные методы машинного обучения
Модуль 2
Продвинутые методы машинного обучения
Модуль 3
Рекомендательные системы. Анализ текстовых данных, графов и временных рядов.
Модуль 4
Big Data & нейронные сети
Модуль 5
Подготовка к соревнованиям kaggle
Модуль 6
Проектная работа
Основные методы машинного обучения
Тема 1: Введение в машинное обучение
обзор курса. Знакомство со стандартными задачами по
машинному обучению. Понимание общего подхода: Exploratory Data Analysis
and Preprocessing -> Models and experiments -> Production.
28 мая, 20:00 — 21:30
Тема 2: Базовые инструменты анализа данных в Python
рабочее окружение Python. Функционал базовых библиотек для
работы с данными: Numpy, Pandas, scikit-learn.
2 июня, 20:00 — 21:30
Тема 3: Exploratory Data Analysis and Preprocessing
основные принципы и методы разведочного анализа данных.
Преобразование данных в подходящий для моделей формат. Использование
статистического анализа и визуализации для знакомства с данными.
4 июня, 20:00 — 21:30
Домашние задания: 1
1 Практика EDA, знакомство с данными, построение визуализаций
Цель: В этом домашнем задании вам предстоит провести первичный анализ данных (EDA) и познакомиться с достаточно небольшим, но интересным датасетом по раку груди. Признаками в этом наборе данных являются различные измерения образований в груди, такие как радиус, симметричность, и т.д. Целевой переменной является диагноз - является ли новообразование злокачественным или нет.
Тема 4: Задача классификации. Метод ближайших соседей (kNN)
алгоритм kNN. Влияние нормализации данных в kNN. Структуры
данных для оптимизации kNN. Метрики оценки качества классификации. Кросс-
валидация.
9 июня, 20:00 — 21:30
Тема 5: Задача регрессии. Линейная регрессия
линейная регрессия - метод наименьших квадратов.
Полиномиальная регрессия. Регуляризация в линейной регрессии. Метрики
оценки качества регрессии.
11 июня, 20:00 — 21:30
Домашние задания: 1
1 Построение модели линейной регрессии, настройка гиперпараметров на кросс-валидации, интерпретация коэффициентов.
Цель: В этом дз вы потренируетесь строить интерпретируемые модели линейной регрессии с регуляризацией и без. Снова пройдемся по основным этапам работы с данными и на выходе получим модели, способные предсказывать цены на жильё в AirBnb.
Тема 6: Логистическая регрессия
реализации логистической регрессии с помощью метода
стохастического градиентного спуска. Регуляризация и подбор
гиперпараметров.
16 июня, 20:00 — 21:30
Домашние задания: 1
1 Построение модели логистической регрессии, настройка гиперпараметров на кросс-валидации, интерпретация коэффициентов.
Цель: В этом домашнем задании вы потренируетесь в настройке модели логистической регрессии, подборе коэффициента регуляризации и интерпретации результатов.
Тема 7: Feature engineering & advanced preprocessing
отбор признаков. Преобразование признаков для повышения
точности модели. Устранение несбалансированности выборки.
18 июня, 20:00 — 21:30
Домашние задания: 1
1 Feature Engineering&Feature Selection
Цель: Повторить вычисления из лекции на данном датасете: https://archive.ics.uci.edu/ml/datasets/Adult
Тема 8: Практическое занятие по темам, изученным в первом модуле
повторение – мать учения.
23 июня, 20:00 — 21:30
Продвинутые методы машинного обучения
Тема 1: Метод опорных векторов
метод опорных векторов (SVM), интерпретация. Случай линейно
неразделимых данных. Kernel trick. Примеры SVM в sklearn.
25 июня, 20:00 — 21:30
Домашние задания: 1
1 Построение SVM и выбор оптимального ядра.
Тема 2: Деревья решений
программа: Классификация и регрессия с помощью деревьев решений. Обзор
алгоритмов. Алгоритм CART. Выбор оптимального сплита, суррогатный сплит.
Обзор реализации в sklearn.
30 июня, 20:00 — 21:30
Тема 3: Ансамбли моделей
ансамблирование. Случайный лес. Бэггинг, стэкинг, блэндинг.
2 июля, 20:00 — 21:30
Домашние задания: 1
1 Построение и настройка модели случайного леса. Визуализация важности признаков.
Тема 4: Градиентный бустинг
теория градиентного бустинга. XGBoost, CatBoost, LightGBM.
Применение библиотеки ELI5 для интерпретации моделей.
7 июля, 20:00 — 21:30
Домашние задания: 1
1 Сравнение трех разобранных алгоритмов бустинга и подбор гиперпараметров для получения лучшего качества.
Тема 5: Обучение без учителя. K-means, EM алгоритм
обучение без учителя. Алгоритмы кластеризации, области
применения. K-means. Оценка качества обучения, ограничения и подбор
алгоритма для задачи. Алгоритмы с lower-bound. EM алгоритм.
9 июля, 20:00 — 21:30
Домашние задания: 1
1 Настройка числа кластеров в алгоритме K-Means. Elbow и Silhouette метод.
Тема 6: Обучение без учителя. Иерархическая кластеризация. DB-Scan
иерархическая кластеризация. DB-Scan. Спектральная
кластеризация.
14 июля, 20:00 — 21:30
Домашние задания: 1
1 Построение различных вариантов кластеризаций и интерпретация результатов.
Тема 7: Методы уменьшения размерности
метод главных компонент (Principle component analysis). Метод t-
SNE. Примеры визуализации с помощью метода t-SNE.
16 июля, 20:00 — 21:30
Тема 8: Поиск аномалий в данных
статистические методы нахождения выбросов. Вероятностные
методы. One-Class SVM, Isolation Forest.
21 июля, 20:00 — 21:30
Домашние задания: 1
1 Практический проект по построению системы поиска аномалий.
Рекомендательные системы. Анализ текстовых данных, графов и временных рядов.
Тема 1: Сбор данных
открытые источники данных. Использование API. Парсинг и
создание своих датасетов.
23 июля, 20:00 — 21:30
Домашние задания: 1
1 Практический проект по написанию собственного парсера.
Тема 2: Анализ текстовых данных. Часть 1
задача обработки текста. Введение, обзор задач, токенизация,
лемматизация, TF-IDF. Обзор библиотек для работы с русским и английским языками.
28 июля, 20:00 — 21:30
Домашние задания: 1
1 Практический проект по предсказанию рейтинга фильма.
Тема 3: Анализ текстовых данных. Часть 2
тематическое моделирование. Общая схема решения задач NLP.
30 июля, 20:00 — 21:30
Домашние задания: 1
1 Тематическое моделирование на данных Вконтакте: использование модели LDA, визуализация топиков, построение тематических профилей.
Тема 4: Анализ текстовых данных. Часть 3. Практическое занятие
векторные представления слов, word2vec. Примеры задач NLP,
создание диалоговых систем.
4 августа, 20:00 — 21:30
Тема 5: Рекомендательные системы. Часть 1
коллаборативная фильтрация. Проблема «холодного старта».
Метрики оценки качества рекомендательной системы.
6 августа, 20:00 — 21:30
Тема 6: Рекомендательные системы. Часть 2
контентная фильтрация, гибридные подходы. Ассоциативные
правила.
11 августа, 20:00 — 21:30
Домашние задания: 1
1 Практический проект по созданию рекомендательной системы.
Тема 7: Анализ временных рядов. Часть 1
постановка задачи. Простейшие методы. Экспоненциальное
сглаживание. Семейство ARIMA.
13 августа, 20:00 — 21:30
Тема 8: Анализ временных рядов. Часть 2
извлечение признаков и применение моделей машинного
обучения. Автоматическое прогнозирование.
18 августа, 20:00 — 21:30
Домашние задания: 1
1 Построение прогноза временного ряда с использованием изученных методов.
Тема 9: Алгоритмы на графах
анализ социальных сетей. Метрики на графах. Выделение
сообществ.
20 августа, 20:00 — 21:30
Домашние задания: 1
1 Анализ графа друзей Вконтакте. Визуализация в NetworkX.
Тема 10: АБ тестирование
тестирование гипотез. Постановка задачи. Терминология,
мощность, статистическая значимость. Параметрические и непараметрические методы.
25 августа, 20:00 — 21:30
Домашние задания: 1
1 Практика по проверке АБ-тестов.
Big Data & нейронные сети
Тема 1: Работа с Big Data. Часть 1
адаптация алгоритмов к batch-learning. SGD. Vowpal Wabbit.
27 августа, 20:00 — 21:30
Домашние задания: 1
1 Настройка моделей машинного обучения в Vowpal Wabbit.
Тема 2: Работа с Big Data. Часть 2
облачные технологии для работы с Big Data: Amazon Web
Services, Google Cloud. Создание виртуальных машин, распределенные вычисления.
1 сентября, 20:00 — 21:30
Домашние задания: 1
1 Запуск собственной виртуальной машины и построение моделей в облаке.
Тема 3: Работа с Big Data. Часть 3
spark, принципы работы и архитектуры. Построение моделей
машинного обучения при помощи PySpark API.
3 сентября, 20:00 — 21:30
Тема 4: Нейронные сети и глубокое обучение
начальные сведения о нейронных сетях. Примеры использования
нейронных сетей.
8 сентября, 20:00 — 21:30
Подготовка к соревнованиям kaggle
Разбор соревнований с kaggle.
Преподаватель: Валерий Бабушкин (kaggle grandmaster).
Тема 1: Тренировка по ML №1
stacking, ensemble learning
10 сентября, 20:00 — 21:30
Тема 2: Выбор темы и организация проектной работы
выбрать и обсудить тему проектной работы;
спланировать работу над проектом;
ознакомиться с регламентом работы над проектом.
15 сентября, 20:00 — 21:30
Домашние задания: 1
1 Проектная работа
Цель: Проект включает в себя следующие этапы: 1. Постановка задачи. Предлагается самостоятельно найти предметную область и обосновать применение в ней машинного обучения 2. Разработка данных. Одно из требований к проекту - использование данных из открытых источников. Необходимо разработать процесс сбора и очистки данных 3. Поиск алгоритма и модели для решения задачи. Необходимо выполнить подготовку данных, выбрать алгоритм и подобрать параметры для построения модели 4. Использование модели для достижения поставленной цели 5. Построение процесса. Решение задачи необходимо оформить в единый процесс по обработке данных от источника до предсказания, не требующий участия эксперта 6. Обоснование процесса.
Тема 3: Тренировка по ML №2
adversarial validation, pseudo-labeling
17 сентября, 20:00 — 21:30
Проектная работа
Тема 1: Консультация по проектам и домашним заданиям
получить ответы на вопросы по проекту, ДЗ и по курсу.
22 сентября, 20:00 — 21:30
Тема 2: Бонус: поиск Data Science работы
примеры тестовых заданий и вопросов с собеседований.
24 сентября, 20:00 — 21:30
Тема 3: Защита проектных работ
защитить проект и получить рекомендации экспертов.
29 сентября, 20:00 — 21:30
Домашние задания: 1
1 Сдать проект
Выпускной проект
Выпускной проект — возможность закрепить навыки, наработанные в процессе обучения. Это практическое применение изучения всех этапов работы с данными: начиная от сбора и очистки и заканчивая построением модели и презентацией результатов потенциальному заказчику.
Прошедшие открытые вебинары по курсу
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Анализ текстовых данных: тематическое моделирование комментариев Вконтакте
Дмитрий Сергеев
День открытых дверей
24 февраля в 20:00
Для доступа к прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на e-mail, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!
Пройти вступительное тестирование
После обучения вы

  • заберете с собой learn-материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач);

  • получите сертификат на русском о прохождении курса;

  • научитесь использовать методы машинного обучения для решения реальных бизнес-задач;

  • улучшите навыки в технологиях Python, Pandas, Sklearn, Keras, нейросети, SQL, Natural language processing, Deep learning и других, связанных с Learn Data Science;

  • получите приглашение пройти собеседование в компаниях-партнерах OTUS в Москве (в случае успешного обучения на курсе).

Дата выдачи сертификата: 2 декабря 2020 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Machine learning»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Генеральный директор ООО “Отус Онлайн-Образование”
Виталий Чибриков

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Machine learning»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Генеральный директор ООО “Отус Онлайн-Образование”
Виталий Чибриков

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Общая стоимость
100 000 ₽ 85 000 ₽
В месяц: 22 500 ₽
В кредит: ₽ в месяц
Продолжительность
5 месяцев
Начало занятий
28 мая
🔥 Скидки до 50% на новые супер-интенсивы!
«Тестирование игр», «Data Engineer», «работа с протоколом BGP». Узнайте подробности в чате ➞