Математика для Data Science. Продвинутый курс | OTUS

Курсы

Специализации Курсы в разработке Подготовительные курсы
+7 499 110-61-65

Математика для Data Science. Продвинутый курс

Best Practice по изучению математического аппарата, необходимого для успешной карьеры в Data Science

Длительность

4 месяца

Начало занятий

В мае

Продолжительность
4 месяца, 4 академ. часа в неделю
Начало занятий
В мае
Что даст вам этот курс

Обычно математику в вузах преподают в отрыве от реальных задач, где она в дальнейшем будет применяться. Мы пошли по другому пути. Каждый модуль профессионального курса сбалансирован математической теорией и практическими примерами, которые взяты из реальных кейсов. Вы будете решать задачу регрессии, проводить АБ-тестирование, работать над рекомендательной системой, использовать метод опорных векторов.

Для кого этот курс?
Для поступления нужно быть знакомым с основами математического анализа, линейной алгебры и теории вероятности. Курс подойдет всем, кто хочет развиваться в сфере Data Science. Он поможет вам освоить весь необходимый математический аппарат для решения задач на позиции Middle/Senior Data Scientist.

Зачем учить математику?
Профессия Data Scientist становится одной из самых перспективных и востребованных в IT. Средняя зарплата специалистов Data Science в России вдвое выше, чем у специалистов других IT-направлений — 190 тыс. руб. Основная сложность профессии — высокие требования к знаниям высшей математики. Уверенное владение математическим аппаратом позволяет повысить уровень компетенций и вырасти в профессиональном плане.


Обучение математике на реальных кейсах

Много практики и живого общения с преподавателями

Полный набор знаний для успешной работы в Data Science

    Преподаватели
    Петр Лукьянченко
    Преподаватель ВШЭ по высшей математике
    Александр Горяинов
    Кандидат физ.-мат. наук, доцент МАИ.
    Дмитрий Музалевский
    Lead Data Scientist в Koerber Digital
    Иван Леонов
    Data Science Team Lead в Globant
    Александр Никитин
    Специалист по Machine Learning
    Антон Лоскутов
    Data Scientist в Mail.Ru Group
    Артем Кондрашов
    Алексей Катин
    PhD в North Carolina State University
    Имеет более десяти лет опыта преподавания математических дисциплин в НИУ ВШЭ. Готовил студентов к международным олимпиадам по математике, участвовал в подготовке команд для соревнований по программированию.

    Работал в Lamoda на должности Team Lead Analytics, принимал участие в формировании отдела бизнес-аналитики и анализа данных. Руководил проектами в госструктурах, отвечал за прогнозирование ключевых бизнес-KPI и структурирование данных большого объема. Управлял проектом по созданию математического комплекса алгоритмов 3D-картографии.

    Около 3 лет работал Quantitative Research. Занимался анализом и прогнозированием временных рядов, участвовал в создании модели стохастической волатильности.

    Кандидат физико-математических наук с 2010 года.
    В 2008 году окончил Московский авиационный институт, факультет прикладной математики и физики, специальность «прикладная математика».
    С 2011 года – доцент кафедры теории вероятностей в МАИ.

    Более 7 лет опыта в области анализа данных и машинного обучения. Опыт работы и проектов в различных индустриях: телеком, онлайн-ритейл, банковская сфера, финтех и медтех.

    В настоящий момент работает в компании Koerber Digital GmbH, Берлин. Занимает позицию Lead Data Scientist и ведет работу команды, занимающейся аналитикой больших объемов данных и машинным обучением для производственных предприятий и B2B компаний.

    Образование: бакалавриат МГТУ им.Баумана "Компьютерный анализ и интерпретация данных"; магистратура НИУ МАИ "Математические методы в экономике и маркетинге".

    Изучал математику в Белорусском государственном университете, Иллинойском технологическом институте (Illinois Institute of Technology), Чикагском университете (University of Chicago). Работал в компаниях AIG, TV Guide, MTV/Viacom в качестве разработчика, архитектора данных, аналитика, Operations & Product менеджера.

    Последние 4 года работает в Data Science, из них три года — в EPAM. В настоящее время — Data Science Team Lead в компании Globant. На своём опыте убедился, что изучение математики приносит пользу даже в областях деятельности, которые на первый взгляд далеки от математики.

    Разработчик и data scientist с 5-летним опытом. В данное время занимается консалтингом и аутсорсом по машинному обучению для компаний в России, Европе и Австралии. Работал ML-инженером в Яндексе.
    Научные интересы касаются обработки естественного языка, построения векторных представлений для слов и текстов, тематического моделирования.

    Образование: МФТИ (факультет инноваций и высоких технологий)

    Машинное обучение и анализ данных преподает с 2015 года на курсах, летних школах и семинарах.
    Александр получает огромное удовольствие от обучения людей и стремится делиться знаниями с сообществом.

    Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Сейчас заканчивает обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.

    Проводит лекции по машинному обучению в проекте Open Data Science. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

    Занимается программированием на R более 3 лет.
    Имеет опыт работы с широким спектром инструментов анализа и программирования - регрессия, анализ временных рядов и построение прогнозных моделей (forecast), байесовские методы, сетевой анализ, визуализация данных (ggplot2, plotly, ggmap), парсинг сайтов (xml2), Rmarkdown отчеты, интеграция C++ в R (Rcpp), чистка и обработка данных.

    Любит узнавать новое и делиться знаниями.

    PhD (аспирант 3 года) в North Carolina State University, USA.
    Область профессиональных интересов: анализ полевых и лабораторных данных качества водной среды для последующего построения прогнозных моделей. R является основным инструментом, в работе применяются регрессионный анализ и байесовый подход.

    Образование: магистратура Dresden University of Technology по специальности гидролог, бакалавриат: МИСиС по специальности инженером-эколог.

    Опыт преподавания: 2 года в роли ассистента профессора в North Carolina State University.

    Участник международных конференций: 15th Estuarine and Coastal Modeling Conference (ECM15) в 2018 и North Carolina's Coastal Conference в 2017.

    Петр
    Лукьянченко
    Александр
    Горяинов
    Дмитрий
    Музалевский
    Иван
    Леонов
    Александр
    Никитин
    Антон
    Лоскутов
    Артем
    Кондрашов
    Алексей
    Катин
    Преподаватели
    Петр Лукьянченко
    Преподаватель ВШЭ по высшей математике
    Имеет более десяти лет опыта преподавания математических дисциплин в НИУ ВШЭ. Готовил студентов к международным олимпиадам по математике, участвовал в подготовке команд для соревнований по программированию.

    Работал в Lamoda на должности Team Lead Analytics, принимал участие в формировании отдела бизнес-аналитики и анализа данных. Руководил проектами в госструктурах, отвечал за прогнозирование ключевых бизнес-KPI и структурирование данных большого объема. Управлял проектом по созданию математического комплекса алгоритмов 3D-картографии.

    Около 3 лет работал Quantitative Research. Занимался анализом и прогнозированием временных рядов, участвовал в создании модели стохастической волатильности.

    Александр Горяинов
    Кандидат физ.-мат. наук, доцент МАИ.
    Кандидат физико-математических наук с 2010 года.
    В 2008 году окончил Московский авиационный институт, факультет прикладной математики и физики, специальность «прикладная математика».
    С 2011 года – доцент кафедры теории вероятностей в МАИ.

    Дмитрий Музалевский
    Lead Data Scientist в Koerber Digital
    Более 7 лет опыта в области анализа данных и машинного обучения. Опыт работы и проектов в различных индустриях: телеком, онлайн-ритейл, банковская сфера, финтех и медтех.

    В настоящий момент работает в компании Koerber Digital GmbH, Берлин. Занимает позицию Lead Data Scientist и ведет работу команды, занимающейся аналитикой больших объемов данных и машинным обучением для производственных предприятий и B2B компаний.

    Образование: бакалавриат МГТУ им.Баумана "Компьютерный анализ и интерпретация данных"; магистратура НИУ МАИ "Математические методы в экономике и маркетинге".

    Иван Леонов
    Data Science Team Lead в Globant
    Изучал математику в Белорусском государственном университете, Иллинойском технологическом институте (Illinois Institute of Technology), Чикагском университете (University of Chicago). Работал в компаниях AIG, TV Guide, MTV/Viacom в качестве разработчика, архитектора данных, аналитика, Operations & Product менеджера.

    Последние 4 года работает в Data Science, из них три года — в EPAM. В настоящее время — Data Science Team Lead в компании Globant. На своём опыте убедился, что изучение математики приносит пользу даже в областях деятельности, которые на первый взгляд далеки от математики.

    Александр Никитин
    Специалист по Machine Learning
    Разработчик и data scientist с 5-летним опытом. В данное время занимается консалтингом и аутсорсом по машинному обучению для компаний в России, Европе и Австралии. Работал ML-инженером в Яндексе.
    Научные интересы касаются обработки естественного языка, построения векторных представлений для слов и текстов, тематического моделирования.

    Образование: МФТИ (факультет инноваций и высоких технологий)

    Машинное обучение и анализ данных преподает с 2015 года на курсах, летних школах и семинарах.
    Александр получает огромное удовольствие от обучения людей и стремится делиться знаниями с сообществом.

    Антон Лоскутов
    Data Scientist в Mail.Ru Group
    Работает на позиции Data Scientist в Mail.Ru Group. Окончил образовательный проект «Техносфера» от Mail.Ru. Сейчас заканчивает обучение в МГУ имени М. В. Ломоносова на механико-математическом факультете.

    Проводит лекции по машинному обучению в проекте Open Data Science. Считает, что машинное обучение — это не только fit-predict, но и математическое понимание происходящего.

    Артем Кондрашов
    Занимается программированием на R более 3 лет.
    Имеет опыт работы с широким спектром инструментов анализа и программирования - регрессия, анализ временных рядов и построение прогнозных моделей (forecast), байесовские методы, сетевой анализ, визуализация данных (ggplot2, plotly, ggmap), парсинг сайтов (xml2), Rmarkdown отчеты, интеграция C++ в R (Rcpp), чистка и обработка данных.

    Любит узнавать новое и делиться знаниями.

    Алексей Катин
    PhD в North Carolina State University
    PhD (аспирант 3 года) в North Carolina State University, USA.
    Область профессиональных интересов: анализ полевых и лабораторных данных качества водной среды для последующего построения прогнозных моделей. R является основным инструментом, в работе применяются регрессионный анализ и байесовый подход.

    Образование: магистратура Dresden University of Technology по специальности гидролог, бакалавриат: МИСиС по специальности инженером-эколог.

    Опыт преподавания: 2 года в роли ассистента профессора в North Carolina State University.

    Участник международных конференций: 15th Estuarine and Coastal Modeling Conference (ECM15) в 2018 и North Carolina's Coastal Conference в 2017.

    Отзывы
    Dmitry
    Pereverzev
    Отличный курс. Все доступно и понятно.
    Есть одно пожелание для такого вида курсов: думаю, что если привлекать именно преподавателей именно пофильных ВУЗов это повысит их ценность для слушателей.
    Читать целиком
    Dmitry
    Pereverzev
    Отличный курс. Все доступно и понятно.
    Есть одно пожелание для такого вида курсов: думаю, что если привлекать именно преподавателей именно пофильных ВУЗов это повысит их ценность для слушателей.
    Читать целиком
    Петр Лукьянченко о курсе «Математика для Data Science»
    Необходимые знания
    • Математический анализ: вычисление пределов функций, дифференцирование явных и неявных функций, применение производных для апкросимации значений функции, интегрирование, решение обычных диффренциальных уравнений.
    • Линейная алгебра: операции над матрицами, решение СЛАУ, вычисление определителя и ранга СЛАУ.
    • Теория вероятности: основы комбинаторики, формула условной и полной вероятности, математическое ожидание и дисперсия случайной величины.
    Программа обучения
    Модуль 1
    Линейная алгебра
    Модуль 2
    Математический анализ
    Модуль 3
    Теория вероятностей
    Модуль 4
    Проектная работа
    Линейная алгебра
    Тема 1: Введение 1. Математика в DataScience
    понимание, что быть успешным Datascientist без знания математики, а главное без ее понимания, невозможно.
    План и структура этого курса.
    Знакомство с преподавателем
    Тема 2: Введение 2. Основные термины и определения математического анализа, линейной алгебры и теории вероятностей
    — Базовые термины матанализа (предел, непрерывность функции, дифференциал)
    — Базовые термины линейной алгебры (вектор, матрица, ее виды, ранг, определитель)
    — Базовые термины теории вероятности (определение вероятности, мат.ожидание, дисперсия)
    — Установка Python, предоставление рекомендаций по интерпретатору
    — Вычисление базовых задач на Python с помощью стандартных пакетов
    Домашние задания: 1
    1 Основы линейной алгебры, мат.анализа и теории вероятности
    Цель: Цель данной домашней работы - развить практические навыки, полученных в ходе первого и второго уроков.
    Тема 3: Введение 3. Теория Вероятностей
    базовые термины теории вероятности (определение вероятности, мат.ожидание, дисперсия)
    Домашние задания: 1
    1 Посчитать собственные числа и вектора.
    Тема 4: Матрицы. Основные понятия и операции
    ключевые определения, операция над матрицами, определитель, обратная матрица, вычисления собственных значений и собственных векторов, квадратичные формы .
    Тема 5: Матричные разложения
    — Разложение SVD и ALS
    — Неотрицательные разложения
    — Заполнения пропусков в матрицах
    Домашние задания: 1
    1 Разложить матрицу в SVD.
    Цель: Выполнить сингулярное разложение в python и записать получившуюся матрицу преобразования для следующих матриц: 1)A=[3 7 5 2] 2)B=[0 1 3 2 3 1 0 1 0] 3)C=[5 7 6 4 2 1 3 4 1 3 3 4 5 4 1]
    Тема 6: Матричные производные
    — Матричные производные
    — Дифференциальные уравнения в матрицах
    Тема 7: Применение линейной алгебры в Data Science.
    классификация данных с SVM и Logistic Regression
    25 февраля, 20:00 — 21:30
    Лектор: Александр Никитин
    Домашние задания: 1
    1 Повторить вычисления с занятия в Python на других данных.
    Тема 8: Применение линейной алгебры в Machine Learning
    обработка изображений и линейная алгебра
    28 февраля, 20:00 — 21:30
    Лектор: Александр Никитин
    Математический анализ
    Тема 1: Теория множеств
    — Вероятностные пространства. Дискретное пространство элементарных исходов
    — Вероятность на числовой прямой и плоскости. Правило сложения и умножения
    3 марта, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Тема 2: Метрические пространства
    — Понятие метрического пространства.
    — Определение нормированного пространства, понятие нормы, отличие от метрики, примеры нормированных пространств.
    — Норма в оптимизации
    6 марта, 20:00 — 21:30
    Лектор: Антон Лоскутов
    Домашние задания: 1
    1 Свойство метрики. Вычислить простые операции над множеством.
    Тема 3: Теория пределов
    — Определение Коши.
    — Определение Пиано.
    — Вычисление пределов функций.
    — Асимптотические функции.
    — Эквивалентные функции.
    — Оценка сложности функции
    10 марта, 20:00 — 21:30
    Лектор: Антон Лоскутов
    Тема 4: Дифференцирование
    — Дифференцируемость функции в точке Частные производные и дифференциалы высших порядков
    — Градиент. Матрица Гессе
    13 марта, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Домашние задания: 1
    1 Вычисление производных и пределов значений функции в бесконечности.
    Тема 5: Оптимизация
    — Экстремумы функций многих переменных
    — Определения точек локального и глобального минимума. Необходимое и достаточное условие экстремума для выпуклых функций.
    — Понятие стационарных точек и отличие в их определении от точек экстремума
    17 марта, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Тема 6: Метод наименьших квадратов
    разобрать метод наименьших квадратов.
    20 марта, 20:00 — 21:30
    Лектор: Антон Лоскутов
    Домашние задания: 1
    1 Максимизация функции с ограничениями. Минимизация квадрата ошибки.
    Тема 7: Метод максимального правдоподобия
    обсудить и понять ММП
    24 марта, 20:00 — 21:30
    Лектор: Антон Лоскутов
    Тема 8: Интегрирование
    неопределенный интеграл. Определенный интеграл
    Приложения определенного интеграла и приближенные методы его вычисления. Несобственные интегралы. Двойные интегралы. Приближенные методы интегрирования
    27 марта, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Домашние задания: 1
    1 Поиск экстремума с Python.
    Тема 9: Применение Мат.анализа в ML
    — Линейная регрессия
    — Логистическая регрессия
    31 марта, 20:00 — 21:30
    Лектор: Дмитрий Музалевский
    Тема 10: MidTerm
    проверочная работа.
    В ходе занятия будет предоставляться от 2-х до 5-ти минут на решение практической задачи. По истечению отведенного времени преподаватель решает задание на экране
    3 апреля, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Теория вероятностей
    Тема 1: Комбинаторика и Основы теории вероятностей
    — Принцип Дирихле. Перестановки. Размещения. Сочетания.
    — Опыт и его исходы. Пространство элементарных событий. Вероятность события.
    — Независимость событий. Условная вероятность. Формулы сложения и умножения.
    — Формулы полной вероятности и Байеса
    14 апреля, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 2: Случайные величины
    — Случайная величина
    — Дискретные и непрерывные случайные величины
    — Закон распределения случайной величины и способы его описания
    Дискретные и непрерывные распределения
    — Функция распределения и её свойства
    — Распределение Бернулли
    — Биномиальное распределение
    — Моделирование на Python дискретное распределение (для задачи МонтеКарло)
    17 апреля, 20:00 — 21:30
    Лектор: Александр Горяинов
    Домашние задания: 1
    1 Вычислить мат.ожидание, написав программный код в Python.
    Тема 3: Непрерывные случайные величины
    — Основные законы распределения и их физический смысл: биномиальное, пуассоновское, экспоненциальное, равномерное, гауссовское
    — Компьютерное моделирование различных распределений
    21 апреля, 20:00 — 21:30
    Лектор: Дмитрий Музалевский
    Тема 4: Теоремы
    — Случайные последовательности и сходимость
    — Теорема Пуассона для схемы Бернулли
    — Закон больших чисел (Чебышева, Бернулли, Хинчина)
    — ЦПТ Локальная, ЦПТ Линдеберга, ЦПТ Ляпунова
    — Точечные оценки и их свойства
    24 апреля, 20:00 — 21:30
    Лектор: Александр Горяинов
    Домашние задания: 1
    1 Задачи на предыдущие темы курса: максимизировать функцию. Отнормировать относительно среднего. Вычислить количество возможных повторений.
    Тема 5: Точечное и интервальное оценивание
    — Асимптотическая нормальность оценок
    — Доверительные интервалы. Принцип построения доверительных интервалов
    28 апреля, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 6: Проверка гипотез
    — Проверка статистических гипотез. Формулировка гипотез.
    — Проверка гипотезы о законе распределения выборки. Критерий согласия Пирсона.
    — Проверка гипотезы о независимости двух номинальных признаков. Критерий хи-квадрат
    1 мая, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 7: Проверка гипотез. Часть 2
    — Ошибки I и II рода, уровень значимости. Статистический критерий. Построение доверительной и критической областей. P-value
    — Проверка гипотезы о вероятности успеха в схеме Бернулли. Биномиальный критерий
    8 мая, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 8: Виды зависимостей
    — Виды зависимостей случайных величин: функциональная, причинно-следственная, статистическая, корреляционная. Различия и связь между ними.
    — Условные распределения
    12 мая, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 9: Регресии
    — Линейные, многомерные, логистические регрессии
    — МНК, ММП, ММ
    15 мая, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Домашние задания: 1
    1 Построить линейную регрессию в Python.
    Тема 10: Метод главных компонент
    — Определение главных компонент, их вычисление
    — Понижение размерности и отбор признаков
    — Применение в задачах регрессионного анализа
    19 мая, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 11: Моделирование случайных величин
    — Random Walks, практические методы
    — Вероятностный классификатор: Logistic Regression, Random Forest, Gradient Boosting
    — Вероятностные Нейронные Сети
    22 мая, 20:00 — 21:30
    Лектор: Дмитрий Музалевский
    Тема 12: Моделирование случайных величин.Часть 2
    — Random Walks, практические методы
    — Вероятностный классификатор: Logistic Regression, Random Forest, Gradient Boosting
    — Вероятностные Нейронные Сети
    26 мая, 20:00 — 21:30
    Лектор: Дмитрий Музалевский
    Домашние задания: 1
    1 Провести Монте-Карло симуляцию для вычисления числа Пи.
    Тема 13: MidTerm
    — Проверочная работа.
    — Обсуждение тем проектной работы
    29 мая, 20:00 — 21:30
    Лектор: Дмитрий Музалевский
    Проектная работа
    Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
    Тема 1: Выбор темы и организация проектной работы
    выбрать и обсудить тему проектной работы;
    спланировать работу над проектом;
    ознакомиться с регламентом работы над проектом.
    2 июня, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Домашние задания: 1
    1 Проектная работа
    Тема 2: Консультация по проектам и домашним заданиям
    получить ответы на вопросы по проекту, ДЗ и по курсу.
    5 июня, 20:00 — 21:30
    Лектор: Александр Горяинов
    Тема 3: Защита проектных работ
    защитить проект и получить рекомендации экспертов.
    9 июня, 20:00 — 21:30
    Лектор: Петр Лукьянченко
    Выпускной проект
    На выбор будут представлены несколько кейсов из реальной практики. Вы напишите код на языке Python с использованием различных библиотек для того, чтобы выполнить анализ данных.
    Прошедшие открытые вебинары по курсу
    Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
    Методы регрессионного анализа в Data Science
    Петр Лукьянченко
    Продвинутая Математика для Data Science: на пути к Senior
    Дата выдачи сертификата: 27 октября 2020 года
    Ваш сертификат

    онлайн-образование

    Сертификат №0001

    Константин Константинопольский

    Успешно закончил курс «Математика для Data Science. Продвинутый курс»
    Выполнено практических заданий: 16 из 16

    Общество с ограниченной ответственностью “Отус Онлайн-Образование”

    Город:
    Москва

    Генеральный директор ООО “Отус Онлайн-Образование”
    Виталий Чибриков

    Лицензия на осуществление образовательной деятельности
    № 039825 от 28 декабря 2018 года.

    онлайн-образование

    Сертификат №0001

    Константин Константинопольский

    Успешно закончил курс «Математика для Data Science. Продвинутый курс»
    Выполнено практических заданий: 16 из 16

    Общество с ограниченной ответственностью “Отус Онлайн-Образование”

    Город:
    Москва

    Генеральный директор ООО “Отус Онлайн-Образование”
    Виталий Чибриков

    Лицензия на осуществление образовательной деятельности
    № 039825 от 28 декабря 2018 года.