Открытый вебинар «Методы регрессионного анализа в Data Science» 20.01.2020 в 20:00 | OTUS >
❄️ Новогодние скидки и старые цены!
Поднимаем стоимость курсов с января. Успейте приобрести их по старой цене, а до 26.12 еще и со скидкой до -30%!
Выбрать курс
Проходил 20 января 2020 года в 20:00

Открытый вебинар
Методы регрессионного анализа в Data Science

Открытый вебинар онлайн

На бесплатном пробном вебинаре вы:
- познакомитесь с понятием линейных регрессий;
- изучите, где и как их можно применять на практике;
- узнаете, какие темы и разделы математического анализа, линейной алгебры и теории вероятностей используются в этой области.

А ещё сможете задать любые вопросы по математике для Data Science и выяснить всё, что хотели узнать, но боялись спросить!
Преподаватель
Петр Лукьянченко

Запись

О курсе

Математика для Data Science
50 000 ₽
Начало в октябре 2030 года

Вы научитесь применять математический анализ, линейную алгебру, теорию вероятности и статистику для задач анализа данных и машинного обучения.
Вы разберетесь, как устроены разные модели и методы анализа, и сможете их правильно выбирать, улучшать и адаптировать.
К концу курса вы будете уверенно владеть математическим аппаратом, который необходим, чтобы подняться на уровень специалиста Middle+ в Data Science.

Карта курсов направления …

Программа курса
Модуль 1
Линейная алгебра
Модуль 2
Математический анализ
Модуль 3
Математическая статистика
Модуль 4
Проектная работа
Линейная алгебра
Цель данного модуля - изучение разделов матричной алгебры для решения систем линейных уравнений и векторного анализа. В дальнейшем те знания, которые будут изучены в этом модуле, будут использоваться в теории вероятностей, в особенно для построения регрессионных моделей.
Введение 1. Математика в DataScience
познакомиться с планом и структурой курса;
познакомиться с преподавателями курса;
рассмотреть примеры использования математики в практических задачах по трем модулям курса.
Введение 2. Линейная алгебра
вспомнить основные математические термины;
повторить ключевые термины и определения из линейной алгебры; установить необходимые библиотеки Python для выполнения практической части курса.
Матрицы. Основные понятия и операции
определять собственные числа и собственные векторы для матрицы.
Однородные СЛАУ
найти базис матрицы и применить его для матричных операций (имеется в виду базис однородной СЛАУ, то есть научиться находить базис ядра оператора).
Домашние задания: 1
ДЗ
Домашнее задание №1. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 1".
Определитель
посчитать определитель любой матрицы;
посчитать определитель на Python.
Домашние задания: 1
ДЗ
Домашнее задание №2. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 2".
Диагонализация матрицы. Часть 1
определить собственные числа и собственные векторы для матрицы.
Диагонализация матрицы. Часть 2
диагонализировать матрицу и перевести ее в базис из собственных векторов.
Домашние задания: 1
ДЗ
Домашнее задание №3. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 3".
Матричные разложения. Часть 1
с помощью вычисления собственных чисел и векторов разложить матрицу на составные множители;
провести SVD в Python.
Матричные разложения. Часть 2
продолжить знакомство с основными матричными разложениями; разобрать следующие из них: LU, QR, Schur decomposition, разложение Холецкого.
Применение линейной алгебры в Data Science
применить основные положения линейной алгебры в задачах Data Science
Тензоры. Введение
познакомиться с базовыми концепциями тензорного исчисления и применением тензоров в Data Science.
Математический анализ
Модуль по математическому анализу является технически важным этапом изучения математики. Так как именно здесь мы обсудим основные методы оптимизации функций (максимизации/минимизации). Также научимся апроксимировать значения функции, чтобы ускорять вычисления в Python при работе с данными.
Теория пределов
вычислить предел последовательности;
понять, что такое неопределенности и какую информацию они в себе содержат.
Домашние задания: 1
ДЗ
Домашнее задание №4. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 4".
Дифференцирование
вычислить производную любой функции или доказать, что ее не существует.
Домашние задания: 1
ДЗ
Домашнее задание №5. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 5".
Матричное дифференцирование
познакомиться с обобщением производной на многомерные пространства;
изучить свойства такого дифференцирования.
Математический анализ в ML
познакомиться с одним из ярких примеров применения матричного дифференцирования в машинном обучении.
Теория Рядов
рассмотреть определение ряда;
определить сходимость положительных рядов.
Домашние задания: 1
ДЗ
Домашнее задание №6. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 6".
Неопределенное интегрирование
интегрировать функции разными способами: заменой и по частям;
интегрировать функции х^n*sin(x).
Домашние задания: 1
ДЗ
Домашнее задание №7. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 7".
Определённое и несобственное интегрирование
познакомиться с концепцией определенного и несобственного интегрирования;
рассмотреть связь определенного и неопределенного интегралов.
Оптимизация. Часть 1
повторить матричных производных;
познакомиться с новыми темами: точки экстремума и условия оптимальности для многомерных функций.
Домашние задания: 1
ДЗ
Домашнее задание №8. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 8".
Оптимизация. Часть 2
продолжить тему оптимизации;
рассмотреть оптимизацию с помощью метода множителей Лагранжа;
познакомиться с большой идеей в оптимизации - выпуклым анализом.
Алгоритмы численной оптимизации
разобрать методы нулевого порядка и примеры задач глобальной оптимизации;
познакомиться с классическим градиентным спуском и его модификациями.
Оптимизация в классических алгоритмах машинного обучения
познакомиться с оптимизационной частью известных алгоритмов: SVM, PCA, Least squares, и др.
Преобразование Фурье
познакомиться с новым подразделом математики - Фурье-анализом;
рассмотреть теоретические основания, и главные случаи применения в науке о данных.
Временные ряды
познакомиться с основной терминологией временных рядов;
рассмотреть как раскладывать временные ряда на компоненты;
понять для чего нужна и как используется концепция стационарности;
рассмотреть описание и использование модели ARMA.
Математическая статистика
После уроков данного модуля вы будете знать:
- как формулировать и тестирования гипотезы, в том числе А/B тестирование;
- как и для чего осуществляется кластеризация данных;
- как работает метод главных компонент;
- базовые регрессионные модели, которые применяются в машинном обучении.
Случайные события. Вероятность
изучить понятия вероятности случайного события и вычислить вероятности сложных событий.
Случайные величины
познакомиться с главным объектом, который изучает теория вероятностей;
понять, что такое случайные величины, для чего они нужны и какие у них есть характеристики.
Основные законы распределения
проанализировать какие законы распределения часто встречаются при математическом моделировании реальных явлений;
смоделировать случайные величины с нужным законом распределения на компьютере.
Моделирование случайных величин
проанализировать различные способы компьютерного моделирования выборки с требуемым законом распределения.
Теория Множеств и Метрические пространства
научиться отличать разные типы метрик и объяснить, где и для чего они применяются.
Q&A Матричные разложения, Преобразование Фурье и Временные ряды
Пуассоновский поток событий. Моделирование системы массового обслуживания
проанализировать математические модели, используемые при моделировании систем массового обслуживания;
смоделировать на компьютере работу простейшей системы массового обслуживания.
Домашние задания: 1
ДЗ
Домашнее задание №9. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 9".
Задача оценивания. Метод максимального правдоподобия
понять, как оценивать неизвестные величины по наблюдениям и какими свойствами должны обладать хорошие оценки.
Выборочные характеристики. Доверительные интервалы
рассмотреть, как оценивать по выборке закон распределения и неизвестные характеристики случайной величины;
познакомиться с интервальными оценками и объяснить, в чём их преимущества и недостатки по сравнению с точечными оценками.
Домашние задания: 1
ДЗ
Домашнее задание №10. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 10".
Проверка гипотез
понять в чём заключается задача проверки статистической гипотезы и как правильно сформулировать ответ в этой задаче, как принимается решение, принять гипотезу или отвергнуть.
Проверка гипотез в А/В тестировании
проанализировать какие гипотезы проверяются при A/B-тестировании и разобрать критерии их проверки.
Однофакторный дисперсионный анализ (One-way ANOVA)
проверить гипотезу о том, что интересующий нас числовой показатель подвержен влиянию некоторого фактора.
Домашние задания: 1
ДЗ
Домашнее задание №11. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 11".
Двухфакторный дисперсионный анализ (two-way ANOVA)
проверить гипотезу о том, что интересующий нас числовой показатель подвержен влиянию некоторого фактора в условиях, когда есть более сильно влияющий фактор.
Нахождение объёма репрезентативной выборки
вычислить какого количества наблюдений достаточно для того, чтобы оценить неизвестную вероятность с требуемой точностью.
Проверка гипотезы о законе распределения. Виды зависимостей. Корреляция
проверить двумя способами гипотезу о том, что наблюдения действительно имеют тот закон распределения, который предлагается;
запомнить различные типы зависимостей между признаками.
Исследование зависимостей: Номинальные признаки
исследовать зависимость пары номинальных признаков с помощью проверки гипотез и нормированных коэффициентов связи.
Исследование зависимостей: Порядковые и количественные признаки
исследовать зависимость пары порядковых и количественных признаков.
Домашние задания: 1
ДЗ
Домашнее задание №12. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 12".
Линейная регрессия
спрогнозировать количественный признак по значению одного или нескольких объясняющих признаков;
разобраться с преимуществами и недостатками двух методов решения этой задачи.
Кластерный анализ
научиться выделять кластеры (скопления похожих друг на друга объектов) в выборке объектов, имеющих много характеристик.
Снижение размерности: Метод главных компонент
уменьшить количество влияющих перемененных без ухудшения информативности.
Снижение размерности: Факторный анализ
научиться понижать размерность многомерных данных до заранее заданного значения.
Классификация наблюдений: логистическая и пробит регрессии, метод ближайших соседей (KNN)
научиться по обучающей выборке классифицировать имеющие несколько признаков объекты на два или несколько классов.
Классификация наблюдений: байесовский классификатор
по обучающей выборке проклассифицировать имеющие несколько признаков объекты на несколько классов с помощью байесовского классификатора.
Домашние задания: 1
ДЗ
Домашнее задание №13. Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 13".
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Выбор темы и организация проектной работы
выбрать и обсудить тему проектной работы;
спланировать работу над проектом;
ознакомиться с регламентом работы над проектом.
Домашние задания: 1
ДЗ
Проектная работа. Вся информация по проектной работе обсуждается со студентами на занятии.
Консультация №1 по проектам и домашним заданиям
получить ответы на вопросы по проекту, ДЗ и по курсу.
Консультация №2 по проектам и домашним заданиям
получить ответы на вопросы по проекту, ДЗ и по курсу.
Защита проектных работ
защитить проект и получить рекомендации экспертов.

Преподаватель

Петр Лукьянченко
Преподаватель ВШЭ по высшей математике
Имеет более десяти лет опыта преподавания математических дисциплин в НИУ ВШЭ. Готовил студентов к международным олимпиадам по математике, участвовал в подготовке команд для соревнований по программированию.

Работал в Lamoda на должности Team Lead Analytics, принимал участие в формировании отдела бизнес-аналитики и анализа данных. Руководил проектами в госструктурах, отвечал за прогнозирование ключевых бизнес-KPI и структурирование данных большого объема. Управлял проектом по созданию математического комплекса алгоритмов 3D-картографии.

Около 3 лет работал Quantitative Research. Занимался анализом и прогнозированием временных рядов, участвовал в создании модели стохастической волатильности.
Подписка со скидкой до 26.12.!
15% на все подписки 6 месяцев, 20% на подписки Standard и Professional 12 месяцев. Успейте →