Линейная алгебра
Цель данного модуля - изучение разделов матричной алгебры для решения систем линейных уравнений и векторного анализа. В дальнейшем те знания, которые будут изучены в этом модуле, будут использоваться в теории вероятностей, в особенно для построения регрессионных моделей.
Введение 1. Математика в DataScience
познакомиться с планом и структурой курса;
познакомиться с преподавателями курса;
рассмотреть примеры использования математики в практических задачах по трем модулям курса.
Введение 2. Линейная алгебра
вспомнить основные математические термины;
повторить ключевые термины и определения из линейной алгебры; установить необходимые библиотеки Python для выполнения практической части курса.
Матрицы. Основные понятия и операции
определять собственные числа и собственные векторы для матрицы.
Однородные СЛАУ
найти базис матрицы и применить его для матричных операций (имеется в виду базис однородной СЛАУ, то есть научиться находить базис ядра оператора).
ДЗ
Домашнее задание №1.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 1".
Определитель
посчитать определитель любой матрицы;
посчитать определитель на Python.
ДЗ
Домашнее задание №2.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 2".
Диагонализация матрицы. Часть 1
определить собственные числа и собственные векторы для матрицы.
Диагонализация матрицы. Часть 2
диагонализировать матрицу и перевести ее в базис из собственных векторов.
ДЗ
Домашнее задание №3.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 3".
Матричные разложения. Часть 1
с помощью вычисления собственных чисел и векторов разложить матрицу на составные множители;
провести SVD в Python.
Матричные разложения. Часть 2
продолжить знакомство с основными матричными разложениями; разобрать следующие из них: LU, QR, Schur decomposition, разложение Холецкого.
Применение линейной алгебры в Data Science
применить основные положения линейной алгебры в задачах Data Science
Тензоры. Введение
познакомиться с базовыми концепциями тензорного исчисления и применением тензоров в Data Science.
Математический анализ
Модуль по математическому анализу является технически важным этапом изучения математики. Так как именно здесь мы обсудим основные методы оптимизации функций (максимизации/минимизации). Также научимся апроксимировать значения функции, чтобы ускорять вычисления в Python при работе с данными.
Теория пределов
вычислить предел последовательности;
понять, что такое неопределенности и какую информацию они в себе содержат.
ДЗ
Домашнее задание №4.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 4".
Дифференцирование
вычислить производную любой функции или доказать, что ее не существует.
ДЗ
Домашнее задание №5.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 5".
Матричное дифференцирование
познакомиться с обобщением производной на многомерные пространства;
изучить свойства такого дифференцирования.
Математический анализ в ML
познакомиться с одним из ярких примеров применения матричного дифференцирования в машинном обучении.
Теория Рядов
рассмотреть определение ряда;
определить сходимость положительных рядов.
ДЗ
Домашнее задание №6.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 6".
Неопределенное интегрирование
интегрировать функции разными способами: заменой и по частям;
интегрировать функции х^n*sin(x).
ДЗ
Домашнее задание №7.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 7".
Определённое и несобственное интегрирование
познакомиться с концепцией определенного и несобственного интегрирования;
рассмотреть связь определенного и неопределенного интегралов.
Оптимизация. Часть 1
повторить матричных производных;
познакомиться с новыми темами: точки экстремума и условия оптимальности для многомерных функций.
ДЗ
Домашнее задание №8.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 8".
Оптимизация. Часть 2
продолжить тему оптимизации;
рассмотреть оптимизацию с помощью метода множителей Лагранжа;
познакомиться с большой идеей в оптимизации - выпуклым анализом.
Алгоритмы численной оптимизации
разобрать методы нулевого порядка и примеры задач глобальной оптимизации;
познакомиться с классическим градиентным спуском и его модификациями.
Оптимизация в классических алгоритмах машинного обучения
познакомиться с оптимизационной частью известных алгоритмов: SVM, PCA, Least squares, и др.
Преобразование Фурье
познакомиться с новым подразделом математики - Фурье-анализом;
рассмотреть теоретические основания, и главные случаи применения в науке о данных.
Временные ряды
познакомиться с основной терминологией временных рядов;
рассмотреть как раскладывать временные ряда на компоненты;
понять для чего нужна и как используется концепция стационарности;
рассмотреть описание и использование модели ARMA.
Математическая статистика
После уроков данного модуля вы будете знать:
- как формулировать и тестирования гипотезы, в том числе А/B тестирование;
- как и для чего осуществляется кластеризация данных;
- как работает метод главных компонент;
- базовые регрессионные модели, которые применяются в машинном обучении.
Случайные события. Вероятность
изучить понятия вероятности случайного события и вычислить вероятности сложных событий.
Случайные величины
познакомиться с главным объектом, который изучает теория вероятностей;
понять, что такое случайные величины, для чего они нужны и какие у них есть характеристики.
Основные законы распределения
проанализировать какие законы распределения часто встречаются при математическом моделировании реальных явлений;
смоделировать случайные величины с нужным законом распределения на компьютере.
Моделирование случайных величин
проанализировать различные способы компьютерного моделирования выборки с требуемым законом распределения.
Теория Множеств и Метрические пространства
научиться отличать разные типы метрик и объяснить, где и для чего они применяются.
Q&A Матричные разложения, Преобразование Фурье и Временные ряды
Пуассоновский поток событий. Моделирование системы массового обслуживания
проанализировать математические модели, используемые при моделировании систем массового обслуживания;
смоделировать на компьютере работу простейшей системы массового обслуживания.
ДЗ
Домашнее задание №9.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 9".
Задача оценивания. Метод максимального правдоподобия
понять, как оценивать неизвестные величины по наблюдениям и какими свойствами должны обладать хорошие оценки.
Выборочные характеристики. Доверительные интервалы
рассмотреть, как оценивать по выборке закон распределения и неизвестные характеристики случайной величины;
познакомиться с интервальными оценками и объяснить, в чём их преимущества и недостатки по сравнению с точечными оценками.
ДЗ
Домашнее задание №10.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 10".
Проверка гипотез
понять в чём заключается задача проверки статистической гипотезы и как правильно сформулировать ответ в этой задаче, как принимается решение, принять гипотезу или отвергнуть.
Проверка гипотез в А/В тестировании
проанализировать какие гипотезы проверяются при A/B-тестировании и разобрать критерии их проверки.
Однофакторный дисперсионный анализ (One-way ANOVA)
проверить гипотезу о том, что интересующий нас числовой показатель подвержен влиянию некоторого фактора.
ДЗ
Домашнее задание №11.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 11".
Двухфакторный дисперсионный анализ (two-way ANOVA)
проверить гипотезу о том, что интересующий нас числовой показатель подвержен влиянию некоторого фактора в условиях, когда есть более сильно влияющий фактор.
Нахождение объёма репрезентативной выборки
вычислить какого количества наблюдений достаточно для того, чтобы оценить неизвестную вероятность с требуемой точностью.
Проверка гипотезы о законе распределения. Виды зависимостей. Корреляция
проверить двумя способами гипотезу о том, что наблюдения действительно имеют тот закон распределения, который предлагается;
запомнить различные типы зависимостей между признаками.
Исследование зависимостей: Номинальные признаки
исследовать зависимость пары номинальных признаков с помощью проверки гипотез и нормированных коэффициентов связи.
Исследование зависимостей: Порядковые и количественные признаки
исследовать зависимость пары порядковых и количественных признаков.
ДЗ
Домашнее задание №12.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 12".
Линейная регрессия
спрогнозировать количественный признак по значению одного или нескольких объясняющих признаков;
разобраться с преимуществами и недостатками двух методов решения этой задачи.
Кластерный анализ
научиться выделять кластеры (скопления похожих друг на друга объектов) в выборке объектов, имеющих много характеристик.
Снижение размерности: Метод главных компонент
уменьшить количество влияющих перемененных без ухудшения информативности.
Снижение размерности: Факторный анализ
научиться понижать размерность многомерных данных до заранее заданного значения.
Классификация наблюдений: логистическая и пробит регрессии, метод ближайших соседей (KNN)
научиться по обучающей выборке классифицировать имеющие несколько признаков объекты на два или несколько классов.
Классификация наблюдений: байесовский классификатор
по обучающей выборке проклассифицировать имеющие несколько признаков объекты на несколько классов с помощью байесовского классификатора.
ДЗ
Домашнее задание №13.
Пошаговая инструкция по выполнению домашнего задания описана в файле "Домашнее задание 13".
Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, что интересно писать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Выбор темы и организация проектной работы
выбрать и обсудить тему проектной работы;
спланировать работу над проектом;
ознакомиться с регламентом работы над проектом.
ДЗ
Проектная работа.
Вся информация по проектной работе обсуждается со студентами на занятии.
Консультация №1 по проектам и домашним заданиям
получить ответы на вопросы по проекту, ДЗ и по курсу.
Консультация №2 по проектам и домашним заданиям
получить ответы на вопросы по проекту, ДЗ и по курсу.
Защита проектных работ
защитить проект и получить рекомендации экспертов.