Big Data для менеджеров

Погружение бизнес-специалистов без технического бэкграунда в экосистему Data Science-проектов. Раскрываем принципы Data-driven трансформации бизнеса, изучаем технологии анализа данных. Разбираем подводные камни, сложности внедрения и реализации проектов.

Длительность

3 месяца

Продолжительность
3 месяца, 4 академических часа в неделю
Что даст вам этот курс

Курс разработан для руководителей отделов и подразделений, чьи рабочие процессы неразрывно связаны с большими объемами данных и потребностью в их обработке.

Программа даст вам понимание сути и принципов внедрения современных аналитических механизмов (машинное обучение, нейросети, рекомендательные системы и др.), необходимых для продвижения продуктов и услуг своих подразделений в цифровом пространстве и повышения эффективности своих организаций.

Прикладная польза курса:

  • разберем термины мира Больших Данных и научим говорить на одном языке с поставщиками аналитических решений (внутренними и внешними);

  • проанализируем возможности аналитических инструментов и их связь с целями бизнеса (на основе кейсов из разных отраслей);

  • проделаем своими руками основополагающие задачи анализа данных
    (математика и программирование будут в задачах со звездочкой!).



Объемный комплексный курс:


покрываем все аспекты бизнес-трансформации: от методов и технологий до структуры команды

и data-driven management

Адаптированная программа:


для профессионалов, еще не обладающих специфическими знаниями по математике и программированию

Компетенции, востребованные на рынке:


грамотные бизнес-заказчики ценятся наравне с техническими исполнителями

Траектории карьерного развития:


выпускники курса подготовлены к освоению углубленных курсов по аналитике
Подходы принятия решений на основе данных + технологии работы с большими данными активно проникают в жизнь компаний и крупных корпораций, позволяя повысить эффективность бизнес-процессов. В то же время и данных для аналитики и обучения ИИ становится все больше и больше. В рамках курса мы предлагаем ознакомиться со всеми аспектами, которые сопровождают внедрение технологий Data Science в бизнес.
Денис Афанасьев
Преподаватель курса
Подходы принятия решений на основе данных + технологии работы с большими данными активно проникают в жизнь компаний и крупных корпораций, позволяя повысить эффективность бизнес-процессов. В то же время и данных для аналитики и обучения ИИ становится все больше и больше. В рамках курса мы предлагаем ознакомиться со всеми аспектами, которые сопровождают внедрение технологий Data Science в бизнес.
Денис Афанасьев
Преподаватель курса
Преподаватели
Денис Афанасьев
Генеральный директор, CleverDATA
Артем Просветов
Руководитель практики анализа данных и машинного интеллекта, CleverDATA
Сергей Жемжицкий
Технический директор, CleverDATA
Руководитель центра компетенции Больших Данных и ИИ группы компаний ЛАНИТ, руководитель проекта "Цифровой профиль" Ассоциации ФинТех, советник директора по стратегической аналитики компании IVI.RU.

Получил образование по специальности «Информатика» в Самарском аэрокосмическом университете. Имеет степень MBA Университета Уэлса (Англия), продолжает обучение по специальности Computer Science in Data Science в Университете Иллиноиса (США).

Начинал рядовым разработчиком компании по продаже компьютерной техники и комплектующих. Прошел пусть до CIO крупнейшего в России инвестиционного банка и основателя компании, работающей в области Больших данных и Искуственного Интеллекта. Остаётся верен своей профессии свыше 20 лет. Читает образовательные курсы по специальности.
Руководит практикой анализа данных в CleverDATA, занимается разработкой и настройкой рекомендательных систем, построением предсказательных моделей (отток, LTV, anti-fraud и т.д.), моделей Lookalike, реализацией self-driving маркетинга, а также работой с текстовыми данными (Natural Language Processing), в том числе для анализа блогосферы.

Продолжительное время работал в Институте Космических Исследований, последняя позиция была ведущего математика. Имеет ряд научных публикаций по анализу временных рядов и наблюдательных данных, неоднократный призер научных конкурсов.

Получил образование МФТИ по специальности "Прикладная математика и физика", окончил аспирантуру МФТИ, кандидат физ.-мат. наук. Развивает свою экспертизу в области Data Science и Deep Machine Learning.

Дополнительно проводит курс лекций на тему Big Data в Высшей Школе Экономики.
Автор ряда статей на Хабрахабре
Эксперт в области построения систем обработки больших данных и высоконагруженных систем. Суммарный опыт работы по специальности более 13 лет. Спикер профессиональных конференций по обработке данных и построению высоконагруженных систем. Автор вебинаров по построению высоконагруженных систем с использованием NoSQL.

В CleverDATA исполняет роль технического лидера основных продуктов: DMPKit (набор повторно используемых компонент для построения систем класса DMP) и Data Marketing Cloud (DMC, биржа данных).

Образование: Белорусский государственный университет – факультет Прикладной Математики и Информатики.
Денис
Афанасьев
Артем
Просветов
Сергей
Жемжицкий
Преподаватели
Денис Афанасьев
Генеральный директор, CleverDATA
Руководитель центра компетенции Больших Данных и ИИ группы компаний ЛАНИТ, руководитель проекта "Цифровой профиль" Ассоциации ФинТех, советник директора по стратегической аналитики компании IVI.RU.

Получил образование по специальности «Информатика» в Самарском аэрокосмическом университете. Имеет степень MBA Университета Уэлса (Англия), продолжает обучение по специальности Computer Science in Data Science в Университете Иллиноиса (США).

Начинал рядовым разработчиком компании по продаже компьютерной техники и комплектующих. Прошел пусть до CIO крупнейшего в России инвестиционного банка и основателя компании, работающей в области Больших данных и Искуственного Интеллекта. Остаётся верен своей профессии свыше 20 лет. Читает образовательные курсы по специальности.
Артем Просветов
Руководитель практики анализа данных и машинного интеллекта, CleverDATA
Руководит практикой анализа данных в CleverDATA, занимается разработкой и настройкой рекомендательных систем, построением предсказательных моделей (отток, LTV, anti-fraud и т.д.), моделей Lookalike, реализацией self-driving маркетинга, а также работой с текстовыми данными (Natural Language Processing), в том числе для анализа блогосферы.

Продолжительное время работал в Институте Космических Исследований, последняя позиция была ведущего математика. Имеет ряд научных публикаций по анализу временных рядов и наблюдательных данных, неоднократный призер научных конкурсов.

Получил образование МФТИ по специальности "Прикладная математика и физика", окончил аспирантуру МФТИ, кандидат физ.-мат. наук. Развивает свою экспертизу в области Data Science и Deep Machine Learning.

Дополнительно проводит курс лекций на тему Big Data в Высшей Школе Экономики.
Автор ряда статей на Хабрахабре
Сергей Жемжицкий
Технический директор, CleverDATA
Эксперт в области построения систем обработки больших данных и высоконагруженных систем. Суммарный опыт работы по специальности более 13 лет. Спикер профессиональных конференций по обработке данных и построению высоконагруженных систем. Автор вебинаров по построению высоконагруженных систем с использованием NoSQL.

В CleverDATA исполняет роль технического лидера основных продуктов: DMPKit (набор повторно используемых компонент для построения систем класса DMP) и Data Marketing Cloud (DMC, биржа данных).

Образование: Белорусский государственный университет – факультет Прикладной Математики и Информатики.
Big Data для менеджеров
Минимальные знания
    Вам потребуются базовые знания/понимание, хотя бы на уровне основных терминов:


  • теория менеджмента: что такое бизнес модель организации, бизнес-процессы, конкурентные преимущества, отчетность организации, бизнес-аналитика;
  • управление проектами: что такое проект, проектная команда, методологии управления проектами;
  • математика: теория вероятности, линейная алгебра;
  • теория информационных систем: системы хранения данных (теория баз данных), основы SQL, желательно базовые знания программирования (любой алгоритмический язык).
Для прохождения курса потребуется только компьютер с доступом в интернет, весь софт для домашних работ и практики будет доступен в облаке.
Процесс обучения
Обучение проходит в формате онлайн-вебинаров на русском языке.
Регулярность занятий: 2 раза в неделю по 2 академических часа (1.5 астрономических часа).

Каждую неделю предполагается выполнение 1 домашнего задания (время на выполнение: 2-4 академических часа). По всем практическим заданиям команда преподавателей дает развернутый фидбек.

Для прохождения курса потребуется только компьютер с доступом в интернет, весь софт для домашних работ и практики будет доступен в облаке.
Программа обучения
Модуль 1
Введение в дисциплину управления данными
Модуль 2
Роль данных в трансформации бизнеса (Data-Driven Business)
Модуль 3
Основы аналитики данных
Модуль 4
Основы технологий обработки больших данных (Data Engineering)
Модуль 5
Основы реализации проектов по аналитике данных (Data Science Management)
Модуль 6
Основы управления данными организации (Data Governance)
Модуль 7
Проектная работа
Введение в дисциплину управления данными

Тема 1: Введение в управление данными организации
Познакомим с актуальностью проблемы, основными терминами дисциплины управления данными, историей развития и основными историческими событиями и основами дисциплины:
- проблематика и обзор современных тенденций;
- Большие Данные, основы концепции, терминология и область применимости;
- закон Мура;
- понятие Gartner Hype Cycle.
- Скорость и стоимость вычислений, следствие закона Мура
- Цифровизация
- Big Data maturity index;
- индекс индустриальной цифровизации;
- Искуственный интеллект
- Основные проблемы внедрения AI в бизнес компаний
- Роль CDO в процессе data-трансформации
Тема 2: Концепция "Data-Driven организация"
Раскрываем основные аспекты концепции "data-driven организация", в чем ценность и выгоды данного подхода:
- Данные — определения, термины, процесс преобразования данных, характеристики данных, качество данных;
- откуда берутся большие данные, источники, машинные данные и способы их получения, рынок данных;
- основные принципы data-driven управления и роль data-driven подхода в бизнес-трансформации;
- основные виды аналитики данных;
- Data-аудит организации.
Роль данных в трансформации бизнеса (Data-Driven Business)
Тема 1: Введение в стратегический менеджмент организации
- Введение в стратегический менеджмент организации, виды бизнес-процессов
- Основные тренды развития экономики, бизнес-среды и теории управления бизнесом
- Теория экспоненциальных организаций, основные области автоматизации бизнеса для достижения конкурентных преимуществ
Тема 2: Использование данных для оптимизации управления организацией
- Поддержка принятия решений
- Мониторинг информационного пространства
- Автоматизация принятия решений и основные преимущества такого подхода
Тема 3: Использование данных для оптимизации функционирования организации
- Оптимизация бизнес-процессов компаний
- Примеры реальный кейсов в областях: маркетинг, финансы, логистика, производство, обслуживание клиентов, профилактика и диагностика оборудования, продажи
Основы аналитики данных
Тема 1: Введение в анализ данных
- Виды анализа данных
- Обзор основных задач Машинного обучения
Тема 2: Базовые элементы теории вероятности и статистики
Базовые понятия теории вероятности:
- математическое ожидание;
- теорема Байеса;
- Центральная Предельная Теорема;
- Закон Больших Чисел;
- основные распределения.

Базовые элементы статистики:
- построение гипотез;
- проверка гипотез с помощью тестов.
Тема 3: Базовые элементы Python
Базовые элементы языка Python:
- основы синтаксиса;
- работа с библиотеками Numpy, Scipy;
- работа с Pandas;
- работа с Sklearn;
Тема 4: Базовые алгоритмы кластеризации
Базовые алгоритмы кластеризации:
- Kmeans;
- иерархическая кластеризация;
- Dbscan;
- метрики качества для задачи кластеризации.
Тема 5: Основные алгоритмы машинного обучения и метрики качества
Базовые алгоритмы машинного обучения:
- логистическая регрессия;
- деревья решений;
- метод ближайших соседей.

Базовые метрики качества для задач:
- классификации;
- регрессия.
Тема 6: Работа с ансамблями
Работа с ансамблями:
- Random Forest;
- Gradient Boosting.
Домашние задания: 1
1 Анализ поведения человека по данным смартфона
В практической работе будет рассмотрен рабочий пример анализа поведения человека по данным смартфона. Будет проведено сравнение моделей классификации и продемонстрированы признаки переобучения. Будет рассмотрен процесс подбора параметров алгоритма RandomForest и проведена интерпретация результатов.
Тема 7: Базовые элементы нейронных сетей
Базовые понятия для работы с нейронными сетями:
- сигмойда и другие функции активации;
- метод обратного распространения ошибки;
- глубокие нейронные сети;
- автокодировщики;
- рекуррентные нейронные сети;
- сверточные нейронные сети.
Домашние задания: 1
1 использование нейронной сети для оценки эмоциональной окраски текста
Цель: В практической работе будет продемонстрировано, каким образом построить и натренировать нейронную сеть для решения задачи оценки эмоциональной окраски текстов.
Тема 8: Рекомендательные системы
Основные подходы в построении рекомендательных систем:
- коллаборативная фильтрация;
- ассоциативные правила;
- применение нейронных сетей для построения рекомендаций.
Основы технологий обработки больших данных (Data Engineering)
Тема 1: Основы теории управления данными. Ограничения и трудности классического подхода
Изучение теоретических основ:
- управление данными;
- ограничения и трудности классических подходов хранения и обработки данных;
- вопросы масштабирования систем обработки данных;
- виды и методы масштабирования систем хранения и обработки данных.
Домашние задания: 1
1 Основы теории управления данными. Quiz.
Цель: Закрепляем пройденный в лекции материал
Тема 2: Распределенные файловые системы. Введение в концепцию Map-Reduce
Знакомство c:
- распределенными файловыми системами;
- объектными хранилищами данных;
- отличиями распределенных файловых систем от объектных хранилищ;
- представителями распределенных файловых систем и объектных хранилищ.

Введение в концепцию Map-Reduce:
- знакомство с историей и предпосылками;
- теоретические основы Map-Reduce;
- практическое применение парадигмы Map-Reduce.
Домашние задания: 1
1 Распределенные файловые системы и Map-Reduce. Quiz.
Цель: Закрепляем пройденный в лекции материал
Тема 3: Введение в Hadoop. Экосистема Hadoop
Введение в Hadoop:
- история Hadoop и критерии его применимости;
- Hadoop и его составные части;
- распределенная файловая система hdfs;
- Yarn и управление ресурсами;
- Yarn и map-reduce;
- дистрибутивы Hadoop;
- сайзинг.

Экосистема Hadoop:
- обзор экосистемы Hadoop;
- обзор hive, spark, impala, presto, pig;
- обзор oozie, airflow.
Домашние задания: 1
1 Экосистема Hadoop. Quiz.
Цель: Закрепляем пройденный в лекции материал
Тема 4: Платформы хранения данных класса NoSQL. Платформы обработки данных реального времени
Платформы хранения данных класса NoSQL:
- предпосылки;
- обзор экосистемы;
- SQL;
- NoSQL (key-value, document, wide-column, graph);
- NewSQL;
- In-Memory DataGrids.

Платформы обработки данных реального времени:
- предпосылки;
- обзор экосистемы;
- обработка данных;
- доставка данных;
- Spark Streaming, Flink, Samza, Storm, Heron, и др.;
- Kafka, Pulsar и др.
Домашние задания: 1
1 NoSQL & Stream Processing. Quiz.
Цель: Закрепляем пройденный в лекции материал
Тема 5: Интеграция. Визуализация. Управление
- Интеграция данных
- Средства визуализации данных
- Управление ресурсами и инфраструктурой обработки данных
Домашние задания: 1
1 Интеграция и визуализация данных. Quiz.
Цель: Закрепляем пройденный в лекции материал
Тема 6: Комплексные архитектуры хранения и обработки данных
Комплексные архитектуры хранения и обработки данных:
- корпоративное хранилище данных (DWH);
- озеро данных (Data Lake);
- отличия и сходства хранилищ данных и озер данных;
- лямбда-архитектура;
- каппа-архитектура;
- дзета-архитектура.
Домашние задания: 1
1 Комплексные архитектуры хранения и обработки данных. Quiz.
Цель: Закрепляем пройденный в лекции материал
Основы реализации проектов по аналитике данных (Data Science Management)

Тема 1: Основные этапы проекта по анализу данных
- Обзор имеющихся методологий
- Методология CRISP-DM и ее особенности
- Основные этапы проекта по анализу данных, постановка задачи, оценка результата, коммуникация результата
- Оценка экономической эффективности
Тема 2: Особенности управления проектами, связанными с аналитикой и большими данными
- Построение проектной команды, различные организационные структуры
- Управление персоналом, вопросы найма и развития компетенций
- Взаимодействие с бизнес-заказчиком
- Вопросы выбора инструментария
- Практические рекомендации и подводные камни
Основы управления данными организации (Data Governance)
Тема 1: Основы дисциплины Data Governance, часть 1
- Основные цели и задачи
- Развитие компетенций, развитие организационной структуры и культуры организации
- Вопросы управления качеством данных и мета-данными, политиками ввода данных, интеграции данных
- Вопросы аутсорсинга, краудсорсинга, инсорсинга
- Качество данных
Тема 2: Основы дисциплины Data Governance, часть 2
- Вопросы развития инфраструктуры (облачные модели, собственная инфраструктура)
- Особенности законодательства и регуляторных требований по сбору и обработки данных (модели США, Европейского союза, Китая, обзор текущей ситуации Российского рынка, введение в GDPR)
- Вопросы этики, приватности, владения данными, безопасности данных
- Концепция Human in the loop
Тема 3: Дорожная карта бизнес-трансформации
- Индекс цифровой зрелости организации
- Стратегия монетизации данных, новые бизнес модели в эпоху больших данных, Индустрия 4.0
- Дорожная карта бизнес-трансформации, карта бенефициаров
22 июля, 20:00 — 21:30
Лектор: Денис Афанасьев
Проектная работа
Разработать стратегию монетизации данных для организации: ваша организация/любая знакомая вам организация. Проектная работа должна по объему быть не менее 5000 слов и раскрывать следующие вопросы:

1. Краткое описание компании и описание текущей ситуации по использованию аналитики данных в компании:
• дать общее описание компании, бизнес-модели, продуктов и сервисов;
• конкурентная организационная стратегия (управление затратами, дифференциация или фокус);
• бизнес-цели и задачи, достижение которых необходимо поддержать технологиями.

2. Аудит источников данных:
• общее описание используемых технологий, систем и платформ управления данными;
• общая оценка текущих компетенций компании, связанных с обработкой и использованием данных;
• аудит источников данных;
• описание текущих data-активов – источники, характеристики данных (скорость, формат, объем);
• описать потенциальные источники dark-data в организации.

3. Результат аудита бизнес-процессов:
• идентифицировать и описать бизнес-процессы (в целом по организации, не менее 3-х), в которых присутствует элемент принятия решений;
• оценка стоимости каждого бизнес-процесса и его влияния на бизнес-результат.

4. Заключение по аудиту:
• определить и описать, какие данные могут оптимизировать или масштабировать процесс, какие выгоды организация может получить в рамках реализации инициатив;
• определить потенциальные точки внешней монетизации данных.

5. Описание аналитической задачи:
• определить бизнес-процесс для модификации с помощью технологий Big Data;
• сформулировать критерии достижения результата;
• идентифицировать данные (внутренние/ внешние);
• описать структуру данных, характеристики (объем, скорость генерации).

6. Описание структуры аналитического проекта:
• в соответствии с методологией CRISP описать процесс решения аналитической задачи, предложить таймлайн и этапность;
• сделать предположение, какие аналитические модели и методы обучения позволят решить поставленную задачу;
• описать критерии качества выбранных моделей.

7. Описание архитектуры аналитического хранилища:
• выбрать и описать технологический стек и архитектуру решения для хранения и обработки данных, аргументировать свой выбор, указать преимущества выбранного решения и почему оно подходит под данную конкретную задачу;
• схематично нарисовать архитектуру аналитического хранилища и потоки данных с указанием источников и приемников.

8. Описание рисков и бизнес-результата:
• описать риски, связанные с реализаций проекта – технические, юридические, этические;
• сделать расчет экономического эффекта реализации проекта и оценить его влияние на организацию, персонал;
• описать команду проекта и требуемые компетенции.
Тема 1: Консультация по проектной работе
Слушатели курса смогут определиться с темой проекта и получить понимание, какие ресурсы им необходимо использовать для работы.
29 июля, 20:00 — 21:30
Лектор: Денис Афанасьев
Домашние задания: 1
1 Проектная работа
Тема 2: Консультация по проектной работе
Слушатели курса получат комментарии относительно прогресса проектной работы, ответы на вопросы, рекомендации по реализации.
5 августа, 20:00 — 21:30
Лектор: Денис Афанасьев
Тема 3: Защита проектных работ
По окончании занятия слушатели курса получат разбор проектов, комментарии и оценку своей работы.
21 августа, 20:00 — 21:30
Лектор: Денис Афанасьев
Прошедшие открытые вебинары по курсу
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Блеск и красота анализа данных в маркетинге
Артем Просветов
День открытых дверей
10 апреля в 20:00
После обучения вы

  • заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач);

  • получите сертификат о прохождении курса;

  • будете приглашены пройти собеседование в компаниях-партнерах OTUS (в случае успешного обучения на курсе);

  • станете амбасадором data-трансформации в своей организации;

  • заговорите на одном языке с поставщиками аналитических решений.

Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Big Data для менеджеров»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Генеральный директор ООО “Отус Онлайн-Образование”
Виталий Чибриков

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018г.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Big Data для менеджеров»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Генеральный директор ООО “Отус Онлайн-Образование”
Виталий Чибриков

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018г.