Big Data для менеджеров

Погружение бизнес-специалистов без технического бэкграунда в экосистему Data Science-проектов. Раскрываем принципы Data-driven трансформации бизнеса, изучаем технологии анализа данных. Разбираем подводные камни, сложности внедрения и реализации проектов.

Длительность

3 месяца

Начало

17 апреля

Занятия

Пн 20:00, Ср 20:00

Общая стоимость

38 000 ₽

В месяц

15 000 ₽

В кредит:

15000 ₽ в месяц

Хочу дешевле
Общая стоимость
38 000 ₽
В месяц: 15 000 ₽
В кредит: 38000 ₽
в месяц
Продолжительность
3 месяца, 4 часа в неделю
Пн 20:00, Ср 20:00
Начало занятий
17 апреля
Что даст вам этот курс

Курс разработан для руководителей отделов и подразделений, чьи рабочие процессы неразрывно связаны с большими объемами данных и потребностью в их обработке.

Программа даст вам понимание сути и принципов внедрения современных аналитических механизмов (машинное обучение, нейросети, рекомендательные системы и др.), необходимых для продвижения продуктов и услуг своих подразделений в цифровом пространстве и повышения эффективности своих организаций.

Прикладная польза курса:

  • разберем термины мира Больших Данных и научим говорить на одном языке с поставщиками аналитических решений (внутренними и внешними);

  • проанализируем возможности аналитических инструментов и их связь с целями бизнеса (на основе кейсов из разных отраслей);

  • проделаем своими руками основополагающие задачи анализа данных
    (математика и программирование будут в задачах со звездочкой!).



Объемный комплексный курс:


покрываем все аспекты бизнес-трансформации: от методов и технологий до структуры команды

и data-driven management

Адаптированная программа:


для профессионалов, еще не обладающих специфическими знаниями по математике и программированию

Компетенции, востребованные на рынке:


грамотные бизнес-заказчики ценятся наравне с техническими исполнителями

Траектории карьерного развития:


выпускники курса подготовлены к освоению углубленных курсов по аналитике
Подходы принятия решений на основе данных + технологии работы с большими данными активно проникают в жизнь компаний и крупных корпораций, позволяя повысить эффективность бизнес-процессов. В то же время и данных для аналитики и обучения ИИ становится все больше и больше. В рамках курса мы предлагаем ознакомиться со всеми аспектами, которые сопровождают внедрение технологий Data Science в бизнес.
Денис Афанасьев
Преподаватель курса
Подходы принятия решений на основе данных + технологии работы с большими данными активно проникают в жизнь компаний и крупных корпораций, позволяя повысить эффективность бизнес-процессов. В то же время и данных для аналитики и обучения ИИ становится все больше и больше. В рамках курса мы предлагаем ознакомиться со всеми аспектами, которые сопровождают внедрение технологий Data Science в бизнес.
Денис Афанасьев
Преподаватель курса
Преподаватели
Денис Афанасьев
Генеральный директор, CleverDATA
Артем Просветов
Руководитель практики анализа данных и машинного интеллекта, CleverDATA
Сергей Жемжицкий
Технический директор, CleverDATA
Руководитель центра компетенции Больших Данных и ИИ группы компаний ЛАНИТ, руководитель проекта "Цифровой профиль" Ассоциации ФинТех, советник директора по стратегической аналитики компании IVI.RU.

Получил образование по специальности «Информатика» в Самарском аэрокосмическом университете. Имеет степень MBA Университета Уэлса (Англия), продолжает обучение по специальности Computer Science in Data Science в Университете Иллиноиса (США).

Начинал рядовым разработчиком компании по продаже компьютерной техники и комплектующих. Прошел пусть до CIO крупнейшего в России инвестиционного банка и основателя компании, работающей в области Больших данных и Искуственного Интеллекта. Остаётся верен своей профессии свыше 20 лет. Читает образовательные курсы по специальности.
Руководит практикой анализа данных в CleverDATA, занимается разработкой и настройкой рекомендательных систем, построением предсказательных моделей (отток, LTV, anti-fraud и т.д.), моделей Lookalike, реализацией self-driving маркетинга, а также работой с текстовыми данными (Natural Language Processing), в том числе для анализа блогосферы.

Продолжительное время работал в Институте Космических Исследований, последняя позиция была ведущего математика. Имеет ряд научных публикаций по анализу временных рядов и наблюдательных данных, неоднократный призер научных конкурсов.

Получил образование МФТИ по специальности "Прикладная математика и физика", окончил аспирантуру МФТИ, кандидат физ.-мат. наук. Развивает свою экспертизу в области Data Science и Deep Machine Learning.

Дополнительно проводит курс лекций на тему Big Data в Высшей Школе Экономики.
Автор ряда статей на Хабрахабре
Эксперт в области построения систем обработки больших данных и высоконагруженных систем. Суммарный опыт работы по специальности более 13 лет. Спикер профессиональных конференций по обработке данных и построению высоконагруженных систем. Автор вебинаров по построению высоконагруженных систем с использованием NoSQL.

В CleverDATA исполняет роль технического лидера основных продуктов: DMPKit (набор повторно используемых компонент для построения систем класса DMP) и Data Marketing Cloud (DMC, биржа данных).

Образование: Белорусский государственный университет – факультет Прикладной Математики и Информатики.
Денис
Афанасьев
Артем
Просветов
Сергей
Жемжицкий
Преподаватели
Денис Афанасьев
Генеральный директор, CleverDATA
Руководитель центра компетенции Больших Данных и ИИ группы компаний ЛАНИТ, руководитель проекта "Цифровой профиль" Ассоциации ФинТех, советник директора по стратегической аналитики компании IVI.RU.

Получил образование по специальности «Информатика» в Самарском аэрокосмическом университете. Имеет степень MBA Университета Уэлса (Англия), продолжает обучение по специальности Computer Science in Data Science в Университете Иллиноиса (США).

Начинал рядовым разработчиком компании по продаже компьютерной техники и комплектующих. Прошел пусть до CIO крупнейшего в России инвестиционного банка и основателя компании, работающей в области Больших данных и Искуственного Интеллекта. Остаётся верен своей профессии свыше 20 лет. Читает образовательные курсы по специальности.
Артем Просветов
Руководитель практики анализа данных и машинного интеллекта, CleverDATA
Руководит практикой анализа данных в CleverDATA, занимается разработкой и настройкой рекомендательных систем, построением предсказательных моделей (отток, LTV, anti-fraud и т.д.), моделей Lookalike, реализацией self-driving маркетинга, а также работой с текстовыми данными (Natural Language Processing), в том числе для анализа блогосферы.

Продолжительное время работал в Институте Космических Исследований, последняя позиция была ведущего математика. Имеет ряд научных публикаций по анализу временных рядов и наблюдательных данных, неоднократный призер научных конкурсов.

Получил образование МФТИ по специальности "Прикладная математика и физика", окончил аспирантуру МФТИ, кандидат физ.-мат. наук. Развивает свою экспертизу в области Data Science и Deep Machine Learning.

Дополнительно проводит курс лекций на тему Big Data в Высшей Школе Экономики.
Автор ряда статей на Хабрахабре
Сергей Жемжицкий
Технический директор, CleverDATA
Эксперт в области построения систем обработки больших данных и высоконагруженных систем. Суммарный опыт работы по специальности более 13 лет. Спикер профессиональных конференций по обработке данных и построению высоконагруженных систем. Автор вебинаров по построению высоконагруженных систем с использованием NoSQL.

В CleverDATA исполняет роль технического лидера основных продуктов: DMPKit (набор повторно используемых компонент для построения систем класса DMP) и Data Marketing Cloud (DMC, биржа данных).

Образование: Белорусский государственный университет – факультет Прикладной Математики и Информатики.
Big Data для менеджеров
Минимальные знания
    Вам потребуются базовые знания/понимание, хотя бы на уровне основных терминов:


  • теория менеджмента: что такое бизнес модель организации, бизнес-процессы, конкурентные преимущества, отчетность организации, бизнес-аналитика;
  • управление проектами: что такое проект, проектная команда, методологии управления проектами;
  • математика: теория вероятности, линейная алгебра;
  • теория информационных систем: системы хранения данных (теория баз данных), основы SQL, желательно базовые знания программирования (любой алгоритмический язык).
Для прохождения курса потребуется только компьютер с доступом в интернет, весь софт для домашних работ и практики будет доступен в облаке.
Процесс обучения
Обучение проходит в формате онлайн-вебинаров на русском языке.
Регулярность занятий: 2 раза в неделю по 2 академических часа (1.5 астрономических часа).

Каждую неделю предполагается выполнение 1 домашнего задания (время на выполнение: 2-4 академических часа). По всем практическим заданиям команда преподавателей дает развернутый фидбек.

Для прохождения курса потребуется только компьютер с доступом в интернет, весь софт для домашних работ и практики будет доступен в облаке.
Программа обучения
Модуль 1
Введение в дисциплину управления данными
Модуль 2
Роль данных в трансформации бизнеса (Data-Driven Business)
Модуль 3
Основы аналитики данных
Модуль 4
Основы технологий обработки больших данных (Data Engineering)
Модуль 5
Основы реализации проектов по аналитике данных (Data Science Management)
Модуль 6
Основы управления данными организации (Data Governance)
Модуль 7
Проектная работа
Введение в дисциплину управления данными

Введение в управление данными организации
Познакомим с актуальностью проблемы, основными терминами дисциплины управления данными, историей развития и основными историческими событиями и основами дисциплины:
- проблематика и обзор современных тенденций;
- Большие Данные, основы концепции, терминология и область применимости;
- закон Мура;
- понятие Gartner Hype Cycle.
- Скорость и стоимость вычислений, следствие закона Мура
- Цифровизация
- Big Data maturity index;
- индекс индустриальной цифровизации;
- Искуственный интеллект
- Основные проблемы внедрения AI в бизнес компаний
- Роль CDO в процессе data-трансформации
Концепция "Data-Driven организация"
Раскрываем основные аспекты концепции "data-driven организация", в чем ценность и выгоды данного подхода:
- Данные — определения, термины, процесс преобразования данных, характеристики данных, качество данных;
- откуда берутся большие данные, источники, машинные данные и способы их получения, рынок данных;
- основные принципы data-driven управления и роль data-driven подхода в бизнес-трансформации;
- основные виды аналитики данных;
- Data-аудит организации.
24 апреля, 20:00 — 21:30
Лектор: Денис Афанасьев
Роль данных в трансформации бизнеса (Data-Driven Business)
Введение в стратегический менеджмент организации
- Введение в стратегический менеджмент организации, виды бизнес-процессов
- Основные тренды развития экономики, бизнес-среды и теории управления бизнесом
- Теория экспоненциальных организаций, основные области автоматизации бизнеса для достижения конкурентных преимуществ
29 апреля, 20:00 — 21:30
Использование данных для оптимизации управления организацией
- Поддержка принятия решений
- Мониторинг информационного пространства
- Автоматизация принятия решений и основные преимущества такого подхода
6 мая, 20:00 — 21:30
Использование данных для оптимизации функционирования организации
- Оптимизация бизнес-процессов компаний
- Примеры реальный кейсов в областях: маркетинг, финансы, логистика, производство, обслуживание клиентов, профилактика и диагностика оборудования, продажи
8 мая, 20:00 — 21:30
Дорожная карта бизнес-трансформации
- Индекс цифровой зрелости организации
- Стратегия монетизации данных, новые бизнес модели в эпоху больших данных, Индустрия 4.0
- Дорожная карта бизнес-трансформации, карта бенефициаров
13 мая, 20:00 — 21:30
Основы аналитики данных
Введение в анализ данных
- Виды анализа данных
- Обзор основных задач Машинного обучения
15 мая, 20:00 — 21:30
Базовые элементы теории вероятности и статистики
Базовые понятия теории вероятности:
- математическое ожидание;
- теорема Байеса;
- Центральная Предельная Теорема;
- Закон Больших Чисел;
- основные распределения.

Базовые элементы статистики:
- построение гипотез;
- проверка гипотез с помощью тестов.
20 мая, 20:00 — 21:30
Базовые элементы Python
Базовые элементы языка Python:
- основы синтаксиса;
- работа с библиотеками Numpy, Scipy;
- работа с Pandas;
- работа с Sklearn;
22 мая, 20:00 — 21:30
Базовые алгоритмы кластеризации
Базовые алгоритмы кластеризации:
- Kmeans;
- иерархическая кластеризация;
- Dbscan;
- метрики качества для задачи кластеризации.
27 мая, 20:00 — 21:30
Основные алгоритмы машинного обучения и метрики качества
Базовые алгоритмы машинного обучения:
- логистическая регрессия;
- деревья решений;
- метод ближайших соседей.

Базовые метрики качества для задач:
- классификации;
- регрессия.
29 мая, 20:00 — 21:30
Работа с ансамблями
Работа с ансамблями:
- Random Forest;
- Gradient Boosting.
3 июня, 20:00 — 21:30
Базовые элементы нейронных сетей
Базовые понятия для работы с нейронными сетями:
- сигмойда и другие функции активации;
- метод обратного распространения ошибки;
- глубокие нейронные сети;
- автокодировщики;
- рекуррентные нейронные сети;
- сверточные нейронные сети.
5 июня, 20:00 — 21:30
Рекомендательные системы
Основные подходы в построении рекомендательных систем:
- коллаборативная фильтрация;
- ассоциативные правила;
- применение нейронных сетей для построения рекомендаций.
10 июня, 20:00 — 21:30
Основы технологий обработки больших данных (Data Engineering)
Основы теории управления данными. Ограничения и трудности классического подхода
Изучение теоретических основ:
- управление данными;
- ограничения и трудности классических подходов хранения и обработки данных;
- вопросы масштабирования систем обработки данных;
- виды и методы масштабирования систем хранения и обработки данных.
17 июня, 20:00 — 21:30
Распределенные файловые системы. Введение в концепцию Map-Reduce
Знакомство c:
- распределенными файловыми системами;
- объектными хранилищами данных;
- отличиями распределенных файловых систем от объектных хранилищ;
- представителями распределенных файловых систем и объектных хранилищ.

Введение в концепцию Map-Reduce:
- знакомство с историей и предпосылками;
- теоретические основы Map-Reduce;
- практическое применение парадигмы Map-Reduce.
19 июня, 20:00 — 21:30
Введение в Hadoop. Экосистема Hadoop
Введение в Hadoop:
- история Hadoop и критерии его применимости;
- Hadoop и его составные части;
- распределенная файловая система hdfs;
- Yarn и управление ресурсами;
- Yarn и map-reduce;
- дистрибутивы Hadoop;
- сайзинг.

Экосистема Hadoop:
- обзор экосистемы Hadoop;
- обзор hive, spark, impala, presto, pig;
- обзор oozie, airflow.
24 июня, 20:00 — 21:30
Платформы хранения данных класса NoSQL. Платформы обработки данных реального времени
Платформы хранения данных класса NoSQL:
- предпосылки;
- обзор экосистемы;
- SQL;
- NoSQL (key-value, document, wide-column, graph);
- NewSQL;
- In-Memory DataGrids.

Платформы обработки данных реального времени:
- предпосылки;
- обзор экосистемы;
- обработка данных;
- доставка данных;
- Spark Streaming, Flink, Samza, Storm, Heron, и др.;
- Kafka, Pulsar и др.
26 июня, 20:00 — 21:30
Интеграция. Визуализация. Управление
- Интеграция данных
- Средства визуализации данных
- Управление ресурсами и инфраструктурой обработки данных
1 июля, 20:00 — 21:30
Комплексные архитектуры хранения и обработки данных
Комплексные архитектуры хранения и обработки данных:
- корпоративное хранилище данных (DWH);
- озеро данных (Data Lake);
- отличия и сходства хранилищ данных и озер данных;
- лямбда-архитектура;
- каппа-архитектура;
- дзета-архитектура.
3 июля, 20:00 — 21:30
Основы реализации проектов по аналитике данных (Data Science Management)

Основные этапы проекта по анализу данных
- Обзор имеющихся методологий
- Методология CRISP-DM и ее особенности
- Основные этапы проекта по анализу данных, постановка задачи, оценка результата, коммуникация результата
- Оценка экономической эффективности
8 июля, 20:00 — 21:30
Особенности управления проектами, связанными с аналитикой и большими данными
- Построение проектной команды, различные организационные структуры
- Управление персоналом, вопросы найма и развития компетенций
- Взаимодействие с бизнес-заказчиком
- Вопросы выбора инструментария
- Практические рекомендации и подводные камни
10 июля, 20:00 — 21:30
Основы управления данными организации (Data Governance)
Основы дисциплины Data Governance, часть 1
- Основные цели и задачи
- Развитие компетенций, развитие организационной структуры и культуры организации
- Вопросы управления качеством данных и мета-данными, политиками ввода данных, интеграции данных
- Вопросы аутсорсинга, краудсорсинга, инсорсинга
- Качество данных
15 июля, 20:00 — 21:30
Основы дисциплины Data Governance, часть 2
- Вопросы развития инфраструктуры (облачные модели, собственная инфраструктура)
- Особенности законодательства и регуляторных требований по сбору и обработки данных (модели США, Европейского союза, Китая, обзор текущей ситуации Российского рынка, введение в GDPR)
- Вопросы этики, приватности, владения данными, безопасности данных
- Концепция Human in the loop
17 июля, 20:00 — 21:30
Проектная работа
Разработать стратегию монетизации данных для организации: ваша организация/любая знакомая вам организация. Проектная работа должна по объему быть не менее 5000 слов и раскрывать следующие вопросы:

1. Краткое описание компании и описание текущей ситуации по использованию аналитики данных в компании:
• дать общее описание компании, бизнес-модели, продуктов и сервисов;
• конкурентная организационная стратегия (управление затратами, дифференциация или фокус);
• бизнес-цели и задачи, достижение которых необходимо поддержать технологиями.

2. Аудит источников данных:
• общее описание используемых технологий, систем и платформ управления данными;
• общая оценка текущих компетенций компании, связанных с обработкой и использованием данных;
• аудит источников данных;
• описание текущих data-активов – источники, характеристики данных (скорость, формат, объем);
• описать потенциальные источники dark-data в организации.

3. Результат аудита бизнес-процессов:
• идентифицировать и описать бизнес-процессы (в целом по организации, не менее 3-х), в которых присутствует элемент принятия решений;
• оценка стоимости каждого бизнес-процесса и его влияния на бизнес-результат.

4. Заключение по аудиту:
• определить и описать, какие данные могут оптимизировать или масштабировать процесс, какие выгоды организация может получить в рамках реализации инициатив;
• определить потенциальные точки внешней монетизации данных.

5. Описание аналитической задачи:
• определить бизнес-процесс для модификации с помощью технологий Big Data;
• сформулировать критерии достижения результата;
• идентифицировать данные (внутренние/ внешние);
• описать структуру данных, характеристики (объем, скорость генерации).

6. Описание структуры аналитического проекта:
• в соответствии с методологией CRISP описать процесс решения аналитической задачи, предложить таймлайн и этапность;
• сделать предположение, какие аналитические модели и методы обучения позволят решить поставленную задачу;
• описать критерии качества выбранных моделей.

7. Описание архитектуры аналитического хранилища:
• выбрать и описать технологический стек и архитектуру решения для хранения и обработки данных, аргументировать свой выбор, указать преимущества выбранного решения и почему оно подходит под данную конкретную задачу;
• схематично нарисовать архитектуру аналитического хранилища и потоки данных с указанием источников и приемников.

8. Описание рисков и бизнес-результата:
• описать риски, связанные с реализаций проекта – технические, юридические, этические;
• сделать расчет экономического эффекта реализации проекта и оценить его влияние на организацию, персонал;
• описать команду проекта и требуемые компетенции.
Вводное занятие по проектной работе
Слушатели курса смогут определиться с темой проекта и получить понимание, какие ресурсы им необходимо использовать для работы.
Домашние задания: 1
1 Проектная работа
Консультация по проектной работе
Слушатели курса получат комментарии относительно прогресса проектной работы, ответы на вопросы, рекомендации по реализации.
Защита проектных работ
По окончании занятия слушатели курса получат разбор проектов, комментарии и оценку своей работы.
Подглядеть
Блеск и красота анализа данных в маркетинге
Артем Просветов
Видеоматериалы по теме
День открытых дверей
10 апреля в 20:00
После обучения вы

  • заберете с собой материалы по всем занятиям (презентации, записи вебинаров, примеры практических задач);

  • получите сертификат о прохождении курса;

  • будете приглашены пройти собеседование в компаниях-партнерах OTUS (в случае успешного обучения на курсе);

  • станете амбасадором data-трансформации в своей организации;

  • заговорите на одном языке с поставщиками аналитических решений.

Дата выдачи сертификата: 7 августа 2019 года
Ваш сертификат
otus.ru
Константин Константинопольский
успешно закончил курс
«Big Data для менеджеров»
Успешных заданий:
16 из 16
Проектная работа:
Распределённая система сетевого мониторинга
Виталий Чибриков
Генеральный директор
№ 0001
otus.ru
Константин Константинопольский
успешно закончил курс
«Big Data для менеджеров»
Успешных заданий:
16 из 16
Проектная работа:
Распределённая система сетевого мониторинга
Виталий Чибриков
Генеральный директор
№ 0001
Общая стоимость
38 000 ₽
В месяц: 15 000 ₽
В кредит: ₽ в месяц
Продолжительность
3 месяца
Начало занятий
17 апреля