Big Data для менеджеров

Что даст вам этот курс
10
1
Курс «Big Data для бизнеса» предназначен для руководителей, чьи рабочие процессы неразрывно связаны с большими объемами данных и потребностью в их обработке. Внедрение и понимание сути современных аналитических механизмов (машинное обучение, нейросети, рекомендательные системы и др.) необходимо для продвижения продуктов и услуг своих подразделений в цифровом пространстве и повышения эффективности своих организаций.

Прикладная польза курса:
- научим говорить на одном языке с поставщиками аналитических решений (внутренними и внешними)
- разберем все незнакомые термины мира Больших Данных
- проанализируем прикладной характер подходов и методов
- попробуем своими руками проделать основополагающие задачи анализа данных

(математика и программирования будут в задачах со звездочкой!).

Курс охватывает как вопросы трансформации бизнеса и разработки стратегии трансформации, так и вопросы технологий обработки и аналитики данных. Так же мы расскажем о подводных камнях, сложностях проектов, связанных с внедрением аналитики данных. Разберем лучшие практики и подходы к реализации таких проектов.

Длительность курса: 3 месяца занятий + 1 месяц на выполнение проекта

Отличительные особенности курса:
1. Цель обучения - подготовка грамотного заказчика, а не специалиста по реализации проектов. На рынке сейчас большая нехватка грамотных бизнес заказчиков и эта проблема становится все более критичной.
2. Содержание - курс покрывает все темы, которые входят в понятие Big Data: бизнес-трансформация, аналитика данных, технологии обработки данных, data-driven management. Курс дает максимально полную картину и необходимый минимум для дальнейшего развития.
3. Аудитория - не технические специалисты, которые являются руководителями среднего звена. Как правило все курсы на рынке рассчитаны на подготовку аналитиков данных и требуют технического бэкграунда. Мы же уделяем внимание специалистам, которым ранее не приходилось сталкиваться с техническим функционалом обработки данных, но в ближайшем будущем это станет необходимым навыком.
4. Развитие - после прохождения данного курса, слушатели могут переходить на курсы по аналитике данных или по технологиям работки данных.
Программа обучения
Модуль 1
Введение в дисциплину управления данными
Модуль 2
Роль данных в трансформации бизнеса (Data-Driven Business)
Модуль 3
Основы аналитики данных
Модуль 4
Основы технологий обработки больших данных (Data Engineering)
Модуль 5
Основы реализации проектов по аналитике данных (Data Science Management)
Модуль 6
Основы управления данными организации (Data Governance)
Модуль 7
Проектная работа
Введение в дисциплину управления данными
• Большие Данные, основы концепции, терминология и область применимости
• Основные принципы data-driven управления и роль data-driven подхода в бизнес-трансформации
• Данные - определения, термины, процесс преобразования данных, характеристики данных, качество данных
• Откуда берутся большие данные, источники, машинные данные и способы их получения, рынок данных
• Data- аудит организации
Оценить модуль
0
0
Роль данных в трансформации бизнеса (Data-Driven Business)
• Введение с стратегический менеджмент организации, виды бизнес-процессов
• Основные тренды развития экономики, бизнес-среды и теории управления бизнесом
• Теория экспоненциальных организаций, основные области автоматизации бизнеса для достижения конкурентных преимуществ
• Использование данных для оптимизации управления организацией (принятие решений, мониторинг информационного пространства)
• Использование данных для оптимизации функционирования организации (маркетинг, финансы, логистика, производство, обслуживание клиентов, профилактика и диагностика оборудования, продажи)
• Индекс цифровой зрелости организации
• Стратегия монетизации данных, новые бизнес модели в эпоху больших данных, Индустрия 4.0
• Дорожная карта бизнес-трансформации, карта бенефициаров
Оценить модуль
1
0
Основы аналитики данных
• Виды анализа данных, A/B тестирование
• Базовые понятия теории вероятности (математическое ожидание, теорема Байеса, Центральная Предельная Теорема)
Базовые понятия статистики (проверка гипотез, построение доверительных интервалов, параметрические тесты, непараметрические тесты)
Основы языка Python
• Введение в теорию машинного обучения (типология задач машинного обучения, обучение с учителем, обучение без учителя, обучение с подкреплением, формирование признаков, логистическая регрессия, деревья решений, проблема переобучения, нормализация и регуляризация, оценка качества моделей, метод опорных векторов, алгоритмы кластеризации)
• Ансамбли моделей (метрики качества, основная мотивация в использовании ансамблей моделей, Random Forest, Gradient Boosting)
• Практика работы с данными (метод кластеризация К-средних, методы понижения размерности (метод главных компонент), рекомендательные системы)
• Введение в нейронные сети (базовые понятия нейронных сетей, принцип обратного распространения ошибки, обзор базовых элементов сверточных нейронных сетей, обзор базовых элементов рекуррентных нейронных сетей)
• Визуализация данных, коммуникация результатов аналитики данных
Оценить модуль
0
0
Основы технологий обработки больших данных (Data Engineering)
• Основы теории управления данными и реляционные системы управления данными, ограничения и трудности классического подхода
• Вопросы масштабирования систем обработки данных, виды и методы масштабирования
• Введение в концепцию Map-Reduce
• Распределенные файловые системы, экосистема Hadoop
• Платформы хранения данные класса NoSQL
• Платформы аналитики реального времени
• Средства визуализации данных, интеграции данных, управления инфраструктурой
• Комплексные архитектуры хранения и обработки данных, обзор архитектур хранилищ данных, озер данных, лямбда и каппа архитектур
Оценить модуль
0
0
Основы реализации проектов по аналитике данных (Data Science Management)
• Обзор имеющихся методологий
• Методология CRISP-DM и ее особенности
• Основные этапы проекта по анализу данных, постановка задачи, оценка результата, коммуникация результата
• Построение проектной команды, различные организационные структуры
• Управление персоналом, вопросы найма и развития компетенций
• Взаимодействие с бизнес-заказчиком
• Вопросы выбора инструментария
• Практические рекомендации и подводные камни
Оценить модуль
1
0
Основы управления данными организации (Data Governance)
• Развитие компетенций, развитие организационной структуры и развития культуры организации
• Вопросы управления качеством данных и мета-данными, политиками ввода данных, интеграции данных
• Вопросы аутсорсинга, краудсорсинга, инсорсинга
• Вопросы развития инфраструктуры (облачные модели, собственная инфраструктура)
• Особенности законодательства и регуляторных требований по сбору и обработки данных (модели США, Европейского союза, Китая, обзор текущей ситуации Российского рынка, введение в GDPR)
• Вопросы этики, приватности, владения данными, безопасности данных
Оценить модуль
1
0
Проектная работа
Разработать стратегию монетизации данных для организации: ваша организация/любая знакомая вам организация. Проектная работа должна по объему быть не менее 5000 слов и раскрывать следующие вопросы:

Краткое описание компании и описание текущей ситуации по использовании аналитики данных в компании
• Дать общее описание компании, бизнес-модели, продуктов и сервисов
• Конкурентная организационная стратегия (управление затратами, дифференциация или фокус)
• Бизнес-цели и задачи, достижение которых необходимо поддержать технологиями

Аудит источников данных
• Общение описание используемых технологий, систем и платформ управления данными
• Общая оценка текущих компетенций компании, связанных с обработкой и использованием данных
• Аудит источников данных
• Описание текущих data-активов – источники, характеристики данных (скорость, формат, объем)
• Описание потенциальные источники dark-data в организации

Результат аудита бизнес-процессов
• Идентифицировать и описать бизнес-процессы (в целом по организации, не менее 3-х), в которых присутствует элемент принятия решений
• Оценка стоимости каждого бизнес-процесса и его влияния на бизнес-результат

Заключение по аудиту
• Определить и описать какие данные могут оптимизировать или масштабировать процесс, какие выгоды организация может получить в рамках реализации инициатив
• Определить потенциальные точки внешней монетизации данных

Описание аналитической задачи
• Определить бизнес-процесс для модификации с помощью технологий Big Data
• Сформулировать критерии достижения результата
• Идентифицировать данные (внутренние/ внешние)
• Описать структуру данных, характеристики (объем, скорость генерации)

Описание структура аналитического проекта
• В соответствии с методологией CRISP описать процесс решения аналитической задачи, предложить таймлайн и этапность
• Сделать предположение, какие аналитические модели и методы обучения позволят решить поставленную задачу
• Описать критерии качества выбранных моделей

Описание архитектуры аналитического хранилища
• Выбрать и описать технологический стек и архитектуру решения для хранения и обработки данных, аргументировать свой выбор, указать преимущества выбранного решения и почему оно подходит под данную конкретную задачу
• Схематично нарисовать архитектуру аналитического хранилища и потоки данных с указанием источников и приемников

Описание рисков и бизнес-результата
• Описать риски, связанные с реализаций проекта – технические, юридические, этические
• Сделать расчет экономического эффекта реализации проекта и оценить его влияние на организацию, персонал
• Описать команду проекта и требуемые компетенции
Оценить модуль
1
0
Опрос для экспертизы программы "Data Science для управленцев"

При запуске нового курса, нам очень важно оценивать качество и актуальность предлагаемой программы на этапе идеи и концепции модулей, поэтому мы будем очень рады и благодарны вашим ответам, экспертным оценкам и комментариям.

Вопрос №1 из 7
Ваше имя и фамилия
Вопрос №2 из 7
Выберите один вариант ответа
Вам понятно, о чем этот курс?
оцените от 1 (не понял) до 5 (да, все ясно)
Вопрос №3 из 7
Выберите один вариант ответа
Является ли этот курс интересным лично для вас?
оцените от 1 (совсем не интересно) до 5 (круто, интересно, я бы пошел)
Вопрос №4 из 7
Выберите один вариант ответа
Как вы думаете, будет ли этот курс востребован на рынке?
оцените от 1 (совсем не интересно) до 5 (да, думаю, людям понравится)
Вопрос №5 из 7
Выберите один вариант ответа
Как вы оцениваете актуальность такой программы?
оцените от 1 (категорически устарела) до 5 (современная или даже на хайпе)
Вопрос №6 из 7
Выберите один вариант ответа
Можно ли реализовать в рамках курса предложенные идеи проекта?
оцените от 1 (не сработает, идея нерабочая) до 5 (да, проект получится отличный и полезный)
Вопрос №7 из 7
Комментарии и предложения - мы всегда им рады!