Data Warehouse Analyst | OTUS
Рассрочка
Рассрочка

Data Warehouse Analyst

Моделирование данных, продвинутая аналитика, дашбординг, BI, ELT, аналитические СУБД

Длительность обучения:

5 месяцев

4 ак. часа в нед.

Формат:

Online

Начало занятий:

30 May

Дни занятий:

Вт 20:00, Чт 20:00

Что даст вам этот курс

Аналитические приложения сегодня строятся на стыке инженерных практик (Software/Data Engineering), понимании специфики продуктов и бизнеса (Data/Business Analysis), быстрой и качественной поставки сервисов (DevOps).

Курс ставит своей целью научить слушателей собирать полноценные end-to-end аналитические решения с использованием самых актуальных и востребованных инструментов.

Материал будет изучаться как вглубь (например, принципы функционирования аналитических СУБД), так и вширь (сравнение инструментов, анализ сильных и слабых сторон решений).

Что нового я смогу узнать?

Для ролей Data Scientist, Data Analyst, Product Analyst:

– Принципы работы аналитических СУБД и построение ELT-pipelines
– Использование лучших практик моделирования хранилищ данных и витрин
– Применение правильных архитектурных паттернов при построении решений

Для ролей Data Engineer, Backend Developer, DBA, System Administrator:

– Практики построения end-to-end аналитических решений
– Прикладные навыки визуализации, дашбординга, BI
– Фокус на создании ценности для бизнеса

В рамках курса будут рассмотрены:

– Навыки построения ELT-pipelines: Airflow, Nifi, Stitch
– Принципы работы аналитических СУБД: Redshift, Greenplum, Clickhouse
– Лучшие практики моделирования данных: dbt, Data Vault
Визуализация и BI: Metabase, Superset, DataLens
– Продвинутая аналитика: KPI, Funnels, Marketing Attribution, Cohort, RFM
– DevOps-практики: Continuous Integration, Github Actions

Карта курсов направления Data Science в OTUS

Преподаватели

Артемий Козырь
Analytics Engineer, Wheely
Анатолий Борзилов
Ведущий разработчих корпоративного хранилища данных компании ООО "ДЕЛОТЕХ"
Максим Мигутин
Алексей Железной
Data Engineer, Wildberries
7+ лет опыта в области Хранилищ Данных, ELT pipelines, Анализа данных и визуализации.
Опыт работы над сервисами в компаниях Wheely, Sber, Moscow Exchange, PwC.
Сферы интересов: Data Modeling, Advanced analytics, Marketing Attribution, Data Quality, DevOps.

Верю в то, что данные – это ключевой элемент в принятии обоснованных и разумных бизнес-решений. Люблю находить простые решения для сложных задач. Не люблю повторять одни и те же ошибки, но с удовольствием приветствую новый опыт.

Blogging: Technology Enthusiast and Habr
2+ года веду занятия в ОТУС: Data Engineer, Hadoop Ecosystem, DWH Analyst

Руководитель программы
Более 6 лет опыта в области разработки хранилищ данных, ELT pipelines, анализа данных и визуализации.

Опыт работы в сфере госбезопасности, создание и внедрение КХД ООО "Группа компаний «СБСВ-Ключавто», в настоящий момент разработка КХД для группы компаний "Дело"

Уверен в том , что данные — это вторая нефть, своего рода имущество, которым надо уметь управлять и распоряжаться. Наличие упорядоченных данных, их правильное хранение, использование, продажа, обезличивание говорят о высоком уровне цифровой зрелости.

Преподаватель
Более 5-ти лет опыта в индустрии Данных & Аналитики в роли внешнего консультанта (IBM) и in-house лидера Data Engineering и Data Science-проектов (Альфа-Банк, Yum! Brands).

Сферы интересов: построение end-to-end аналитических систем, внедрение инструментов Машинного обучения в промышленную эксплуатацию, Рекомендательные системы, MPP-базы данных.

Образование: МГУ им. Ломоносова, математическая кафедра Экономического факультета

Преподаватель
Более 3 лет коммерческого опыта в качестве Data Engineer, Data Analyst в банковской и sales&marketing сферах, более 7 лет вовлечен в IT-сферу. Работаю с задачами в области Data Ingestion, ELT/ETL pipelines, анализа и визуализации данных, а также написания различных сервисов и скриптов на ЯП Python.

На данный момент - Middle+ Data Engineer в компании Wildberries, преподаватель в ОТУС на курсах DWH Analyst и Data Engineer.

Образование: магистратура - ВШЭ направления "Системная и программная инженерия" факультета Компьютерных Наук; бакалавриат - ВГУ, кафедра обработки информации и машинного обучения факультета Компьютерных Наук

Преподаватель
Артемий
Козырь
Анатолий
Борзилов
Максим
Мигутин
Алексей
Железной

Преподаватели

Артемий Козырь
Analytics Engineer, Wheely
7+ лет опыта в области Хранилищ Данных, ELT pipelines, Анализа данных и визуализации.
Опыт работы над сервисами в компаниях Wheely, Sber, Moscow Exchange, PwC.
Сферы интересов: Data Modeling, Advanced analytics, Marketing Attribution, Data Quality, DevOps.

Верю в то, что данные – это ключевой элемент в принятии обоснованных и разумных бизнес-решений. Люблю находить простые решения для сложных задач. Не люблю повторять одни и те же ошибки, но с удовольствием приветствую новый опыт.

Blogging: Technology Enthusiast and Habr
2+ года веду занятия в ОТУС: Data Engineer, Hadoop Ecosystem, DWH Analyst

Руководитель программы
Анатолий Борзилов
Ведущий разработчих корпоративного хранилища данных компании ООО "ДЕЛОТЕХ"
Более 6 лет опыта в области разработки хранилищ данных, ELT pipelines, анализа данных и визуализации.

Опыт работы в сфере госбезопасности, создание и внедрение КХД ООО "Группа компаний «СБСВ-Ключавто», в настоящий момент разработка КХД для группы компаний "Дело"

Уверен в том , что данные — это вторая нефть, своего рода имущество, которым надо уметь управлять и распоряжаться. Наличие упорядоченных данных, их правильное хранение, использование, продажа, обезличивание говорят о высоком уровне цифровой зрелости.

Преподаватель
Максим Мигутин
Более 5-ти лет опыта в индустрии Данных & Аналитики в роли внешнего консультанта (IBM) и in-house лидера Data Engineering и Data Science-проектов (Альфа-Банк, Yum! Brands).

Сферы интересов: построение end-to-end аналитических систем, внедрение инструментов Машинного обучения в промышленную эксплуатацию, Рекомендательные системы, MPP-базы данных.

Образование: МГУ им. Ломоносова, математическая кафедра Экономического факультета

Преподаватель
Алексей Железной
Data Engineer, Wildberries
Более 3 лет коммерческого опыта в качестве Data Engineer, Data Analyst в банковской и sales&marketing сферах, более 7 лет вовлечен в IT-сферу. Работаю с задачами в области Data Ingestion, ELT/ETL pipelines, анализа и визуализации данных, а также написания различных сервисов и скриптов на ЯП Python.

На данный момент - Middle+ Data Engineer в компании Wildberries, преподаватель в ОТУС на курсах DWH Analyst и Data Engineer.

Образование: магистратура - ВШЭ направления "Системная и программная инженерия" факультета Компьютерных Наук; бакалавриат - ВГУ, кафедра обработки информации и машинного обучения факультета Компьютерных Наук

Преподаватель

Отзывы

Юрий
Курс понравился. Преподносится обширная база практических и теоретических навыков. Занятия на курсе подняли многие знания с нуля на достаточный для дальнейшего самостоятельного закрепления и применения на практике уровень. Остальные знания были поданы под новым углом, расширены и закреплены. До начала обучения работал в несколько ином направлении, но давно планировал перейти в сферу работы с данными. В том числе благодаря первым лекциям успешно прошел собеседование и и устроился на работу дата-инженером. На новом рабочем месте благодаря параллельно получаемым навыкам адаптировался легко.
По занятиям все понравилось, по ДЗ немного не доработанными показались №6 и №7. В них большой набор объектов(таблиц), предназначение которых можно пытаться понять только по их наименованиям. Имеющееся описание устарело, описывает то, чего уже нет. Схема данных уже поменялась. В некоторых ключевых таблицах 4-5 строк данных, какие то таблицы вообще пустые. В результате непонятно что делать, непонятно как связывать таблицы в витрины.
Так же по теории, считаю, что маловато жизненных кейсов по встречающимся сложностям в работе и практикам по их решению.
Читать целиком
Юрий
Курс понравился. Преподносится обширная база практических и теоретических навыков. Занятия на курсе подняли многие знания с нуля на достаточный для дальнейшего самостоятельного закрепления и применения на практике уровень. Остальные знания были поданы под новым углом, расширены и закреплены. До начала обучения работал в несколько ином направлении, но давно планировал перейти в сферу работы с данными. В том числе благодаря первым лекциям успешно прошел собеседование и и устроился на работу дата-инженером. На новом рабочем месте благодаря параллельно получаемым навыкам адаптировался легко.
По занятиям все понравилось, по ДЗ немного не доработанными показались №6 и №7. В них большой набор объектов(таблиц), предназначение которых можно пытаться понять только по их наименованиям. Имеющееся описание устарело, описывает то, чего уже нет. Схема данных уже поменялась. В некоторых ключевых таблицах 4-5 строк данных, какие то таблицы вообще пустые. В результате непонятно что делать, непонятно как связывать таблицы в витрины.
Так же по теории, считаю, что маловато жизненных кейсов по встречающимся сложностям в работе и практикам по их решению.
Читать целиком

Необходимые знания

  • SQL: аналитические функции, CTE;
  • Знакомство с принципами работы СУБД;
  • Базовые навыки программирования на Python, виртуальные окружения;
  • Базовые знания Docker.
Корпоративное обучение для ваших сотрудников
Поможем вашей компании развивать команду! Профиты данного курса для компании: Подробное изучение самых популярных баз данных с возможностью сосредоточиться на тех, которые используются в компании / Оптимизированные стабильные системы / Работа над промышленными задачами во время практики
>
Программа обучения
В процессе обучения вы получите комплексные знания и навыки.
Тема 1. Аналитические движки (СУБД) для работы с данными
Тема 2. Источники данных: классификация и особенности
Тема 3. Инструментарий разработки: IDE, Terminal, Docker, Codespaces, Terraform
Тема 4. Инструменты для выгрузки данных
C 15 June
Тема 5. Принципы построения DWH
Тема 6. Разбор ДЗ – Выгрузка данных веб-счетчика
Тема 7. Знакомство с Data Build Tool
Тема 8. DWH powered by Clickhouse and dbt
C 29 June
Тема 9. Оркестрация скриптов и задач – 1
Тема 10. Оркестрация скриптов и задач – 2
Тема 11. Data Quality
Тема 12. Вопросы оптимизации производительности
Тема 13. Разбор ДЗ – Конфигурирование и запуск проекта dbt
Тема 14. Data Vault – 1
Тема 15. Разбор ДЗ – Подготовка и установка на расписание DAG выгрузки данных из источников
Тема 16. Data Vault – 2
Тема 17. Data Vault – 3
C 8 August
Тема 18. BI: Обзор
Тема 19. BI: Deployment
Тема 20. BI: Modeling & Delivering
Тема 21. Разбор ДЗ – Организация детального слоя DWH по методологии Data Vault
Тема 22. Analytics: Базовые аналитические витрины
Тема 23. Analytics: Сквозная аналитика
Тема 24. Разбор ДЗ – Конфигурация и развертывание BI-решения
Тема 25. Analytics: Продвинутые аналитические витрины
C 12 September
Тема 26. DWH: Advanced topics
Тема 27. DBT: Extending with modules
Тема 28. DWH: Monitoring + Workload management
Тема 29. DWH: External + Semi-structured data
Тема 30. DWH: Reverse-ETL
Тема 31. DWH: Machine Learning capabilities
Тема 32. Разбор ДЗ – Визуализация и дашбординг для аналитических витрин
C 5 October
Тема 33. Разбор кейса: end-to-end solution
Тема 34. Разбор ДЗ – Advanced DWH: Configuring CI, dbt modules, External tables
Тема 35. Дальнейшее развитие навыков
C 17 October
Тема 36. Выбор темы и организация проектной работы
Тема 37. Защита проектных работ
Скачать подробную программу
Выпускной проект
Выпускной проект будет состоять из следующих этапов:

– Сформулировать цель аналитического приложения, business value
– Представить архитектуру ресурсов и компонентов системы
– Классифицировать источники данных, регулярность загрузки, форматы данных и структуру
– Смоделировать Хранилища Данных
– Развернуть BI-инструмент
– Визуализировать данные в наглядном и понятном виде на дашбордах
– Сделать несколько интересных выводов
– * Опубликовать результаты работы на Хабр/…, выложить код на Github

Темы на выбор (+ есть возможность заявить собственную):

– Social media / Telegram channels / Twitter analysis
– Open Data: Covid, Taxi trips, Kaggle, ...
– Web analysis: crawling, parsing, analysing websites
– Marketing analytics: performance + attribution

Процесс обучения

Все обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в слаке курса, сдача домашних работ и получение обратной связи от преподавателя. Вебинары проходят 2 раза в неделю по 2 академических ч. (то есть астрономических 1,5 ч.). Записи вебинаров доступны в вашем личном кабинете. Домашнее задание выдается в среднем раз в 2 недели, а его выполнение занимает 3-5 часов. Вопросы по материалам лекций, домашним заданиям и выпускному проекту можно обсудить с преподавателем в слаке или на вебинаре. Во время работы над проектом студенты получают консультации от преподавателей в слаке группы и на проектных занятиях.
Получить консультацию
Наш специалист свяжется с вами в ближайшее время. Если у вас возникли трудности в выборе курса или проблемы технического плана, то мы с радостью поможем вам.
Спасибо!
Мы получили Вашу заявку, в ближайшее время с Вами свяжется наш менеджер.

После обучения вы

Заберете с собой:
  • основные и дополнительные материалы, и видеозаписи занятий;

  • образцы кода;

  • собственный проект, который можно будет показывать при трудоустройстве;

  • сертификат о прохождении обучения.

Дата выдачи сертификата: 4 December 2023 года
Ваш сертификат

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Data Warehouse Analyst»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.

онлайн-образование

Сертификат №0001

Константин Константинопольский

Успешно закончил курс «Data Warehouse Analyst»
Выполнено практических заданий: 16 из 16

Общество с ограниченной ответственностью “Отус Онлайн-Образование”

Город:
Москва

Директор департамента образования
ООО “Отус Онлайн-Образование”
Анна Фирсова

Лицензия на осуществление образовательной деятельности
№ 039825 от 28 декабря 2018 года.
Прошедшие открытые вебинары
Открытый вебинар — это настоящее занятие в режиме он-лайн с преподавателем курса, которое позволяет посмотреть, как проходит процесс обучения. В ходе занятия слушатели имеют возможность задать вопросы и получить знания по реальным практическим кейсам.
Визуализация данных на основе Clickhouse и Apache Superset
Алексей Железной
День открытых дверей
22 November 2021 года в 20:00
Для доступа к прошедшим мероприятиям необходимо пройти входное тестирование
Возможность пройти вступительное тестирование повторно появится только через 2 недели
Результаты тестирования будут отправлены вам на email, указанный при регистрации.
Тест рассчитан на 30 минут, после начала тестирования отложить тестирование не получится!

Партнеры ждут выпускников этого курса

Стоимость обучения
Cтоимость указана для оплаты физическими лицами
60 000 ₽
Продолжительность
5 месяцев
Начало занятий
30 May