Data Warehouse Analyst. Advanced

Использование инструментов анализа данных на практике и их дальнейшее развитие

13 января

Advanced

4 месяца

Онлайн

Вт/Ср 20:00 Мск

Для кого этот курс

Для тех, кто хочет глубже погрузиться и систематизировать знания в области подготовки и анализа данных, настроить логический слой бизнес-показателей поверх DWH-хранилища и получить более выгодные предложения от работодателей.
 
  • Бизнес-аналитики
  • Архитекторы DWH
  • Системные аналитики
  • BI-аналитики
  • ML-инженеры

Необходимые знания

  • Синтаксис SQL-запросов
  • Знание Python на начальном уровне
  • Понимание отличия оперативной отчетности от аналитической
  • Опыт работы с Docker
  • Знания по подготовке данных
  • Опыт работы с DWH не менее 6 месяцев
Промокод DWHA_12 действует при полной оплате курса до 15.01.2026 включительно. Применяется в личном кабинете в окне оплаты.

Что даст вам этот курс

  • Изучите на практике использование передовых open-source технологий для DWH-аналитики
  • Узнаете чем и как можно заменить проприетарное санкционное ПО
  • Получите представление о разделении в профессиональных направлениях анализа данных
  • Погрузитесь в актуальные тренды бизнес-анализа
  • Навыки обслуживания и проектирования систем подготовки анализа данных
  • Опыт проектирования аналитической отчетности
Data Warehouse (DWH) — технология для хранения, обработки и анализа больших объемов данных из разных источников, предназначенная для принятия бизнес-решений. DWH-подход используется в аналитике, финансах, ритейле, IT и маркетинге для создания отчетов, прогнозов, мониторинга KPI и оптимизации процессов. DWH-специалисты востребованы во всех этих сферах, обеспечивая эффективную работу с данными и их применение для управления бизнесом.

Процесс обучения

Обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя.

Вебинары проводятся 2 раза в неделю по 2 ак. часа и сохраняются в записи в личном кабинете. Вы можете посмотреть их в любое удобное для вас время.

В ходе обучения вы будете выполнять домашние задания. Каждое из них посвящено одному из компонентов вашего выпускного проекта.

После выполнения всех домашних заданий вы получите готовый выпускной проект.

Оптимальная нагрузка

Возможность совмещать учебу с работой

Портфолио

Индивидуальная разработка итоговой проектной работы 

Перспективы

 

Получите знания, которые помогут повысить вашу востребованность и доход

Партнеры

Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности.

  • Получите помощь с оформлением резюме, портфолио и сопроводительного письма
  • Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
Формат обучения

Интерактивные вебинары


2 занятия по 2 ак.часа в неделю. Доступ к записям и материалам остается навсегда

Обратная связь


Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии

Активное комьюнити


Чат в Telegram для общения преподавателей и студентов

Программа

Аналитические СУБД: основы и эволюция

Этот модуль посвящен архитектуре данных. Вы узнаете, как устроен ландшафт аналитических систем, разберетесь в многообразии решений на рынке и их месте в IT-архитектуре компании. Изучите полный жизненный цикл данных на предприятии, а также разберёте основы взаимодействия с аналитическими СУБД с помощью языка SQL.

Тема 1: Ландшафт BigData решений и инструментов на отечественном рынке. Начало работы с OpenSource

Тема 2: Инфраструктура: типы и виды // ДЗ

Тема 3: Жизненный цикл платформ данных и их роль в информационных системах предприятия

Тема 4: Аналитические базы данных и SQL // ДЗ

Аналитические СУБД Greenplum (Массово-параллельная аналитическая СУБД для Big Data)

Этот модуль посвящён работе с Greenplum. Вы изучите внутреннее устройство этой СУБД для эффективного хранения данных, методы оптимизации запросов и возможности её интеграции с другими инструментами в рамках общей платформы.

Тема 1: Особенности хранения данных в базах на примере Greenplum

Тема 2: Расчёты в Greenplum: оптимизация запросов

Тема 3: Дополнительные возможности Greenplum: интеграция инструмента внутри платформы данных // ДЗ

Аналитические СУБД ClickHouse

Этот модуль посвящён высокопроизводительной аналитической СУБД ClickHouse. Вы изучите её архитектурные решения для сверхбыстрой обработки данных, научитесь проектировать на её основе эффективные аналитические витрины и поймёте, как ClickHouse встраивается в современную платформу данных для решения сложных бизнес-задач.

Тема 1: Особенности хранения данных в базах на примере ClickHouse

Тема 2: Аналитические витрины в ClickHouse // ДЗ

Тема 3: Дополнительные возможности ClickHouse: интеграция инструмента внутри платформы данных // ДЗ

Обработка больших объёмов данных

Этот модуль посвящён переходу от структурированных хранилищ к гибкой обработке больших данных. Вы изучите концепцию Data Lake как централизованного хранилища, разберёте архитектуру и роль ключевых фреймворков - Apache Spark для вычислений и Apache Kafka для потоковой передачи данных. Также рассмотрите, как с помощью Spark SQL выполнять аналитические запросы и создавать streaming-решения для работы с данными в реальном времени.

Тема 1: Введение в Data Lake // ДЗ

Тема 2: Архитектура Apache Spark и его применение

Тема 3: Архитектура Apache Kafka и её применение

Тема 4: Spark SQL // ДЗ

Тема 5: Построение Streaming-решений на базе Apache Spark

Хранение данных в Hadoop

Этот модуль посвящён принципам работы экосистемы Hadoop. Вы изучите, как данные физически хранятся в HDFS, как распределяются вычислительные ресурсы через YARN и как к ним можно обращаться через аналитические запросы в Hive или в режиме реального времени через HBase.

Тема 1: Обзор HDFS

Тема 2: Обзор YARN

Тема 3: Обзор Hive

Тема 4: Обзор HBase // ДЗ

Построение платформ данных. Обзор дополнительных концепций

Этот модуль посвящён проектированию платформ данных от классических подходов до современных концепций. Вы сравните методологии построения хранилищ, изучите гибкую архитектуру Data Vault 2.0, принципы объединения хранилищ и озёр данных в Lakehouse, а также особенности проектирования на основе высокопроизводительного движка StarRocks.

Тема 1: Проектирование хранилища данных

Тема 2: Использование Data Vault 2.0 в проектировании хранилища

Тема 3: Организация Lakehouse

Тема 4: Проектирование платформы данных на движке StarRocks // ДЗ

Средства анализа данных

Этот модуль посвящён инструментам, которые превращают подготовленные данные в основу для управленческих решений. Вы изучите, как создаются интерактивные дашборды и отчёты для анализа готовых витрин, сравнив подходы и возможности двух популярных решений: открытого Apache Superset и облачного сервиса DataLens.

Тема 1: Apache Superset

Тема 2: DataLens // ДЗ

Введение в ИИ (ML)

Этот модуль посвящён базовым концепциям и инструментам Data Science. Вы изучите основы языка Python для анализа данных, рассмотрите этап предобработки данных и познакомитесь с основными семействами алгоритмов машинного обучения.

Тема 1: Основы Python

Тема 2: Предобработка данных

Тема 3: Библиотеки Python: NumPy, Pandas

Тема 4: Метрики оценки моделей и линейные модели

Тема 5: Деревья решений

Тема 6: Методы опорных векторов

Тема 7: Основы нейронных сетей // ДЗ

Проектная работа

Тема 1: Выбор темы и организация проектной работы // Проектная работа

Тема 2: Консультация по проектам и домашним заданиям

Тема 3: Защита проектных работ

Тема 4: Подведение итогов курса

Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит

Выпускной проект

 

Каждый курс завершается финальным проектом, который предстоит защитить перед преподавателями и командой. Вам будет, что обсудить на собеседовании!

 

В рамках проекта студентам будет предложено на основании open-source базы данных подготовить DWH и создать отчетность.

 

Вы можете выбрать одну из предложенных преподавателем тем или реализовать свою идею.

Преподаватели

Денис Пургин

Руководитель проекта Импортозамещения ЕХД

Московская Биржа (MOEX)

Сергей Земсков

Аналитик

Вадим Заигрин

Ведущий консультант

IBS

Василий Трещев

Наталия Титова

Руководитель направления продуктовой аналитики, тимлид команды мобильной аналитики

МТС Банк

Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания

Прошедшие
мероприятия

Сергей Земсков
Открытый вебинар
Data Engineering на практике: Clickhouse vs Greenplum и архитектура быстрых витрин
Сергей Земсков
Открытый вебинар
Data Engineering & Analytics: от данных к бизнес-инсайтам

Этот курс может оплатить ваш работодатель

Обучайтесь за счёт работодателя или разделите оплату 50/50
  • Подробно расскажем об интересующем вас курсе
  • Объясним, как договориться с работодателем
  • Сообщим стоимость обучения и варианты оплаты
  • Ответим на вопросы
  • Предоставим шаблон договора и счёт на оплату

Подтверждение знаний и навыков

OTUS осуществляет лицензированную образовательную деятельность. В конце обучения вы получите сертификат OTUS о прохождении курса и удостоверение о повышении квалификации.

После обучения вы:

  • Получите материалы по пройденным занятиям (видеозаписи курса и дoполнительные материалы)
  • Создадите свой проект, который поможет при прохождении собеседований
  • Повысите свою ценность и конкурентоспособность как IT-специалист
  • Получите сертификат об окончании курса

Частые вопросы

Почему OTUS?
Мы обучаем IT-сотрудников уже 6 лет, через OTUS прошли 20 000 студентов. Специализируемся на программах для людей с опытом, а ещё – быстро переформатируем учебные программы под изменения в сфере информационных технологий.
Обязательно ли выполнять и защищать выпускной проект?
Для получения сертификата OTUS и УПК (удостоверение повышения квалификации государственного образца) необходимо сдать проект. Кроме того, проект необязательно защищать перед аудиторией, а можно сдать в чате с преподавателем. Для получения УПК также понадобится предъявить документ об образовании.
Обязательно ли выполнять все домашние задания?
Да, если хотите хорошо отточить навыки. На курсе будут практические домашние задания, их выполнение занимает примерно 2-3 часа.
Помогаете ли вы с трудоустройством после курса?
В Otus Club проводятся вебинары на тему трудоустройства, разбор резюме, прохождения собеседований, особенности реферальных программ при найме. Также обратим ваше внимание, что преподаватели курса занимают ведущие позиции в разных компаниях. Будьте активны, выполняйте домашние задания, стройте network с сокурсниками и преподавателями, и вам будет проще найти работу, расширив свои контакты.
Смогу ли я совмещать учебу с работой?
Да. Программа курса рассчитана на студентов, у которых мало времени. Лекции проводим дважды в неделю, домашние задания — не чаще 1 раза в неделю.
Что, если в середине курса я не смогу продолжать обучение?
Вы можете бесплатно перейти в другую группу. Но только один раз.
Я могу вернуть деньги?
Да, мы можем вернуть деньги за то время курса, которое вы ещё не успели отучиться. Например, если курс длится пять месяцев, а вы отучились один, мы вернём деньги за оставшиеся четыре месяца.
Может ли мой работодатель оплатить курс?
Да. Когда свяжетесь с нашим менеджером, уточните, что оплачивать курс будет ваш работодатель.
Остались вопросы?
Оставляйте заявку и задавайте вопросы менеджеру, команда курса с ним на связи и постарается дать вам исчерпывающую информацию.