Data Warehouse Analyst. Advanced
13 января
Advanced
4 месяца
Онлайн
Вт/Ср 20:00 Мск
Для кого этот курс
- Бизнес-аналитики
- Архитекторы DWH
- Системные аналитики
- BI-аналитики
- ML-инженеры
Необходимые знания
- Синтаксис SQL-запросов
- Знание Python на начальном уровне
- Понимание отличия оперативной отчетности от аналитической
- Опыт работы с Docker
- Знания по подготовке данных
- Опыт работы с DWH не менее 6 месяцев
Что даст вам этот курс
- Изучите на практике использование передовых open-source технологий для DWH-аналитики
- Узнаете чем и как можно заменить проприетарное санкционное ПО
- Получите представление о разделении в профессиональных направлениях анализа данных
- Погрузитесь в актуальные тренды бизнес-анализа
- Навыки обслуживания и проектирования систем подготовки анализа данных
- Опыт проектирования аналитической отчетности
Процесс обучения
Обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя.
Вебинары проводятся 2 раза в неделю по 2 ак. часа и сохраняются в записи в личном кабинете. Вы можете посмотреть их в любое удобное для вас время.
В ходе обучения вы будете выполнять домашние задания. Каждое из них посвящено одному из компонентов вашего выпускного проекта.
После выполнения всех домашних заданий вы получите готовый выпускной проект.
Оптимальная нагрузка
Возможность совмещать учебу с работой
Портфолио
Индивидуальная разработка итоговой проектной работы
Перспективы
Получите знания, которые помогут повысить вашу востребованность и доход
Партнеры
Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности.
- Получите помощь с оформлением резюме, портфолио и сопроводительного письма
- Разместите свое резюме в базе OTUS и сможете получать приглашения на собеседования от партнеров
Формат обучения
Интерактивные вебинары
2 занятия по 2 ак.часа в неделю. Доступ к записям и материалам остается навсегда
Обратная связь
Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии
Активное комьюнити
Чат в Telegram для общения преподавателей и студентов
Программа
Аналитические СУБД: основы и эволюция
Этот модуль посвящен архитектуре данных. Вы узнаете, как устроен ландшафт аналитических систем, разберетесь в многообразии решений на рынке и их месте в IT-архитектуре компании. Изучите полный жизненный цикл данных на предприятии, а также разберёте основы взаимодействия с аналитическими СУБД с помощью языка SQL.
Тема 1: Ландшафт BigData решений и инструментов на отечественном рынке. Начало работы с OpenSource
Тема 2: Инфраструктура: типы и виды // ДЗ
Тема 3: Жизненный цикл платформ данных и их роль в информационных системах предприятия
Тема 4: Аналитические базы данных и SQL // ДЗ
Аналитические СУБД Greenplum (Массово-параллельная аналитическая СУБД для Big Data)
Этот модуль посвящён работе с Greenplum. Вы изучите внутреннее устройство этой СУБД для эффективного хранения данных, методы оптимизации запросов и возможности её интеграции с другими инструментами в рамках общей платформы.
Тема 1: Особенности хранения данных в базах на примере Greenplum
Тема 2: Расчёты в Greenplum: оптимизация запросов
Тема 3: Дополнительные возможности Greenplum: интеграция инструмента внутри платформы данных // ДЗ
Аналитические СУБД ClickHouse
Этот модуль посвящён высокопроизводительной аналитической СУБД ClickHouse. Вы изучите её архитектурные решения для сверхбыстрой обработки данных, научитесь проектировать на её основе эффективные аналитические витрины и поймёте, как ClickHouse встраивается в современную платформу данных для решения сложных бизнес-задач.
Тема 1: Особенности хранения данных в базах на примере ClickHouse
Тема 2: Аналитические витрины в ClickHouse // ДЗ
Тема 3: Дополнительные возможности ClickHouse: интеграция инструмента внутри платформы данных // ДЗ
Обработка больших объёмов данных
Этот модуль посвящён переходу от структурированных хранилищ к гибкой обработке больших данных. Вы изучите концепцию Data Lake как централизованного хранилища, разберёте архитектуру и роль ключевых фреймворков - Apache Spark для вычислений и Apache Kafka для потоковой передачи данных. Также рассмотрите, как с помощью Spark SQL выполнять аналитические запросы и создавать streaming-решения для работы с данными в реальном времени.
Тема 1: Введение в Data Lake // ДЗ
Тема 2: Архитектура Apache Spark и его применение
Тема 3: Архитектура Apache Kafka и её применение
Тема 4: Spark SQL // ДЗ
Тема 5: Построение Streaming-решений на базе Apache Spark
Хранение данных в Hadoop
Этот модуль посвящён принципам работы экосистемы Hadoop. Вы изучите, как данные физически хранятся в HDFS, как распределяются вычислительные ресурсы через YARN и как к ним можно обращаться через аналитические запросы в Hive или в режиме реального времени через HBase.
Тема 1: Обзор HDFS
Тема 2: Обзор YARN
Тема 3: Обзор Hive
Тема 4: Обзор HBase // ДЗ
Построение платформ данных. Обзор дополнительных концепций
Этот модуль посвящён проектированию платформ данных от классических подходов до современных концепций. Вы сравните методологии построения хранилищ, изучите гибкую архитектуру Data Vault 2.0, принципы объединения хранилищ и озёр данных в Lakehouse, а также особенности проектирования на основе высокопроизводительного движка StarRocks.
Тема 1: Проектирование хранилища данных
Тема 2: Использование Data Vault 2.0 в проектировании хранилища
Тема 3: Организация Lakehouse
Тема 4: Проектирование платформы данных на движке StarRocks // ДЗ
Средства анализа данных
Этот модуль посвящён инструментам, которые превращают подготовленные данные в основу для управленческих решений. Вы изучите, как создаются интерактивные дашборды и отчёты для анализа готовых витрин, сравнив подходы и возможности двух популярных решений: открытого Apache Superset и облачного сервиса DataLens.
Тема 1: Apache Superset
Тема 2: DataLens // ДЗ
Введение в ИИ (ML)
Этот модуль посвящён базовым концепциям и инструментам Data Science. Вы изучите основы языка Python для анализа данных, рассмотрите этап предобработки данных и познакомитесь с основными семействами алгоритмов машинного обучения.
Тема 1: Основы Python
Тема 2: Предобработка данных
Тема 3: Библиотеки Python: NumPy, Pandas
Тема 4: Метрики оценки моделей и линейные модели
Тема 5: Деревья решений
Тема 6: Методы опорных векторов
Тема 7: Основы нейронных сетей // ДЗ
Проектная работа
Тема 1: Выбор темы и организация проектной работы // Проектная работа
Тема 2: Консультация по проектам и домашним заданиям
Тема 3: Защита проектных работ
Тема 4: Подведение итогов курса
Также вы можете получить полную программу, чтобы убедиться, что обучение вам подходит
Выпускной проект
Каждый курс завершается финальным проектом, который предстоит защитить перед преподавателями и командой. Вам будет, что обсудить на собеседовании!
В рамках проекта студентам будет предложено на основании open-source базы данных подготовить DWH и создать отчетность.
Вы можете выбрать одну из предложенных преподавателем тем или реализовать свою идею.
Преподаватели
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
Прошедшие
мероприятия
Этот курс может оплатить ваш работодатель
- Подробно расскажем об интересующем вас курсе
- Объясним, как договориться с работодателем
- Сообщим стоимость обучения и варианты оплаты
- Ответим на вопросы
- Предоставим шаблон договора и счёт на оплату
Подтверждение знаний и навыков
OTUS осуществляет лицензированную образовательную деятельность. В конце обучения вы получите сертификат OTUS о прохождении курса и удостоверение о повышении квалификации.
После обучения вы:
- Получите материалы по пройденным занятиям (видеозаписи курса и дoполнительные материалы)
- Создадите свой проект, который поможет при прохождении собеседований
- Повысите свою ценность и конкурентоспособность как IT-специалист
- Получите сертификат об окончании курса
Data Warehouse Analyst. Advanced
Полная стоимость
Стоимость указана для оплаты физическими лицами
вычета до 13% стоимости обучения. Оставьте заявку и менеджер вас проконсультирует
+7 499 938-92-02 бесплатно

