Промокод 5%
Advanced
Онлайн
Обучение проходит онлайн: вебинары, общение с преподавателями и вашей группой в Telegram, сдача домашних работ и получение обратной связи от преподавателя.
Вебинары проводятся 2 раза в неделю по 2 ак. часа и сохраняются в записи в личном кабинете. Вы можете посмотреть их в любое удобное для вас время.
В ходе обучения вы будете выполнять домашние задания. Каждое из них посвящено одному из компонентов вашего выпускного проекта.
После выполнения всех домашних заданий вы получите готовый выпускной проект.
Возможность совмещать учебу с работой
Индивидуальная разработка итоговой проектной работы
Получите знания, которые помогут повысить вашу востребованность и доход
Многие студенты еще во время прохождения первой части программы находят или меняют работу, а к концу обучения могут претендовать на повышение в должности.
2 занятия по 2 ак.часа в неделю. Доступ к записям и материалам остается навсегда
Домашние задания с поддержкой и обратной связью наших преподавателей помогут освоить изучаемые технологии
Чат в Telegram для общения преподавателей и студентов
Этот модуль посвящен архитектуре данных. Вы узнаете, как устроен ландшафт аналитических систем, разберетесь в многообразии решений на рынке и их месте в IT-архитектуре компании. Изучите полный жизненный цикл данных на предприятии, а также разберёте основы взаимодействия с аналитическими СУБД с помощью языка SQL.
Тема 1: Ландшафт BigData решений и инструментов на отечественном рынке. Начало работы с OpenSource
Тема 2: Инфраструктура: типы и виды // ДЗ
Тема 3: Жизненный цикл платформ данных и их роль в информационных системах предприятия
Тема 4: Аналитические базы данных и SQL // ДЗ
Этот модуль посвящён работе с Greenplum. Вы изучите внутреннее устройство этой СУБД для эффективного хранения данных, методы оптимизации запросов и возможности её интеграции с другими инструментами в рамках общей платформы.
Тема 1: Особенности хранения данных в базах на примере Greenplum
Тема 2: Расчёты в Greenplum: оптимизация запросов
Тема 3: Дополнительные возможности Greenplum: интеграция инструмента внутри платформы данных // ДЗ
Этот модуль посвящён высокопроизводительной аналитической СУБД ClickHouse. Вы изучите её архитектурные решения для сверхбыстрой обработки данных, научитесь проектировать на её основе эффективные аналитические витрины и поймёте, как ClickHouse встраивается в современную платформу данных для решения сложных бизнес-задач.
Тема 1: Особенности хранения данных в базах на примере ClickHouse
Тема 2: Аналитические витрины в ClickHouse // ДЗ
Тема 3: Дополнительные возможности ClickHouse: интеграция инструмента внутри платформы данных // ДЗ
Этот модуль посвящён переходу от структурированных хранилищ к гибкой обработке больших данных. Вы изучите концепцию Data Lake как централизованного хранилища, разберёте архитектуру и роль ключевых фреймворков - Apache Spark для вычислений и Apache Kafka для потоковой передачи данных. Также рассмотрите, как с помощью Spark SQL выполнять аналитические запросы и создавать streaming-решения для работы с данными в реальном времени.
Тема 1: Введение в Data Lake // ДЗ
Тема 2: Архитектура Apache Spark и его применение
Тема 3: Архитектура Apache Kafka и её применение
Тема 4: Spark SQL // ДЗ
Тема 5: Построение Streaming-решений на базе Apache Spark
Этот модуль посвящён принципам работы экосистемы Hadoop. Вы изучите, как данные физически хранятся в HDFS, как распределяются вычислительные ресурсы через YARN и как к ним можно обращаться через аналитические запросы в Hive или в режиме реального времени через HBase.
Тема 1: Обзор HDFS
Тема 2: Обзор YARN
Тема 3: Обзор Hive
Тема 4: Обзор HBase // ДЗ
Этот модуль посвящён проектированию платформ данных от классических подходов до современных концепций. Вы сравните методологии построения хранилищ, изучите гибкую архитектуру Data Vault 2.0, принципы объединения хранилищ и озёр данных в Lakehouse, а также особенности проектирования на основе высокопроизводительного движка StarRocks.
Тема 1: Проектирование хранилища данных
Тема 2: Использование Data Vault 2.0 в проектировании хранилища
Тема 3: Организация Lakehouse
Тема 4: Проектирование платформы данных на движке StarRocks // ДЗ
Этот модуль посвящён инструментам, которые превращают подготовленные данные в основу для управленческих решений. Вы изучите, как создаются интерактивные дашборды и отчёты для анализа готовых витрин, сравнив подходы и возможности двух популярных решений: открытого Apache Superset и облачного сервиса DataLens.
Тема 1: Apache Superset
Тема 2: DataLens // ДЗ
Этот модуль посвящён базовым концепциям и инструментам Data Science. Вы изучите основы языка Python для анализа данных, рассмотрите этап предобработки данных и познакомитесь с основными семействами алгоритмов машинного обучения.
Тема 1: Основы Python
Тема 2: Предобработка данных
Тема 3: Библиотеки Python: NumPy, Pandas
Тема 4: Метрики оценки моделей и линейные модели
Тема 5: Деревья решений
Тема 6: Методы опорных векторов
Тема 7: Основы нейронных сетей // ДЗ
Тема 1: Выбор темы и организация проектной работы // Проектная работа
Тема 2: Консультация по проектам и домашним заданиям
Тема 3: Защита проектных работ
Тема 4: Подведение итогов курса
Каждый курс завершается финальным проектом, который предстоит защитить перед преподавателями и командой. Вам будет, что обсудить на собеседовании!
В рамках проекта студентам будет предложено на основании open-source базы данных подготовить DWH и создать отчетность.
Вы можете выбрать одну из предложенных преподавателем тем или реализовать свою идею.
Эксперты-практики делятся опытом, разбирают кейсы студентов и дают развернутый фидбэк на домашние задания
OTUS осуществляет лицензированную образовательную деятельность. В конце обучения вы получите сертификат OTUS о прохождении курса и удостоверение о повышении квалификации.