Структура DWH
Data Warehouse представляет собой единое корпоративное хранилище архивных данных из различных источников (департаментов, систем и т. д.). Цель такого хранилища — предоставить возможность принимать верные решения по управлению бизнесом, основываясь на целостной информационной картине. То есть в описываемом нами случае данные из различных систем хранятся не разрозненно, а целиком, что, по сути, консолидирует наиболее важную бизнес-информацию, плюс позволяет подготавливать качественные отчеты в автоматическом режиме.
DWH-хранилище – это сложная технология, имеющая непростую архитектуру. В этой архитектуре можно выделить нескольких уровней:
- Область по сбору первичных данных. Именно сюда поступает информация из различных отделов компании и баз данных.
- Ядро. Здесь разрозненная информация, которая поступает в хранилище, структурируется и приводится к нужным ключам/нужному виду. Как раз на этом этапе обеспечивается целостность и полнота данных.
- Витрины аналитики. На третьем уровне данные преобразуются в в такие структуры, с какими будет удобнее работать при решении конкретных задач. Сами по себе витрины бывают первичные (они помогают решать довольно простые задачи) и вторичные (для решения нетиповых задач, составления сложных аналитических отчетов и т. п.).
- Сервисный слой. Этот слой отвечает за управление 3-мя предыдущими. Он не имеет никаких сведений, зато управляет ими и производит аудит. С его помощью обеспечивается мониторинг данных, а также оперативное устранение ошибок.
Разрабатывать DWH-решения должны только опытные специалисты, обладающие глубокими профессиональными знаниями. Только в этом случае можно получить относительно простой, но эффективный в применении продукт.
По материалам https://cloud.mts.ru/.