Кратко о DataOps. Предпосылки появления
DataOps (DATA Operations, датаопс) представляет собой набор практик по непрерывной интеграции данных между процессами, системами и командами. Реализация соответствующей концепции повышает эффективность корпоративного управления/отраслевого взаимодействия благодаря ряду плюсов:
Каковы были предпосылки появления DataOps?
Сам термин DataOps существенно моложе известного термина DevOps, хотя он уже довольно широко применяется в IT-мире. Впервые данное понятие прозвучало в 2015 г., после чего его стали тиражировать в контексте цифровизации и построения компаний и организаций, управляемых данными (data-driven enterprise) — достаточно вспомнить, например, Facebook.
Вот как может выглядеть информационный круговорот в компании, управляемой данными:
В чем принципиальная особенность DataOps?
Если вернуться к пресловутому DevOps, то его главная цель — обеспечение быстрой и непрерывной поставки работающего ПО бизнесу. И вот здесь хорошо прослеживаются принципиальные отличия DataOps, так как эта концепция предполагает быстрое и безбарьерное предоставление актуальных и рабочих данных любому участнику корпоративных процессов.
Что это значит на практике? Да хотя бы то, что устраняются когнитивные, временные и организационные разрывы между следующими группами специалистов: — исследователи данных (они же Data Scientist’ы); — бизнес-аналитики; — разработчики; — руководители и пользователи Big Data.
То есть можно говорить о некой демократизации данных, которая увеличивает скорость реакции на любые изменения — а это уже всегда актуально для современного динамического бизнеса, плюс, ко всему прочему, это отвечает принципам Agile. Ведь большие данные — они ведь нестатичны, следовательно требуются: — надежные и быстрые технологии по обработке данных; — гибкие и прикладные управляющие процессы; — изменение корпоративной культуры, ведь информация — это главная ценность и основное средство осуществления деятельности.
И, действительно: какой смысл в высочайшем качестве аналитических Machine Learning-моделей, которые разработал тот же Data Scientist, если данная информация не передана вовремя ответственным лицам, которые используют ее для текущей работы и принимают стратегические решения?
Ну а что касается непрерывной аналитики данных, осуществляемой в течение всего жизненного цикла, то такая аналитика не только повышает значимость информации для бизнеса, но и обеспечивает повышенную защиту этой информации от утечек и прочих нарушений безопасности, что становится возможным благодаря согласованной политике доступа.
По материалам https://www.osp.ru/.