ML-тренды для решения задач бизнес-аналитики
В этой статье мы расскажем про 5 трендов в сфере AI и ML в 2020 году.
Тренд №1 — AutoML
AutoML — автоматизированное машинное обучение (Automated machine learning или AutoML). Если сказать в двух словах, парадигма AutoML подразумевает наличие одной большой кнопки, нажатие которой позволит вам «построить хорошую модель».
AutoML нередко позиционируют как инструмент, нацеленный на представителей бизнеса, не владеющих технической экспертизой. В результате Data Science-задачи сможет решать человек, не имеющий специального технического образования.
Популярность таких инструментов растёт, однако пока рано говорить об AutoML, как о самостоятельном подходе, особенно в контексте больших корпораций.
Тренд № 2 — XAI
Речь идёт об объяснимом искусственном интеллекте (Explainable AI либо XAI).
Дело в том, что бизнес-пользователю крайне важно понимать логику, стоящую за принятием решения, что в большей мере характерно для сфер деятельности, где исторически господствовали легко интерпретируемые модели типа логистической регрессии либо деревьев решений (расчёт кредитных рисков, целевой маркетинг, страхование).
В последнее время брешь между интерпретацией и точностью стали закрывать методы типа LIME и XSHAPE и, судя по активности в академической среде, ожидается из дальнейшее распространение.
Тренд № 3 — RL
RL или Reinforcement Learning — это обучение с подкреплением и, по сути, развитие концепции непрерывного A/B тестирования с той лишь разницей, что вместо 2-х сегментов у нас их тысячи, а процесс функционирует непрерывно.
Когда-то обучение с подкреплением применяли для игр, в последние годы оно используется для решения бизнес-задач. Сегодня специалисты продолжают совершенствовать методы использования RL для бизнеса. Уже сейчас на рынке есть множество успешных кейсов применения: — выбор наиболее подходящей кампании в оптимизации маркетинга; — персонализация страниц и рассылок в цифровом маркетинге; — работа с проблемной задолженностью в кредитных рисках и т. п.
Тренд № 4 — графовая аналитика
Под графовой аналитикой понимают набор методов, ориентированных на анализ структуры связей между сущностями, а не на свойства этих сущностей. Например, связи между людьми в соцсетях, связи банковских счетов через проходящие по этим счетам переводы, различные структуры владения и т. д.
Методы графовой аналитики используются для анализа структуры связей и выявления неочевидных связей. Что касается ML-задач, то здесь графовая аналитика даёт возможность строить более сильные предикторы — переменные, описывающие окрестности интересующей сущности. Допустим, можно ответить на вопрос, как влияет на кредитный рейтинг фирмы рейтинг её контрагентов либо контрагентов контрагентов либо в принципе всей цепочки поставок.
Используя методы графовой аналитики, можно ограничиваться не только прямыми связями, но и окрестностями по связям разной длины.
Сегодня графы успешно используются для анализа сущностей, имеющих «естественную» сетевую структуру, например, соцсетей. Прогнозируют, что графов для сущностей с неочевидной сетевой структурой будет всё больше. Такие графы хороши для выстраивания последовательностей цепочек событий, происходящих с клиентом, либо анализа причинно-следственных отношений для задач управления маркетинговыми коммуникациями.
Тренд № 5 — ModelOps
Интерес к ML ежегодно растёт, и лидеры многих индустрий вовлечены в R&D, пилотирование использования Machine learning и углубленный анализ данных для бизнес-задач. В итоге уже давно концентрация усилий смещается на внедрение в промышленную эксплуатацию результатов успешных пилотов.
Соответственно, появляется потребность в методологии выстраивания бизнес-процессов вокруг жизненного цикла ML-моделей машинного обучения, есть потребность и в инструментах автоматизации этих процессов.
Данное направление и получило название ModelOps — операционализация машинного обучения. Говоря о ModelOps, можно легко проследить аналогию с DevOps — у нас есть акроним от Model (понимается ML-модель) и Operations (понимается IT-эксплуатация).
Уже сегодня на рынке присутствует больше 50 решений и инструментов, связанных с ModelOps-задачами, среди них есть как бесплатные решения (MLFlow, KubeFlow), так и решения от вендоров и лидеров в сфере Data Science — SAS и IBM.
Таким образом, ожидается качественное развитие отрасли, то есть движение в сторону унификации подходов как к методологии управления жизненным циклом ML-моделей в целом, так и к техническим решениям автоматизации процессов в частности.
При написании материала использовалась статья "Графовая аналитика, обучение с подкреплением и ModelOps — тренды ML 2020 для задач бизнес-аналитики".