ML-тренды для решения задач бизнес-аналитики

В этой статье мы расскажем про 5 трендов в сфере AI и ML в 2020 году.

Тренд №1 — AutoML

AutoML — автоматизированное машинное обучение (Automated machine learning или AutoML). Если сказать в двух словах, парадигма AutoML подразумевает наличие одной большой кнопки, нажатие которой позволит вам «построить хорошую модель».

AutoML нередко позиционируют как инструмент, нацеленный на представителей бизнеса, не владеющих технической экспертизой. В результате Data Science-задачи сможет решать человек, не имеющий специального технического образования.
Популярность таких инструментов растёт, однако пока рано говорить об AutoML, как о самостоятельном подходе, особенно в контексте больших корпораций.

Тренд № 2 — XAI

Речь идёт об объяснимом искусственном интеллекте (Explainable AI либо XAI).

Дело в том, что бизнес-пользователю крайне важно понимать логику, стоящую за принятием решения, что в большей мере характерно для сфер деятельности, где исторически господствовали легко интерпретируемые модели типа логистической регрессии либо деревьев решений (расчёт кредитных рисков, целевой маркетинг, страхование).

В последнее время брешь между интерпретацией и точностью стали закрывать методы типа LIME и XSHAPE и, судя по активности в академической среде, ожидается из дальнейшее распространение.

Тренд № 3 — RL

RL или Reinforcement Learning — это обучение с подкреплением и, по сути, развитие концепции непрерывного A/B тестирования с той лишь разницей, что вместо 2-х сегментов у нас их тысячи, а процесс функционирует непрерывно.

Когда-то обучение с подкреплением применяли для игр, в последние годы оно используется для решения бизнес-задач. Сегодня специалисты продолжают совершенствовать методы использования RL для бизнеса. Уже сейчас на рынке есть множество успешных кейсов применения: — выбор наиболее подходящей кампании в оптимизации маркетинга; — персонализация страниц и рассылок в цифровом маркетинге; — работа с проблемной задолженностью в кредитных рисках и т. п.

Тренд № 4 — графовая аналитика

Под графовой аналитикой понимают набор методов, ориентированных на анализ структуры связей между сущностями, а не на свойства этих сущностей. Например, связи между людьми в соцсетях, связи банковских счетов через проходящие по этим счетам переводы, различные структуры владения и т. д.

Методы графовой аналитики используются для анализа структуры связей и выявления неочевидных связей. Что касается ML-задач, то здесь графовая аналитика даёт возможность строить более сильные предикторы — переменные, описывающие окрестности интересующей сущности. Допустим, можно ответить на вопрос, как влияет на кредитный рейтинг фирмы рейтинг её контрагентов либо контрагентов контрагентов либо в принципе всей цепочки поставок.

Используя методы графовой аналитики, можно ограничиваться не только прямыми связями, но и окрестностями по связям разной длины.

Сегодня графы успешно используются для анализа сущностей, имеющих «естественную» сетевую структуру, например, соцсетей. Прогнозируют, что графов для сущностей с неочевидной сетевой структурой будет всё больше. Такие графы хороши для выстраивания последовательностей цепочек событий, происходящих с клиентом, либо анализа причинно-следственных отношений для задач управления маркетинговыми коммуникациями.

Тренд № 5 — ModelOps

Интерес к ML ежегодно растёт, и лидеры многих индустрий вовлечены в R&D, пилотирование использования Machine learning и углубленный анализ данных для бизнес-задач. В итоге уже давно концентрация усилий смещается на внедрение в промышленную эксплуатацию результатов успешных пилотов.

Соответственно, появляется потребность в методологии выстраивания бизнес-процессов вокруг жизненного цикла ML-моделей машинного обучения, есть потребность и в инструментах автоматизации этих процессов.

Данное направление и получило название ModelOps — операционализация машинного обучения. Говоря о ModelOps, можно легко проследить аналогию с DevOps — у нас есть акроним от Model (понимается ML-модель) и Operations (понимается IT-эксплуатация).

Уже сегодня на рынке присутствует больше 50 решений и инструментов, связанных с ModelOps-задачами, среди них есть как бесплатные решения (MLFlow, KubeFlow), так и решения от вендоров и лидеров в сфере Data Science — SAS и IBM.

Таким образом, ожидается качественное развитие отрасли, то есть движение в сторону унификации подходов как к методологии управления жизненным циклом ML-моделей в целом, так и к техническим решениям автоматизации процессов в частности.

При написании материала использовалась статья "Графовая аналитика, обучение с подкреплением и ModelOps — тренды ML 2020 для задач бизнес-аналитики".