NoRecSys. Машинное обучение — помощник в формировании ассортимента товаров для ритейла

Статья про противоположное применение рекомендательных систем — определение самого неподходящего товара для покупателей. Статья про то, как определять спрос на новый товар, и как выявлять характеристики товара, из-за которых ритейл и интернет-площадки теряют продажи. Статья про понимание, что нужно продавать и производить для потребителя. Читать


Обзор олимпиады AIIJC 2021 и разбор задачи трека NLP

В статье автор расскаывает о своем опыте участия в соревновании Artificial Intelligence International Junior Contest и о решении команды, которое заняло первое место в треке NLP. Читать


Рекомендательная система торговой сети самообслуживания

За основу публикации взят опыт создания учебного исследовательского проекта по разработке рекомендательной системы. Целью работы было создать модель, способную предсказывать товары, которые будут наиболее интересными и актуальными для покупки, конкретным покупателем. Читать


Предсказание горимости территорий методами машинного обучения на основе географических данных

Рассказ о том, как с помощью средств ML можно предсказать горимость регионов. Целью работы не ставилась идентификация самих выгоревших площадей, напротив, это попытка составить оптимальную модель предсказания, используя простые географические данные региона. Читать


Тематическое моделирование антивакцинаторских сообществ в Telegram

Пост посвящён тематическому моделированию антивакцинаторских каналов в Telegram, мы рассчитываем понять, что именно они обсуждают. Читать


Машинное обучение на периферии

Edge ML (машинное обучение на периферии) предполагает размещение ML-моделей на потребительских устройствах, где они могут самостоятельно делать выводы без подключения к Интернету, в режиме реального времени и бесплатно. Читать далее


Практическая обработка изображения линии горизонта с помощью Python

Краткое руководство по профилированию линии горизонта городской панорамы с помощью Python в несколько строк кода. Читать


Ускоряем кластеризацию больших векторов, анализируя страны Центральной Азии

Задачи кластеризации хорошо поддаются визуализации, понятны людям, далеким от математики, и зачастую оказывают быстрое влияние на бизнес процессы. Однако, при решении задач кластеризации мы можем столкнуться с рядом проблем, среди которых может быть:

  • большая размерность вектора признаков
  • отсутствие данных на подмножестве фичей
  • зашумленность значений / выбросы и т.д.

В случае, если количество объектов небольшое, то при неблагоприятном стечении обстоятельств мы можем столкнуться с серьезными проблемами в качестве нашей кластеризации. Читать далее