№1. Анализируем шедевры живописи с помощью классического ML

Данная статья изначально была выпускным проектом для курса по машинному обучению. Автор, вооружившись самодельным парсером, ворвался в онлайн галерею и вынес оттуда почти 50 тысяч картин. Давайте посмотрим, что интересного с этим можно сделать, используя только классические ML инструменты


№2. Обзор олимпиады AIIJC 2021 и разбор задачи трека NLP

Автор рассказал о своем опыте участия в соревновании Artificial Intelligence International Junior Contest и о решении своей команды, которое заняло первое место в треке NLP.


№3. Рекомендательная система торговой сети самообслуживания

Эта статья — некоторый итог погружения автора в стихию DS и ML. В рамках курса «Machine Learning.Advanced» автор изучил несколько любопытных направлений анализа с использованием машинного обучения, и когда настало время подготовки проектной работы, остановил свое внимание на рекомендательных системах.


№4. Рекомендательная система торговой сети самообслуживания. Часть 2

Продолжение описания хода учебного исследовательского проекта по разработке рекомендательной системы. В первой части мы остановились на том, что модель, полученная с использованием библиотеки LightFM, не оправдала ожиданий автора. Можно ли сделать что-то лучше?


№5. Photo2recipe:  рецепт блюда по одному фото

В данном посте рассказывается фреймворке, который по фотографии еды определяет, из каких ингредиентов состоит блюдо, а затем предлагает несколько вариантов рецептов его приготовления.


№6. Чем грозит Москве «британский» штамм COVID-19? Отвечаем с помощью Python и дифуров

Туториал на основе трехмесячного исследования. В нём автор постарался передать все важные детали, которые могут сэкономить много недель работы.


№7. Как сделать тематическое моделирование форума быстро или что беспокоит людей с целиакией

В данной статье автор расскажет и покажет пример того, как человек с минимальным Data Science опытом смог собрать данные из форума и сделать тематическое моделирование постов с использованием LDA модели, а также выявить наболевшие темы людей с глютеновой непереносимостью.


№8. Создать мощный курс Machine Learning: миссия выполнена

У нас было 2 неудачных запуска, 169 студентов, 8 сердитых отзывов, 3 смены названий, слишком много теории и мало реальной практики. Не то чтобы это было полным провалом, но если начал обучать Data Science, надо сделать это идеально. В статье рассказываем историю о том, как мы развивали в OTUS направление анализа данных и какие на этом пути допустили, а потом исправили ошибки.


№9. Style transfer для сериала «Друзья»

В данном посте мы, с помощью методов автоматической обработки текстов, исследуем стиль речи шести главных героев знаменитого сериала «Друзья», проведем мультиязычный анализ для русского и английского языков, а также обучим нейросеть общаться в стиле главных героев.


№10. ML-обработка результатов голосований Госдумы (2016-2021)

Однажды автор наткнулся на сайт, на котором представлены результаты голосований Госдумы РФ за весь период её работы — с 1994-го года по сегодняшний день, и ему показалось интересным применить некоторые техники машинного обучения и обычной статистической обработки для выяснения некоторых вопросов. Каких вопросов и что из этого получилось — читайте в статье.


№11. Обработка временных рядов и байесовские модели для распознавания рукописного текста

Автор статьи — недавний выпускник курса «Machine Learning.Advanced» по продвинутым техникам машинного обучения и автор проекта «Применение алгоритмов обработки временных рядов и байесовских моделей для задачи извлечения символов из темпоральной информации с цифровой ручки».

Еще больше технических материалов вы найдете в нашем блоге на хабре.