№1. Анализируем шедевры живописи с помощью классического ML
Данная статья изначально была выпускным проектом для курса по машинному обучению. Автор, вооружившись самодельным парсером, ворвался в онлайн галерею и вынес оттуда почти 50 тысяч картин. Давайте посмотрим, что интересного с этим можно сделать, используя только классические ML инструменты
№2. Обзор олимпиады AIIJC 2021 и разбор задачи трека NLP
Автор рассказал о своем опыте участия в соревновании Artificial Intelligence International Junior Contest и о решении своей команды, которое заняло первое место в треке NLP.
№3. Рекомендательная система торговой сети самообслуживания
Эта статья — некоторый итог погружения автора в стихию DS и ML. В рамках курса «Machine Learning.Advanced» автор изучил несколько любопытных направлений анализа с использованием машинного обучения, и когда настало время подготовки проектной работы, остановил свое внимание на рекомендательных системах.
№4. Рекомендательная система торговой сети самообслуживания. Часть 2
Продолжение описания хода учебного исследовательского проекта по разработке рекомендательной системы. В первой части мы остановились на том, что модель, полученная с использованием библиотеки LightFM, не оправдала ожиданий автора. Можно ли сделать что-то лучше?
№5. Photo2recipe: рецепт блюда по одному фото
В данном посте рассказывается фреймворке, который по фотографии еды определяет, из каких ингредиентов состоит блюдо, а затем предлагает несколько вариантов рецептов его приготовления.
№6. Чем грозит Москве «британский» штамм COVID-19? Отвечаем с помощью Python и дифуров
Туториал на основе трехмесячного исследования. В нём автор постарался передать все важные детали, которые могут сэкономить много недель работы.
№7. Как сделать тематическое моделирование форума быстро или что беспокоит людей с целиакией
В данной статье автор расскажет и покажет пример того, как человек с минимальным Data Science опытом смог собрать данные из форума и сделать тематическое моделирование постов с использованием LDA модели, а также выявить наболевшие темы людей с глютеновой непереносимостью.
№8. Создать мощный курс Machine Learning: миссия выполнена
У нас было 2 неудачных запуска, 169 студентов, 8 сердитых отзывов, 3 смены названий, слишком много теории и мало реальной практики. Не то чтобы это было полным провалом, но если начал обучать Data Science, надо сделать это идеально. В статье рассказываем историю о том, как мы развивали в OTUS направление анализа данных и какие на этом пути допустили, а потом исправили ошибки.
№9. Style transfer для сериала «Друзья»
В данном посте мы, с помощью методов автоматической обработки текстов, исследуем стиль речи шести главных героев знаменитого сериала «Друзья», проведем мультиязычный анализ для русского и английского языков, а также обучим нейросеть общаться в стиле главных героев.
№10. ML-обработка результатов голосований Госдумы (2016-2021)
Однажды автор наткнулся на сайт, на котором представлены результаты голосований Госдумы РФ за весь период её работы — с 1994-го года по сегодняшний день, и ему показалось интересным применить некоторые техники машинного обучения и обычной статистической обработки для выяснения некоторых вопросов. Каких вопросов и что из этого получилось — читайте в статье.
№11. Обработка временных рядов и байесовские модели для распознавания рукописного текста
Автор статьи — недавний выпускник курса «Machine Learning.Advanced» по продвинутым техникам машинного обучения и автор проекта «Применение алгоритмов обработки временных рядов и байесовских моделей для задачи извлечения символов из темпоральной информации с цифровой ручки».
Еще больше технических материалов вы найдете в нашем блоге на хабре.