Задачи, решаемые NLP: машинный перевод и анализ текстов | OTUS

Задачи, решаемые NLP: машинный перевод и анализ текстов

С каждым годом применение Natural Language Processing увеличивается, в связи с чем растет и NLP-рынок. Это неудивительно, ведь интеллектуальные устройства используются все чаще, как и облачные решения и программные приложения, основанные на NLP.

Сегодня NLP может решать самые разные задачи. В этой заметке мы вкратце рассмотрим область, связанную с обработкой текстовой информации.

Машинный перевод текстов

Перевод текста -- широко известный и наиболее распространенный сценарий. Что тут стоит отметить? С одной стороны, качество перевода ежегодно растет, то есть налицо прогресс машинного перевода. С другой -- несмотря на современные технологические решения до сих пор не всегда удается перевести игру слов или устойчивые обороты. Существуют недостатки и при правильном построении предложений, выборе подходящих падежей.

PR_720x72_1-20219-9ed27f.jpg

Анализ текстов

Сегодня для анализа текстов применяют разные форматы, вот основные:

  • классификация;
  • отражение содержания;
  • анализ тональности.

Классификация (text classification)

Задачи по классификации можно разделить на 2 вида:

  1. Бинарная классификация. Она дает возможность определять релевантность документа, предложенного пользователю.
  2. Мультиклассовая классификация. С ее помощью можно определить тематику документа, что позволит отнести его к нужному тематическому классу (одному из сотни).

Отражение содержания текста

Text summarization работает следующим образом: - NLP-система принимает на вход текст большого размера; - на выходе получается текст меньшего размера, который кратко отражает содержание (привет школьникам и студентам, а также краткому содержанию "Войны и мира" и иже с ними).

1-20219-132cb0.png

При этом от системы можно потребовать сгенерировать не только краткий пересказ или аннотацию, но и заголовок текста и т. д. Плюс есть разные способы, позволяющие генерировать забавные и осмысленные для человеческого восприятия заголовки.

Анализ тональности текста

Этот формат позволяет находить в тексте разные мнения и свойства. К примеру, можно определить стиль текста, его эмоциональную окраску и пр.

2_720x222_1-20219-4e2985.jpg

По материалам https://tproger.ru/.

Не пропустите новые полезные статьи!

Спасибо за подписку!

Мы отправили вам письмо для подтверждения вашего email.
С уважением, OTUS!

Автор
0 комментариев
Для комментирования необходимо авторизоваться
Популярное
Сегодня тут пусто