Deep learning в системах CV

Глубокое обучение бывает особенно полезно в таких CV-задачах, когда базовый элемент не несет в себе большого смыслового значения, зато комбинация таких элементов это полезное значение имеет. При этом, говоря о базовом элементе, мы имеем в виду отдельный пиксель изображения, одну частоту сигнала, одну букву или слово.

На деле Deep learning-системы способны извлекать такие полезные комбинации без какого-нибудь человеческого вмешательства (Unsupervised Feature Learning).

Те же глубокие нейросети (deep neural network), имеющие более чем 1-2 слоя, раньше считались или нереализуемыми, или просто непрактичными в применении, а до 2006 г. и вовсе внешние слои нейронной сети были неспособны к извлечению ХЧ (features) входных изображений, а все потому, что алгоритмы обучения нейронных сетей были несовершенны.

На рисунке ниже — пример системы компьютерного зрения с машинным обучением. В данном случае стоит задача сегментирования сцены по 3-м типам: — «горизонтальный», — «вертикальный», — «небо».

Пиксельные данные от исходного изображения с цветокоррекцией поступают на нейронную Deep learning-сеть, где осуществляется предварительная обработка изображения и распознавание, к какому именно типу рельефа относится каждый пиксель, причем с известной степенью вероятности.

В качестве второго наглядного примера приведем распознавание рукописных цифр с применением простой одноуровневой нейронной сети:

По материалам сайта https://www.tadviser.ru/index.php.