Deep learning в системах CV
Глубокое обучение бывает особенно полезно в таких CV-задачах, когда базовый элемент не несет в себе большого смыслового значения, зато комбинация таких элементов это полезное значение имеет. При этом, говоря о базовом элементе, мы имеем в виду отдельный пиксель изображения, одну частоту сигнала, одну букву или слово.
На деле Deep learning-системы способны извлекать такие полезные комбинации без какого-нибудь человеческого вмешательства (Unsupervised Feature Learning).
Те же глубокие нейросети (deep neural network), имеющие более чем 1-2 слоя, раньше считались или нереализуемыми, или просто непрактичными в применении, а до 2006 г. и вовсе внешние слои нейронной сети были неспособны к извлечению ХЧ (features) входных изображений, а все потому, что алгоритмы обучения нейронных сетей были несовершенны.
На рисунке ниже — пример системы компьютерного зрения с машинным обучением. В данном случае стоит задача сегментирования сцены по 3-м типам: — «горизонтальный», — «вертикальный», — «небо».
Пиксельные данные от исходного изображения с цветокоррекцией поступают на нейронную Deep learning-сеть, где осуществляется предварительная обработка изображения и распознавание, к какому именно типу рельефа относится каждый пиксель, причем с известной степенью вероятности.
В качестве второго наглядного примера приведем распознавание рукописных цифр с применением простой одноуровневой нейронной сети:
По материалам сайта https://www.tadviser.ru/index.php.