Компьютерное зрение — это технология и направление в сфере искусственного интеллекта, которая использует особенности машинного и глубокого обучения, чтобы позволить компьютеру видеть, распознавать и классифицировать объекты окружающего мира. Эта технология способна оказывать значительное влияние на работу компаний разных отраслей, от розничной торговли до сельского хозяйства. Особенно она полезна для решения тех задач, которые требуют «видеть ситуацию», но способностей человеческого глаза при этом недостаточно. По причине того, что задач в этой области действительно огромное множество, применение этой технологии во многих сферах человеческой деятельности до сих пор не реализовано или по крайней мере не исчерпано.
В статье расскажем о некоторых прогрессивных и быстроразвивающихся сферах применения применения компьютерного зрения, актуальных на 2021 год.
#1. Здравоохранение и медицина
Обнаружение рака
Технология компьютерного зрения используется в медицинской промышленности для обнаружения рака груди и кожи. А именно, она позволяет выявлять малейшие различия между изображениями злокачественных и доброкачественных опухолей, а также диагностировать данные сканирования магнитно-резонансной томографии (МРТ) и объектов на изображениях как злокачественные или доброкачественные.
Анализ движения
Некоторые неврологические и заболевания опорно-двигательного аппарата могут быть обнаружены с помощью глубоких моделей обучения и компьютерного зрения даже без анализа со стороны врача. Компьютерное зрение анализирует движения тела пациента и помогает врачам с большей точностью диагностировать заболевания.
Обнаружение опухолей
Опухоли головного мозга можно увидеть с помощью результатов МРТ. Также они часто обнаруживаются с помощью глубоких нейронных сетей. Программное обеспечение для обнаружения опухолей, использующее глубокое обучение, имеет решающее значение для медицинской индустрии, поскольку оно может обнаруживать опухоли с высокой точностью, что помогает врачам поставить диагноз. При этом постоянно разрабатываются новые методы для повышения точности диагнозов.
Сегментация изображений по сканированным изображениям
Потенциал компьютерного зрения в здравоохранении огромен, а возможности его применения бесчисленны. Медицинская диагностика во многом основывается на изучении различных изображений, сканов и фотографий. Анализ ультразвуковых изображений, МРТ и КТ — неотъемлемая часть стандартного набора современной медицины. Ожидается, что технологии компьютерного зрения не только упростят эти процессы, но и научатся предотвращать ошибочные диагнозы и снижать затраты на лечение. Стоит уточнить, что предназначение компьютерного зрения состоит не в замене медицинских специалистов, а в облегчении их работы и поддержке в принятии решений.
#2. Сельское хозяйство и земледелие
Обнаружение поврежденной продукции
С помощью алгоритмов машинного обучения можно обнаружить поврежденную продукцию в процессе ее обработки. Алгоритмы обучаются на множестве данных и они способны различать спелые и испорченные продукты на основе их характерных различий.
Подсчет продукции
Через систему обработки изображений могут проходить массы изображений продукции для быстрого и точного подсчета количества объектов. Это позволяет фермерам иметь точные данные об объеме выращиваемой продукции, и эта информация позволяет им рассчитывать оптимальную стоимость продукции и эффективнее планировать работы.
Распознавание растений
С помощью приложений, использующих технологию компьютерного зрения, фермеры могут легко определять сорняки и прочих вредителей. Подобные программы легко идентифицируют растения и животных на уровне вида по фотографии.
Мониторинг животных
За животными можно наблюдать с помощью новых методов, которые были обучены определять тип животного и его действия. Удаленный мониторинг домашних животных может быть полезен в сельском хозяйстве для выявления заболеваний, изменения поведения или, например, родов. Также ученые, занимающиеся изучением дикой природы, могут безопасно наблюдать за дикими животными на расстоянии.
Автоматизация ферм
Роботы для сбора урожая и других сельскохозяйственных работ, автономные тракторы и дроны для мониторинга условий на ферме и распространения удобрений могут поддерживать и даже увеличить количество урожая при нехватке рабочей силы. Сельское хозяйство также может быть более прибыльным, если минимизировать меру воздействия человека на окружающую среду — так называемый экологический след.
Интересный кейс: обнаружение заболеваний злаковых культур
Современные технологии позволяют хозяйствам эффективно возделывать все бОльшие территории полей. Но участки необходимо проверять на наличие вредителей и заболевания растений, потому что в противном случае это грозит критическим падением или потерей урожая.
Современные технологии облегчают сбор различных значений, параметров и статистических данных, которые можно отслеживать автоматически. Например, дроны и удаленные датчики собирают большие объемы данных, которые потом обрабатываются. С их помощью фермерские хозяйства могут безостановочно следить за всеми условиями: состоянием почвы, уровнем орошения, температурой и прочими погодными условиями, здоровьем растений. Далее алгоритмы машинного обучения анализируют полученные данные и ферма может использовать эту информацию для реагирования на потенциальные проблемные места на их ранней стадии и эффективного распределения существующих ресурсов.
Несколько лет назад о болезнях растений часто узнавали уже после их распространения, что вело к потери части урожая. Технология компьютерного зрения особенно ценна для сельского хозяйства потому, что анализ изображений позволяет выявлять болезни растений на ранней стадии. В результате фермы не только теряют меньше урожая, но и экономят на пестицидах, поскольку отпадает необходимость обрабатывать большие территории.
#3. Транспорт
Распознавание номерных знаков
Автоматическое распознавание символов на изображениях номерных знаков реализует возможность получения данных о местоположении транспортного средства. Эту технологию можно использовать в камерах на дорогах для отслеживания нарушений, в системе электронного сбора платы за проезд или в других правоохранительных целях, например, в уголовных расследованиях.
Обнаружение мертвого угла
Система бокового сканирования способна распознавать велосипедистов, транспортные средства или людей, которые находятся в опасной близости от объекта, и сигнализировать об этом с помощью светодиода или предупреждать звуковым сигналом.
Интересный кейс: распознавание и классификация объектов в дорожном движении
Беспилотный автомобиль, являющийся ярким воплощением идеи автономного движения, является одним из примеров использования искусственного интеллекта. В него упаковано несколько задач машинного обучения, и компьютерное зрение — важная часть их решения.
Алгоритм, управляющий беспилотным автомобилем, должен постоянно получать информацию об окружающей обстановке. Алгоритму необходимо знать, как проходит дорога, где поблизости находятся другие объекты и с какой скоростью они движутся, как далеко до потенциальных препятствий и многое другое, чтобы постоянно адаптироваться к постоянно меняющимся условиям. С этой целью автономные транспортные средства оснащены обширными камерами по всем сторонам, которые снимают все вокруг. Алгоритм обрабатывает непрерывный поток изображений и классифицирует данные.
Распознавание и классификация объектов в дорожном движении (miro.medium.com)
Нетривиальность задачи состоит в сложности и непостоянстве дорожного движения, поэтому алгоритм необходимо обучать таким образом, чтобы исключить вероятность сбоев в сложных исключительных ситуациях. Из этого вытекает следующая трудность — потребность в больших объемах обучающих данных, получение которых в условиях дорожного движения связано с высокими затратами.
#4. Розничная торговля
В секторе розничной торговли компьютерное зрение позволяет улучшить процесс совершения покупок, избежать потери или кражи товаров и своевременно обнаруживать недостаток товаров на полках. Компьютерное зрение также используется для ускорения процесса оплаты — на кассах самообслуживания или в сочетании с машинным обучением для полностью автоматического выставления счетов, что позволяет избежать процесса оплаты в магазине.
Отслеживание поведения посетителей
Крупные глобальные интернет-магазины, такие как Amazon, уже давно могут воспользоваться аналитическими возможностями своей цифровой платформы. Поведение клиентов можно детально проанализировать, а пользовательский опыт можно оптимизировать и улучшить.
Алгоритмы могут оценивать видеоматериал, отснятый с помощью привычных камер наблюдения и изучать поведение покупателей в магазине. Для маркетинга является интересной возможность анализа поведения отдельных потребителей, например, выбранный маршрут по магазину и отдельным отделам. Это позволяет улучшить методику выкладки товара, наборы продаваемых товаров, расположение и структуру отделов, избежать чрезмерной загрузки популярных отделов, словом, оптимизировать маркетинговые составляющие и улучшить общий пользовательский опыт посетителей магазина.
#5. Производство
Производственные компании могут использовать компьютерное зрение для обнаружения дефектов продукции в режиме реального времени. Когда продукция покидает производственную линию, компьютер обрабатывает изображения или видео и так может выявить различные дефекты даже на самых маленьких компонентах.
#6. Фитнес
Оценка позы человека
Индустрия фитнеса в последние годы находится в активном процессе цифровой трансформации. Прогресс тренировок отслеживается и оценивается с помощью приложений, а виртуальные и домашние тренировки стали пользоваться особенной популярностью в период кризиса пандемии. В частности, во время силовых тренировок особенно важно соблюдать определенное положение тела, чтобы избежать риска получения травмы. Сейчас это стало возможным без наблюдения фитнес-тренера — компьютерное зрение позволяет оценивать и оценивать видеоматериал более точно, чем человеческий глаз в этой области, происходит это с помощью проверки осанки и положения тела с помощью видео. Для этого определяется положение суставов и их положение по отношению друг к другу. Алгоритм знает, как должно выглядеть идеальное и безопасное выполнение фитнес-упражнения, и отклонение от него можно автоматически распознавать и выделять. Таким образом, приложение своевременно предупреждает об опасных ошибках, что делает тренировки без наблюдения тренера более безопасными.
Резюме
Представленные здесь примеры — лишь верхушка айсберга. В каждой из упомянутых отраслей прилагаются большие усилия, чтобы сделать существующие процессы более эффективными с помощью технологий компьютерного зрения. В настоящее время предпринимаются попытки развить компьютерное зрение до третьего измерения и получить возможность обрабатывать 3D-модели вместо фотографий и сканированных изображений. Спрос на промышленную обработку изображений в 3D растет как в геодезии, медицине и робототехнике. Обработка материалов трехмерных изображений будет продолжать привлекать особое внимание к ближайшем будущем, потому что многие проблемы могут быть эффективно решены только в 3D.