Обработка и анализ изображений в задачах машинного зрения

Материал из Техническое зрение
(Различия между версиями)
Перейти к: навигация, поиск
(Подробнее)
 
Строка 1: Строка 1:
Если в любом из популярных интернет-поисковиков ввести запрос с ключевыми
+
В центре нашего интереса находятся математические, алгоритмические, программные и
словами "обработка изображений", то большинство выпавших ссылок скорее
+
всего будут связаны с редактированием цифровых фотографий в системах типа
+
Photoshop или созданием разнообразных визуальных эффектов наподобие тех,
+
которыми столь славен в последнее время Голливуд. Данный учебный курс,
+
несмотря на схожее название, посвящен совсем иному кругу вопросов. В центре
+
нашего интереса находятся математические, алгоритмические, программные и
+
 
аппаратные средства, дающие возможность воспроизводить и автоматизировать
 
аппаратные средства, дающие возможность воспроизводить и автоматизировать
 
при помощи компьютеров те зрительные функции человека, которые позволяют ему
 
при помощи компьютеров те зрительные функции человека, которые позволяют ему
Строка 19: Строка 13:
 
Но признаком несомненной зрелости нашей прикладной науки является то, что
 
Но признаком несомненной зрелости нашей прикладной науки является то, что
 
теперь эти вопросы всегда ставятся в практической плоскости, с учетом
 
теперь эти вопросы всегда ставятся в практической плоскости, с учетом
обязательных и близких перспектив технического внедрения. И значит, у
+
обязательных и близких перспектив технического внедрения.
студентов, решивших посвятить определенное время изучению данного учебного
+
курса, имеется достаточно серьезный повод надеяться, что полученные знания,
+
скорее всего, окажутся профессионально востребованы в ближайшие $10$-$20$ лет.
+
Причем число организаций и компаний, в которых сегодня существует или завтра
+
возникнет потребность в специалистах подобного профиля, продолжает
+
стремительно увеличиваться.
+
  
Наверное, одна из самых дерзких целей, которые могут быть поставлены перед
+
Далее мы будем использовать обобщающий термин "машинное зрение"
научно-инженерным сообществом -  это задача создания роботов, не уступающих
+
по возможностям своим создателям. Подобно человеку, такие роботы должны иметь
+
разнообразные органы чувств, возможность анализировать поступающую
+
информацию, делать на ее основе целеполагающие выводы, вырабатывать и
+
реализовывать программы поведения и т. д. Однако эта гордая мечта натыкается
+
на препятствие уже в самом начале, а именно при попытке создать систему
+
понимания изображений -  искусственное (или, как чаще говорят) машинное
+
зрение. Далее мы будем использовать обобщающий термин "машинное зрение"
+
 
(machine vision) как понятие, наиболее полно объемлющее круг инженерных
 
(machine vision) как понятие, наиболее полно объемлющее круг инженерных
 
технологий, методов и алгоритмов, связанных с задачей интерпретации сцены
 
технологий, методов и алгоритмов, связанных с задачей интерпретации сцены
Строка 41: Строка 21:
 
использование результатов этой интерпретации.
 
использование результатов этой интерпретации.
  
Рассматривая homo sapiens как самую совершенную из известных нам систему
+
"Машинное зрение" имеет огромное число потенциальных областей
управления, можно на основе сравнения с последними достижениями в механике,
+
электронике и радиотехнике, вычислительных архитектурах и платформах сделать
+
вывод, что многие элементы этой системы управления уже имеют искусственные
+
аналоги. Например, современные сенсоры уже превосходят человеческий глаз -
+
как по характеристикам разрешения, так и по возможностям наблюдения сцены в
+
различных спектральных диапазонах.
+
 
+
Вычислительные платформы демонстрируют непрекращающийся бурный рост. Счет
+
идет на тера- и пентафлопсы, колоссальные успехи наблюдаются в промышленной
+
робототехнике и мехатронике, марсоходы исследуют соседние планеты. Однако
+
огромное (увы!) отставание в технологиях "искусственного интеллекта" и его
+
важной составляющей части -  понимании сцен и изображений -  остается
+
сегодня, по сути, основным сдерживающим фактором для дальнейшего развития
+
сложных систем управления. Кроме роботов-андроидов к классу объектов,
+
обладающих подобными  сложными системами управления, можно, безусловно, отнести самолеты,
+
корабли, автомобили, производственные комплексы и многое другое.
+
 
+
Невозможность полноценного автоматического анализа сцен на таком уровне, на
+
каком это делает даже ребенок, вынуждает исследователей двигаться
+
постепенно, разбивая задачу машинного зрения на ряд подзадач меньшей
+
сложности, таких как улучшение изображений, их стандартизация
+
(нормализация), выделение особых характерных элементов и т. п.
+
 
+
Зрение -  наиболее информативный канал восприятия окружающей
+
действительности. Объем информации, поступающей от зрения (объем видеопотока),
+
на порядки превосходит объемы данных от других органов чувств. Однако другая
+
сторона этой информационной вакханалии -  колоссальная избыточность
+
изображений. Ведь иногда для практического применения может оказаться
+
достаточно только одного байта информации -  есть или нет в поле зрения
+
нужный предмет. (Как зрительная система человека в принципе может
+
справляться с информационной избыточностью, было, в частности, показано в
+
фундаментальном исследовании Д. Марра.)
+
 
+
Стремясь защитить человека от непомерной и рутинной работы, максимально
+
повышая функциональные возможности человеко-машинных систем, разработчики
+
пришли к созданию таких приложений, в которых лишь некоторая часть
+
зрительных задач возлагается на машинную часть системы. Таковы, например,
+
системы "усиленного" видения, системы формирования зон интереса для
+
человека-оператора и т. д.
+
 
+
По сути, наиболее точным термином, отражающим происходящее развитие
+
современных сложных систем управления, служит термин "интеллектуализация",
+
т. е. достижение все большего функционального сходства с возможностями
+
человека. Как следует из вышесказанного, ключевой аспект интеллектуализации -
+
прогресс в технологиях машинного зрения.
+
 
+
Каждый, кто глубоко сталкивался с проблемой конструирования системы
+
технического зрения, осознает, какой большой разрыв существует между
+
современными достижениями в этой дисциплине и реальным зрительным
+
восприятием человека. Еще более обидно для научного сообщества то, что
+
великолепное умение ориентироваться в сложных сценах демонстрируют даже не
+
самые развитые на вид животные, например, таракан или муравей. Почему же
+
задача понимания изображений оказывается на проверку такой необычайно
+
сложной? На взгляд авторов этой книги здесь можно привести три соображения.
+
 
+
Первое -  это необыкновенное разнообразие яркостно-геометрических свойств
+
изображения. Каких только расцветок, форм, текстур и их немыслимых сочетаний
+
ни преподносит нам природа и человеческая фантазия! Все это богатство не
+
имеет жесткой причинной взаимосвязи, не вытекает из действия каких либо
+
физических законов, позволивших бы упростить модельное описание сцены
+
наблюдения. Значит, нужны все новые, все более гибкие математические и
+
информационные подходы к описанию содержимого изображений при помощи
+
формально сконструированных яркостно-геометрических структур. Такие подходы
+
действительно создаются -  морфологии Серра, Пытьева, теория фракталов и
+
т. п., но до окончательных успехов здесь пока далеко.
+
 
+
Второе соображение -  это колоссальная изменчивость, существующая в царстве
+
изображений. Истоки этой изменчивости также бесконечно разнообразны и трудно
+
формализуемы -  случайная игра света, отклонения формы и размеров, тысячи
+
видов искажений и шумов. Не забудем и постоянно возникающий из-за трехмерной природы сцены фактор загораживания объектов интереса.
+
Все это выдвигает очень тяжелое
+
требование устойчивости работы алгоритмов в трудных условиях -  требование
+
робастности. Это объясняет интерес к любым математическим подходам в
+
обработке изображений, несущих в себе элементы робастности, например к
+
преобразованию Хафа, оцениванию на основе ранговых статистик и др. Однако недостатки существующих
+
методик и нужда в новых подходах здесь по-прежнему очевидны.
+
 
+
Третье соображение касается информационной поддержки процесса понимания
+
сцен. Ясно, что система, желающая что-то понять, должна обладать огромной
+
базой знаний об окружающем мире. Организация этой базы, ее наполнение,
+
актуализация -  очень непростые задачи. Достаточно вспомнить, что
+
формирование аналогичной базы в сознании человека занимает долгие годы.
+
 
+
Представляется, что на сегодняшний день наиболее продуктивен так называемый
+
модельный подход, который сводит общую проблему "понимания изображений" к
+
гораздо более простой и ясной проблеме $\textit{обнаружения}$ и $\textit{распознавания}$ или $\textit{измерения}$ по одному или нескольким
+
изображениям объектов, удовлетворяющих некоторому заранее известному
+
$\textit{модельному}$ описанию. Теория машинного зрения предлагает целый ряд различных модельных
+
описаний наблюдаемых объектов, которые могут быть использованы для их
+
обнаружения и измерения. В литературе описан широкий спектр таких моделей -  от простейших признаковых описаний до высоко специализированных и
+
изощренных структурных моделей. Однако общий метод составления
+
работоспособных моделей по вышеупомянутым соображениям отсутствует. Отсюда
+
следует, что разработка и использование моделей, пригодных для эффективного
+
решения задачи обнаружения соответствующих объектов, в значительной степени
+
остается на грани науки и искусства, то есть требует особого "know-how"
+
или, другими словами, знания предметной области, отражающего многолетний
+
опыт исследований по решению частных задач.
+
 
+
Решение задачи автоматического выделения сложных объектов открывает перед
+
системами "машинного зрения" огромное число потенциальных областей
+
 
применения, таких как промышленная инспекция и контроль качества,
 
применения, таких как промышленная инспекция и контроль качества,
 
робототехника, навигация и транспортировка, дистанционное зондирование,
 
робототехника, навигация и транспортировка, дистанционное зондирование,
 
медицина и биомеханика, инженерный труд, автоматизация проектирования, новые
 
медицина и биомеханика, инженерный труд, автоматизация проектирования, новые
технологии обработки документов, биометрия и множество других. При этом сама
+
технологии обработки документов, биометрия и множество других. Основные задачи, машинного зрения могут быть сформулированы следующим образом:
задача обнаружения объектов является, безусловно, базовой, но частной
+
технологической задачей по отношению ко всему комплексу основных целевых
+
задач, которые в общих чертах могут быть сформулированы следующим образом:
+
  
 
# калибровка сенсоров, самоориентация и самопозиционирование;
 
# калибровка сенсоров, самоориентация и самопозиционирование;

Текущая версия на 17:44, 24 сентября 2020

В центре нашего интереса находятся математические, алгоритмические, программные и аппаратные средства, дающие возможность воспроизводить и автоматизировать при помощи компьютеров те зрительные функции человека, которые позволяют ему дистанционно ориентироваться в окружающем мире, понимать его, выполнять те или иные стоящие перед ним целевые задачи. В $60$-е годы прошлого века задачи такого типа ставились скорее в теоретической плоскости и обобщенно относились к области "распознавания образов", в свою очередь входящей в еще более пафосную научную отрасль под названием "искусственный интеллект". Сегодня, полвека спустя, когда теории во многом превратились в технологии, мы гораздо более скромно говорим о технической дисциплине под названием "машинное зрение". Это не означает, что в области обработки и анализа изображений не осталось открытых проблем, - их огромное количество. Но признаком несомненной зрелости нашей прикладной науки является то, что теперь эти вопросы всегда ставятся в практической плоскости, с учетом обязательных и близких перспектив технического внедрения.

Далее мы будем использовать обобщающий термин "машинное зрение" (machine vision) как понятие, наиболее полно объемлющее круг инженерных технологий, методов и алгоритмов, связанных с задачей интерпретации сцены наблюдения по ее двумерным проекциям (изображениям), а также практическое использование результатов этой интерпретации.

"Машинное зрение" имеет огромное число потенциальных областей применения, таких как промышленная инспекция и контроль качества, робототехника, навигация и транспортировка, дистанционное зондирование, медицина и биомеханика, инженерный труд, автоматизация проектирования, новые технологии обработки документов, биометрия и множество других. Основные задачи, машинного зрения могут быть сформулированы следующим образом:

  1. калибровка сенсоров, самоориентация и самопозиционирование;
  2. обнаружение объектов и изменений в сцене наблюдения;
  3. слежение за объектами;
  4. реконструкция поверхностей и обнаружение трехмерных структур;
  5. высокоточные измерения элементов сцены;
  6. описание сцены и идентификация объектов;
  7. организация зрительной обратной связи при работе управляемых устройств,

манипуляторов или мобильных роботов в изменчивой среде.


[править] Подробнее

  1. Уровни и методы машинного зрения
  2. Сопряженные технические дисциплины
  3. Требования к алгоритмам машинного зрения
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты