Уровни и методы машинного зрения

Материал из Техническое зрение
Перейти к: навигация, поиск

На протяжении десяти-пятнадцати последних лет в алгоритмическом аспекте последовательность действий по обработке изображения принято рассматривать в согласии с так называемой $\textit{модульной парадигмой}$. Эта парадигма, предложенная Д. Марром на основе длительного изучения механизмов зрительного восприятия человека, утверждает, что обработка изображений должна опираться на несколько последовательных уровней восходящей информационной линии: от "иконического" представления объектов (растровое изображение, неструктурированная информация) - к их символическому представлению (векторные и атрибутивные данные в структурированной форме, реляционные структуры и т. п.). Исходя из этого, в области машинного зрения принято выделять следующие основные этапы обработки данных:


  1. предобработка изображений;
  2. сегментация;
  3. выделение геометрической структуры;
  4. определение относительной структуры и семантики.


Связанные с этими этапами $\textit{уровни обработки}$ обычно называются соответственно: обработка нижнего уровня, среднего уровня, высокого уровня. В то время как алгоритмы обработки нижнего уровня (фильтрация простых шумов, гистограммная обработка) могут рассматриваться как хорошо проработанные и детально изученные, алгоритмы среднего уровня (сегментация) продолжают сегодня оставаться центральным полем приложения инженерных и исследовательских усилий. За последние годы значительный прогресс был достигнут по отношению к проблемам сопоставления точек и фрагментов изображений (matching) выделения признаков внутри малых фрагментов, высокой точности 3D-позиционирования точек, что подразумевает соответствующее моделирование и калибровку датчиков и их комбинаций, выделение простых яркостно-геометрических структур типа "точка", "край", "пятно", "прямая линия", "угол".

Методы обработки высокого уровня, относящиеся собственно к "пониманию изображений", по-прежнему представляют собой "вызов" для сообщества исследователей в области компьютерного зрения и искусственного интеллекта. Безусловно, перспектива создания будущих поколений "интеллектуальных машин" в основном зависит от дальнейшей разработки именно этого круга алгоритмов.

В настоящее время известно несколько основных алгоритмических подходов и математических формализмов, используемых при разработке практических систем анализа изображений. Это гистограммные преобразования, анализ проекций, линейная и нелинейная фильтрация изображений, яркостная и текстурная сегментация, корреляционное обнаружение и согласованная фильтрация, морфологический подход Пытьева, математическая морфология Серра, метод "нормализации фона", преобразование Хафа, структурно-лингвистический подход и ряд других. Большинство этих методов будут рассмотрены в данной книге.

Значительный вклад в разработку методов и алгоритмов обработки изображений и машинного зрения внесли работы Л. П. Ярославского, П. А. Бакута, В. К. Злобина, В. К. Баклицкого, В. Г. Лабунца, В. Л. Левшина, Ю. П. Пытьева, Ж. Серра, Р. Хара\-лика, Е. Дэвиса, У. Гренандера, К. Ту и многие другие. За последние десятилетия создано множество успешных систем машинного зрения, в которых в тех или иных сочетаниях реализованы упомянутые подходы и парадигмы. Однако единого математического формализма и единой общепризнанной методики разработки алгоритмов анализа изображений по-прежнему не существует, и, следовательно, наука об обработке изображений все еще находится в развитии, переживая период роста, чреватый возможностью появления в любой момент новых самых неожиданных и революционных методик и теорий.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Обработка и анализ изображений в задачах машинного зрения
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты