Изображение как структура

Материал из Техническое зрение
Перейти к: навигация, поиск

Структурные модели изображений позволяют перенести в область анализа изображений все известные методы и результаты из области $\textit{анализа структур}$, которая, впрочем, сама создавалась под значительным влиянием задач из области геометрии и анализа изображений. В самом деле, вспомним типовое определение простой геометрической фигуры: "множество $\textit{точек}$, удовлетворяющих следующему условию (набору условий)${\ldots}$". В то же время из простых фигур (например, из отрезков) формируются составные фигуры (треугольники, прямоугольники, трапеции,${\ldots}$). Определение такой составной фигуры имеет аналогичный вид: "множество $\textit{отрезков}$, удовлетворяющих следующему набору условий, накладываемых на $\textit{связи (отношения) }$между ними${\ldots}$", причем в качестве характеристик отношений между отрезками используются элементы геометрической логики - параллельность, коллинеарность, соседство, перпендикулярность и т.д. Заменяя конкретные слова "точки" и "отрезки" на обобщающий термин "элементы заданного типа", получим общее определение $\textit{структурной модели}$: "множество $\textit{элементов заданных типов}$, удовлетворяющих $\textit{набору условий}$, описывающих $\textit{связи (отношения элементов) заданных типов}$".

Формализуем понятие структурной модели. Упорядоченный набор образов $\textbf{A}=\langle A_{1}, A_{2},{\ldots},A_{n}\rangle \subseteq \Omega ^{n}$ назовем $\textit{полным структурным описанием}$ образа $A$, если образ $A\in \Omega $ может быть полностью однозначно реконструирован путем объединения элементов из $\textbf{A}$:

$$ A=\delta (\textbf{A})=A_{1}\oplus A_{2}\oplus {\ldots}\oplus A_{n}, $$

где $\delta $ - операция $\textit{структурной реконструкции}$ образа по структурному описанию; $\oplus $ - операция $\textit{объединения}$ образов из $\Omega $, на которую в общем случае не накладывается никаких дополнительных условий, кроме того, что $\Omega $ замкнуто относительно $\oplus $. Необходимо отметить, что типичный для изображения эффект $\textit{загораживания}$ одних объектов другими, в отличие от многих других областей приложения структурного анализа, делает принципиальным порядок объединения (наложения в поле зрения) элементов видимой сцены. Поэтому операция $\oplus $ в общем случае не может быть ни симметричной, ни ассоциативной, хотя иногда такое ограничение все же накладывается.

Рассмотрим теперь, как на базе структурных описаний строятся модели объектов. Пусть прообраз $L$ состоит из $n$ составляющих

$$ L=\delta (\textbf{L})=L_{1}\oplus L_{2}\oplus {\ldots}\oplus L_{n}, $$

причем известны типы элементов, задаваемые характеристическими $\textit{предикатами типа элементов}$ $M_{i}(L_{i})\in \{0,1\}$, $i=1,{\ldots},n$. Пусть, кроме того, заданы $m$ условий или $\textit{предикатов связи}$ $M^{k}(\textbf{L})\in \{0,1\}$, $k=1,{\ldots},m$. Тогда $\textit{модель прообраза}$ принимает вид:

$$ M(\textbf{L})=M_{1}(L_{1})\cdot {\ldots}\cdot M_{n}(L_{n})\cdot M^{1}(\textbf{L})\cdot {\ldots}\cdot M^{m}(\textbf{L}). $$

С учетом этих обозначений задача $\textit{структурной морфологической сегментации}$ может быть вновь записана в стандартном виде:

$$ \phi _{\textrm{Ф}}(A)=\delta (\textbf{L}),\: \epsilon _{\textrm{Ф}}(A)=\textbf{L}: \textrm{Ф}(A,\textbf{L})=K(A,\delta (\textbf{L}))\cdot M(\textbf{L})\to \max (\textbf{L}\in \Lambda =\Omega ^{n}). $$

Если при этом считать $n$ и $m$ переменными параметрами, также подлежащими оптимизации, а предикаты рассматривать как вероятностные или нечеткие, принимающие значения на $[0,1]$, то описанная задача структурной морфологической сегментации будет соответствовать наиболее общему случаю структурного анализа изображений.

К сожалению, для общего случая задачи морфологической структурной сегментации неизвестны вычислительно эффективные алгоритмы отыскания решения. В связи с этим в литературе по структурному анализу изображений предложено множество различных частных типов структурных моделей, для которых за счет дополнительных ограничений оказывается возможным построение эффективных или, по крайней мере, конструктивных (эффективных по сравнению с полным перебором) методов решения.

Рассмотрим наиболее популярные типы таких моделей:

  1. Алгебра изображений
  2. Разложения по системам ортогональных функций. Гармонический анализ.
  3. Морфологический анализ Пытьева
  4. Математическая морфология Серра
  5. Графовые представления структурных моделей. Задача индексации графа
  6. Порождающие грамматики. Структурно-лингвистический подход


Полезные ссылки

  1. ☝ К началу
  2. ☜ Морфологический взгляд на основные классы моделей, используемых в анализе изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты