Морфологическая корреляция

Материал из Техническое зрение
Перейти к: навигация, поиск

Дальнейшим развитием идей корреляционного обнаружения с использованием эталонов является морфологический проекционный подход, предложенный Ю.П.Пытьевым. Суть этого подхода заключается в следующем.

Пусть изображения являются элементами гильбертова пространства $f\in L_2^X $, где $X$ - поле зрения. Тогда можно говорить о норме изображения $\vert \vert f \vert \vert $ и расстоянии между изображениями, равном $\vert \vert f_1 - f_2 \vert \vert $, где норма понимается как $$ \left\| f \right\|^2=\int\!\!\!\int\limits_X {f^2(x,y)dxdy} . $$ Далее, пусть задано некоторое выпуклое и замкнутое подмножество изображений $Z\in L_2^X $. Тогда любому изображению $g\in L_2^X $ может быть поставлено в соответствие изображение $f_{\min } \in Z $ такое, что $$ \vert \vert g-f_{\min } \vert \vert = \min \{ \vert \vert g-f\vert \vert , f\in Z \}. $$ Оказывается, такое отображение $v(g):g\to Z$ всегда будет $\textit{проектором, }$в том (алгебраическом) смысле, что $v(v(g))=v(g)$. Введем обозначение $f_{\min } = \Pr _Z (g)$, т.е. "$f_{\min } $ есть проекция $g$ на $Z$".

Используя введенное понятие проекции, можно определить численную меру близости изображения $g$ к множеству изображений $Z$, а именно, функцию $K(g,Z)$ ($\textit{морфологический коэффициент корреляции}$), аналогичную обычной корреляционной мере близости двух изображений: $$ K(g,Z)=\frac{\left\Vert {\Pr _Z (g)} \right\Vert} {\left\Vert g \right\Vert} . $$ Морфологический коэффициент корреляции обладает следующими свойствами:


  1. $0 \le K(g,Z) \le 1, \quad g\in L_2^X , \quad Z\in L_2^X ;$
  2. $(K(g,Z)=1) \Leftrightarrow (g\in Z) .$


Преимущества морфологического коэффициента корреляции связаны с возможностью более полного учета условий регистрации изображений. Пусть процесс регистрации изображения описывается при помощи некоторого преобразования $\tau\in T$ эталонного изображения $f(x,y)\in L_2^X $, где $T$ - некоторая группа преобразований. Определим результат регистрации (форму) изображения $f$ как $Z=\{f' =\tau(f), \tau\in T\}$. Тогда, используя морфологический коэффициент корреляции $K_T (g,f)=K(g,Z)$, можно сравнивать изображение с эталоном инвариантно к любым преобразованиям группы $T$.

Рассмотрим, например, общую модель яркостных преобразований изображения. Пусть эталонное изображение $f$ является двумерной функцией интенсивности вида $$ f(x,y)=\sum_i {a_i } \chi _i (x,y), \quad X =\mathop \cup \limits_i A_i , $$ где $A_i $ - непересекающиеся области, на которые разбито поле зрения $X$, $\chi _i $ - индикаторная функция $i$-й области разбиения кадра, т.е. $$\chi _i \left( {x,y} \right)= \begin{cases} {0,} & \langle {x,y} \rangle {\in \hspace{-8pt}/ }A_i ,\\ {1,} & \langle {x,y} \rangle \in A_i , \end{cases} $$ $a_i$ - уровень яркости $i$-й области.

Множество изображений "той же формы" имеет вид: $$ Z=\{f'(x,y)=\sum\limits_i {b_i } \chi _i (x,y)\}. $$ Тогда проекционное преобразование можно считать параметрическим вида $$ b_i =b(a_i ), $$ где $i=0,\ldots, C-1$, а $C$ - количество уровней яркости на изображении.

Для любого изображения $g(x,y)$ проекция $\Pr _f (g)$ определяется в этом случае набором параметров $\textbf{b}$ вида $$ b_i =\frac {\int\int\limits_X {g(x,y)\chi _i (x,y)dxdy}} {\int\int\limits_X {\chi _i (x,y)dxdy}} , \quad i=0,\ldots,C-1. $$

Вычисление этих параметров не сопряжено с трудностями и сколько-нибудь значительными вычислительными затратами. После вычисления проекции изображения $g$ на форму эталона $f$ коэффициент морфологической корреляции $K(g,f)$ вычисляется непосредственно.

По аналогии с обычным корреляционным обнаружением, морфологическое обнаружение изображения $f$ по принципу максимума корреляционного коэффициента осуществляется по правилу $$ j=\arg \mathop {\max }\limits_i K_T ( {g,f_i } ). $$ После этого на основании полученного значения максимальной корреляции может проверяться достоверность классификации.

Если $K_T (g,f_i )\ge K_{\min}$, то обнаружение признается достоверным. В противном случае объект считается нераспознанным.

Обладая робастностью по отношению к радиометрическим преобразованиям и зашумлениям, морфологические алгоритмы обнаружения не обеспечивают в то же время необходимой робастности при геометрических искажениях. Это связано с их унаследованным от корреляционных алгоритмов свойством сильного уменьшения корреляционной связи, если площадные структуры эталона и текущего изображения начинают заметно различаться.

Морфологический подход к обнаружению порождает новую трудность - необходимость параллельного анализа так называемой информативности изображения. Иными словами, для адекватного использования морфологического коррелятора нужно следить, чтобы яркостно-геометрические свойства изображений были достаточно "богатыми". По этим же причинам уровень аномальных ошибок морфологического коррелятора может превосходить соответствующие показатели обычных корреляционных алгоритмов.

Обсудим теперь соотношения между классической корреляционной мерой сходства и ее морфологическим аналогом.

Введенное выше понятие "формы" (по Пытьеву) значительно обогащает радиометрические свойства "эталонного" изображения, давая возможность строить более робастные алгоритмы обнаружения. При этом может быть достигнута инвариантность процесса обнаружения к условиям регистрации, то есть к изменениям характеристик сенсорных устройств или условиям освещения. Корреляционная схема обнаружения предполагает вычисление взаимной корреляционной функции между полученным изображением объекта и его "эталонным" изображением, в то время как морфологический коэффициент корреляции есть мера сходства полученного изображения объекта с его наилучшим изображением (проекцией) на множестве эталонных изображений.

Рассмотрим множество функций-изображений, интегрируемых на поле зрения $X$ со скалярным произведением $$ (f,\vartheta )=\int\!\!\!\int\limits_X {f(x,y)\vartheta (x,y)dxdy} $$ и нормой $$ \left\| {f\left. \right\|} \right.=(f,f)^{1/2} $$ Следуя фасеточной модели Харалика [181], [272], удобно снова рассмотреть разбиение поля зрения $X$ на непересекающиеся области $A_i $ такие, что $$ \mathop\cup\limits_i A_i =X; A_i \cap A_j =\emptyset : i\ne j, i=1,\ldots,m. $$ где $m$ - количество областей, и представить произвольную функцию яркости изображения в виде $$ f(x,y)=\sum\limits_{i=1}^m c_i (x,y)\chi _i (x,y), $$ где $\chi _i (x,y)$ есть индикаторная функция множества $A_i$.

Без значительного ограничения общности эталонное изображение $f$ можно представить как такое разбиение $X$ на $A_i $, что $c_i =const$ в пределах области $A_i $, $$ \begin{gather}\tag{1} f(x,y)=\sum\limits_{i=1}^m {c_i } \chi _i (x,y), \end{gather} $$ и тогда его форма $V(f)$ получается как множество таких $f$, для которых $c_i$ - произвольные числа: $$ V(f)=\left\{ {f:f=\sum\limits_{i=1}^m {c_i \chi _i (x,y);c_i \in (-\infty ,\infty )} } \right\}. $$ В этом случае проекция произвольного изображения $\vartheta $ на $V(f)$ есть просто отрезок ряда Фурье по базисным функциям $\chi _i (x,y)$ $$ \begin{gather}\tag{2} P_f \vartheta =\sum\limits_{i=1}^m {\frac{(\vartheta ,\chi _i )}{\mu _i }} \chi _i (x,y), \end{gather} $$ где $\mu _i =\left\| {\chi _i } \right.\left. \right\|^2=(\chi _i ,\chi _i )$ есть мера (площадь) области $A_i $.

4-2-20.jpg

Разница между нормированной взаимно корреляционной функцией и коэффициентом морфологической корреляции

Теперь можно проанализировать соотношение между обычной нормированной взаимно корреляционной функцией $K_u $ $$ K_u =\frac{(f,\vartheta )}{\left\| f \right\|\left\| \vartheta \right\|} $$ и коэффициентом морфологической корреляции $K_m $ $$ K_m =\frac{\left\| {P_f \vartheta } \right\|}{\left\| \vartheta \right\| .} $$ Геометрическую разницу между этими двумя величинами иллюстрирует рис. 20 обозначено $\alpha =\arccos K_u $, $\beta =\arccos K_m $.


Отметим очевидные свойства коэффициента морфологической корреляции.

  1. $0\le K_m \le 1,$ что следует из свойств проектора.
  2. Коэффициент морфологической корреляции не зависит от преобразования яркости $F(f(x,y))$,

так как преобразование яркости влияет только на яркости отдельных областей разбиения эталона, но не на саму геометрию разбиения и, следовательно, $F(f(x,y))$ не "выходит" из формы $V(f)$.

  1. $K_m \ge \left| {K_u } \right|.$

Докажем последнее утверждение. Рассмотрим "эталонное" изображение $f$ в форме (31) и сравним $K_u^2 $ и $K_m^2 $. Необходимо доказать, что $$ \begin{gather}\tag{3} \left\| {P_f \left( \vartheta \right)} \right\|^2-\frac{(\vartheta ,f)^2}{\left\| f \right\|^2}\ge 0. \end{gather} $$ Принимая во внимание (31) и (32), перепишем (33) в виде $$ \sum\limits_{i=1}^m {c_i^2 } \mu _i \left| {\sum\limits_{i=1}^m {\frac{(\vartheta _i ,x)^2}{\mu _i }} } \right|-\left| {\sum\limits_{i=1}^m {c_i (\vartheta ,x_i )} } \right|^2\ge 0. $$ Это неравенство может быть получено из известного неравенства Коши - Буняковского $$ \sum\limits_{i=1}^m {c_i^2 } \mu _i \left| {\sum\limits_{i=1}^m {\frac{(\vartheta _i ,x)^2}{\mu _i }} } \right|-\left| {\sum\limits_{i=1}^m {c_i (\vartheta ,x_i )} } \right|^2\ge 0, $$ если положить $$ \left( {\sum\limits_{i=1}^m {a_i b_i } } \right)^2\le \left( {\sum\limits_{i=1}^m {a_i^2 } } \right)\cdot \left( {\sum\limits_{i=1}^m {b_i^2 } } \right), $$ Таким образом, при принятых выше допущениях коэффициент морфологической корреляции, как правило, превышает норму взаимной корреляционной функции текущего и эталонного изображений.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Сравнение и привязка изображений. Стереоотождествление
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты