Корреляционное сопоставление изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

Традиционная техника сравнения текущего изображения с эталоном основывается на рассмотрении изображений как двумерных функций яркости (дискретных двумерных матриц интенсивности). При этом измеряется либо расстояние между изображениями, либо мера их близости.

Как правило, для вычисления расстояний между изображениями используется соотношение

$$ \begin{gather}\tag{1} \rho \left( {f,g} \right)= \left[ \sum\limits_{\langle x,y \rangle \in X} \left| {f\left( {x,y} \right)-g\left( {x,y} \right)} \right|^\alpha \right]^{1/\alpha }, \end{gather} $$

где $f(x,y)$, $g(x,y)$ - функции интенсивности, $X$ - поле зрения.

Величина $\alpha \in [1,\infty )$ в (5) определяет характеристики используемой метрики.

Очевидно, что при $\alpha =2$ это выражение описывает обычное евклидово расстояние между изображениями, рассматриваемыми как векторы, принадлежащие пространству $L^2(x,y) $ на поле зрения $X$ функций интенсивностей с интегрируемым квадратом.

Пусть дано $n$ эталонных изображений $\{f_i \}$, $i = 1,\ldots,n$, каждое из которых соответствует $i$-му классу. Отнесение вновь предъявляемого фрагмента изображения $g$ к некоторому классу $j$ может осуществляться, например, по методу минимального расстояния до соответствующего эталона: $$ j=\arg \mathop {\min }\limits_i \rho ( {g,f_i } ). $$ Этот простейший метод имеет два основных недостатка:

Критерий обнаружения зависит от линейных размеров эталона и изображения.

Критерий обнаружения не инвариантен даже к простейшим фотографическим преобразованиям яркости вида $f' = af + b$.

Более приемлемым поэтому является использование корреляционной метрики, а именно, нормированного коэффициента корреляции, $$ K\left( {f,g} \right)=\frac{\sum\limits_{\langle x,y \rangle \in X} {\left( {f\left( {x,y} \right)-f^0} \right)\left( {g\left( {x,y} \right)-g^0} \right)} }{\sqrt {\sum\limits_{\langle x,y \rangle\in X} {\left( {f\left( {x,y} \right)-f^0} \right)^2} } \sqrt {\sum\limits_{\langle x,y \rangle\in X} {\left( {g\left( {x,y} \right)-g^0} \right)^2} } }, $$ где $f^0$, $g^0$ - средние значения интенсивности для изображений $f$ и $g$ соответственно.

Нормированный коэффициент корреляции обладает следующими хорошо известными свойствами:

1) $-1 \le K(f,g) \le 1, \forall f,g$;

2) $( K(f,g) = 1 ) \Longleftrightarrow (g = af + b, a>0, \forall b)$;

3) $( K(f,g) = -1) \Longleftrightarrow (g = af + b, a<0, \forall b)$.

Последнее свойство, как правило, называют "обратным контрастом".

Пусть, как и ранее, дано $n$ эталонных изображений $\{f_i \}$, $i = 1,\ldots,n$, каждое из которых соответствует $i$-му классу. Обнаружение фрагмента изображения $g$ по методу максимальной корреляционной связи осуществляется тогда по правилу

$$ j=\arg \mathop {\max }\limits_i {K( {g,f_i } )}. $$

После этого на основании полученного значения максимальной корреляции может проверяться достоверность детектирования. Если $K(g,f_i ) \ge K_{\min} $, то обнаружение признается достоверным. В противном случае объект считается нераспознанным. Теоретическим обоснованием применения корреляционного метода обнаружения является его строгая оптимальность для обнаружения детерминированного сигнала в белом шуме с гауссовым распределением яркостей.


Важные недостатки корреляционных методов обнаружения проявляются в присутствии радиометрических (яркостных) и особенно геометрических искажений текущего изображения по сравнению с эталонным. В частности, наблюдается быстрое уменьшение корреляционной связи при так называемых ракурсных искажениях, например, при поворотах изображений. Присутствие искажений типа "warping" обычно уже не позволяет использовать корреляционные методы обнаружения. В то же время, для этого класса алгоритмов предложено большое число процедур, позволяющих либо повысить их работоспособность, либо значительно ускорить процесс поиска. На этом пути были разработаны иерархические корреляционные алгоритмы, значительно сохранившие актуальность и на текущий момент. Конструктивная идея уменьшения времени поиска лежит в основе метода амплитудного ранжирования. Согласно этому методу надлежит анализировать скорость роста корреляции по мере обработки поля зрения и, если эта скорость недостаточна, прекращать обработку текущего фрагмента, переходя к следующему. Для того чтобы добиться инвариантности корреляционных алгоритмов хотя бы к аффинной группе преобразований, были испробованы различные преобразования изображений, например преобразование Меллина. К сожалению, в силу недостаточной устойчивости корреляционных алгоритмов к возможным искажениям, они не находят широкого применения при конструировании алгоритмов обнаружения сложно структурированных объектов.

Отдельное направление, использующее корреляционные методы обнаружения, это создание когерентных устройств обработки - оптических корреляторов. Исследования в этом направлении активно продолжаются, так как даже несмотря на значительные конструктивные трудности борьбы с изменчивостью эталонов, реализуемая здесь фантастическая скорость обработки (скорость света) привлекает к себе пристальное внимание. Проблематика построения оптических корреляционных устройств не является предметом рассмотрения данной главы. Тем не менее, укажем, что практика использования оптических корреляторов выявила неожиданно высокий уровень ошибок аномального обнаружения объектов.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Сравнение и привязка изображений. Стереоотождествление
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты