Оценка информативности изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

При конструировании алгоритмов сравнения изображений часто возникает задача выбора участков эталонного изображения с точки зрения их информативности. Критерием при этом, естественно, являются показатели точности и вероятности правильной привязки. Наиболее полным показателем информативности может служить коэффициент корреляции между эталонным (ЭИ) и текущим (ТИ) изображениями.

На рис. 15 показано изображение, на котором в виде уровня яркости показан нормированный коэффициент корреляции, полученный при стереоотождествлении

4-2-15.jpg

Коэффициент корреляции как апостериорная оценка информативности: $\textit{а}$ - тестовое изображение (г.Каир), $\textit{б}$ - карта коэффициента корреляции

стереопары города Каир (значения коэффициента от 0 до 1 преобразованы в диапазон яркости от $0$ до $255$). При этом роль ТИ и ЭИ играют левое и правое изображения стереопары. Видно, что коэффициент корреляции полностью отражает информативность изображения. Участки с небольшой вариацией поля (пустыня, река) имеют низкий коэффициент корреляции. И наоборот, наиболее информативные участки (городская часть, дороги, берега реки) имеют высокий коэффициент корреляции. Недостаток этого показателя в том, что он вычисляется как правило в процессе сравнения ТИ и ЭИ, в то время как показатель информативности должен вычисляться априорно, указывая на те участки эталонного изображения, которые будут иметь наиболее надежную метрику сходства.

Эталонный участок может быть выбран в любом месте области перекрытия изображений. Неудачный выбор эталона может существенно ухудшить результат меры сходства. Это бывает, если поместить эталон в области, загороженной на другом изображении, в области с линиями разрыва, в области с периодической текстурой или в области с низким уровнем сигнала (с низкой информативностью). Последний случай встречается наиболее часто.


Задача выбора информативных участков для надежного и точного сопоставления изображений не получила к настоящему времени окончательного решения, хотя и достаточно исследована. Основная проблема здесь кроется в выборе оптимального сочетания противоречивых требований гибкого и адаптивного анализа информативности и быстрых алгоритмов вычисления оценок.

Рассмотрим известные показатели информативности фрагмента изображения.


Дисперсия сигнала.

Точность привязки к эталонному изображению тем выше, чем более неоднородным являются соответствующие фрагменты изображения. Одним из вычислительно простых и эффективных показателей неоднородности фрагмента является дисперсия яркости внутри фрагмента, которая определяется выражением \begin{multline*} \sigma ^2\left( {x_0 ,y_0 ,N} \right)=\frac{1}{\left( {2N+1}\right)^2}\sum\limits_{x=-N}^N {\sum\limits_{y=-N}^N {\left( {f\left( {x+x_0 , y+y_0 } \right)} \right)^2-} } \\ -\left( {\frac{1}{\left( {2N+1} \right)^2}\sum\limits_{x=-N}^N {\sum\limits_{y=-N}^N {f\left( {x+x_0 , y+y_0 } \right)} } } \right)^2, \end{multline*} где $\langle x_0 ,y_0 \rangle $ - точка изображения, для которой определяется информативность, $N$ - выбранный размер окрестности точки $\langle x_0 ,y_0 \rangle$.

Очевидно, чем выше дисперсия, тем более неоднородным является фрагмент. Таким образом, наиболее простая функция информативности фрагмента имеет вид $$ \textrm{Inf}(x_0 ,y_0 ,N)=\sigma (x_0 ,y_0 ,N), $$


==Отношение сигнал/шум==. Другим важным показателем информативности является отношение сигнал шум (signal-to-noise ratio, SNR), которое определяется следующим образом: $$ {\rm SNR}(x_0 , y_0 , N)=\frac{\sigma _s (x_0 ,y_0 , N)}{\sigma _n (x_0 ,y_0 ,N)}. $$ где $\sigma _s $ - CKO сигнала, $\sigma _n $ - CKO шума на фрагменте.


Смысл рассмотрения SNR в качестве показателя информативности фрагмента состоит в следующем. Если фрагмент однородный, то есть вариации сигнала в нем малы, то значение SNR тоже мало. Если на фрагменте присутствуют сильные колебания яркости, то дисперсия сигнала, как видно из предыдущего пункта, большая, следовательно, и значение SNR большое.

Для вычисления отношения сигнал/шум необходимо функцию яркости фрагмента разделить на сигнальную часть и шумовую часть и вычислить их статистические характеристики. Наиболее простой и эффективный метод вычисления СКО шума описан в и заключается в следующем.

Предположим, что отсчеты изображения и шума статистически независимы.

Обозначим $f{ij}$ - отсчеты исходного изображения, то есть без влияния шумов, $n_{ij}$ - отсчеты шума. Тогда, в предположении, что шум аддитивный, $g_{ij} =f_{ij} +n_{ij}$ - отсчеты наблюдаемого изображения.

Для статистических моментов справедливы следующие соотношения. По-прежнему предполагается, что центр фрагмента расположен в точке $\langle x_0 ,y_0 \rangle$, а размер фрагмента равен $N$.

Средние значения: $$ m_g =m_f +m_n, $$ Дисперсия: $$ \sigma _g ^2=\sigma _f ^2+\sigma _n ^2. $$ Автокорреляционная функция: $$ C_g (x,y)=C_f (x,y)+C_n (x,y). $$ Если предположить, что шум белый, то $$ C_n (x,y)=\sigma _n ^2\delta (x,y), $$ где $\delta (x,y)$ - дискретный аналог $\delta$-функции $$ \delta (x,y)= \begin{cases} {0,} & {|x|+|y| \ne 0}, \cr {1,} & {x=y=0}. \end{cases} $$

Таким образом, автокорреляционная функция наблюдаемого изображения $$ C_g (x,y)=C_f (x,y)+\sigma _n ^2\delta (x,y) $$ отличается от автокорреляционной функции исходного изображения только в начале координат ($x=y=0)$, откуда $$ \sigma _n ^2=C_g (0,0)-C_f (0,0). $$ Во всех остальных точках автокорреляционная функция наблюдаемого изображения $f$ служит оценкой автокорреляционной функции исходного изображения $g$: $$ C_g (x,y)=C_f (x,y), \quad \left| x \right|+\left| y \right|\ne 0. $$

Используем эту оценку автокорреляционной функции исходного изображения при $\left| x \right|+\left| y \right|\ne 0$ для интерполяции ее значения в точке $x=y=0$. Тогда оценка отношения сигнал/шум определяется как $$ \begin{gather}\tag{1} {\rm SNR}=\sqrt {\frac{C_f (0,0)}{\sigma _n^2 }} =\sqrt {\frac{C_f (0,0)}{C_g (0,0)-C_f (0,0)}} . \end{gather} $$

Точность оценки SNR зависит от точности интерполяции значения $C_f (0,0)$ и выборочной ошибки вычисления $C_g (x,y)$, зависящей от объема выборки. $C_g (x,y)$ вычисляется следующим образом: \begin{multline*} C_g (x_0 ,y_0 ,N,x,y)=\frac{1}{(2N+1)^2}\sum\limits_{i=-N}^N {\sum\limits_{j=-N}^N {g(i+x_0 ,j+y_0 )g(i+x_0 +x,j+y_0 +y)-} } \\ -m(x_0 ,y_0 )m(x_0 +x,y_0 +y), \end{multline*} где $$m(x_0 ,y_0 )=\frac{1}{(2N+1)^2}\sum\limits_{i=-N}^N {\sum\limits_{j=-N}^N {g(i+x_0 ,j+y_0 )} }, $$ $$ m(x_0 +x,y_0 +y)=\frac{1}{(2N+1)^2}\sum\limits_{i=-N}^N {\sum\limits_{j=-N}^N {g(i+x_0 +x,j+y_0 +y)} } . $$

Поскольку для реальных изображений предположение о некоррелированности шума не выполняется, то оценка SNR (12) получается завышенной. В результате целесообразно значение $C_f (0,0)$ получать не интерполяцией, а усреднением значений $C_g (0,0)$ по области $$ M_d =\{(x,y)| -d\le x\le d, -d\le x\le d, |x| + |y| \ne 0\}. $$ Этот способ позволяет получать немного заниженную, но более правдоподобную оценку отношения сигнал/шум.

Данный показатель является мерой неоднородности: на более однородных фрагментах шум превалирует, поэтому отношение сигнал/шум меньше. Таким образом, функция информативности фрагмента здесь имеет вид $$ \textrm{Inf}(x_0 ,y_0 ,N)={\rm SNR}(x_0 ,y_0 ,N) $$


==Радиус корреляции сигнала==. Радиус корреляции сигнала показывает, на каком расстоянии отсчеты сигнала можно считать статистически независимыми. Чем более однородной является область изображения, тем больше для нее радиус корреляции. Радиус корреляции в точке изображения может быть вычислен с помощью автокорреляционной функции, например, по формуле $$ R_d (x_0 ,y_0 ,N)=\frac{\sum\limits_{k=-d}^d {C_v } (k,0)}{C_v (0,0)}, $$ где $d$ - размер апертуры для вычисления радиуса корреляции, $C_v (k,l)$ - автокорреляционная функция фрагмента изображения, которая вычисляется на области $\{ (k,l) | -\mbox{}d\le k\le d, l=0 \} $; параметры $x_0 ,y_0,N$ используются для вычисления автокорреляционной функции.

Радиус корреляции определяет ширину автокорреляционной функции вблизи ее максимума. Поэтому наличие шума на изображении искажает значение радиуса корреляции. Автокорреляционная функция белого шума имеет вид $\delta$-функции, поэтому при большом уровне шума радиус корреляции уменьшается и на однородных областях изображения становится равным радиусу корреляции шума (радиус корреляции белого шума $=0$). Для устранения этого эффекта определение радиуса корреляции целесообразно изменить следующим образом $$ R_d (x_0 ,y_0 ,N)=\frac{\sum\limits_{k=-d,k\ne 0}^d {C_v (k,0)+C(0,0)} }{C(0,0)}, $$ где $C$ - интегрированное (осредненное) значение $C_v$ вблизи точки $(0,0)$.

Таким образом, функция $$ \textrm{Inf}(x_0 ,y_0 ,N)=R_d (x_0 ,y_0 ,N) $$ также является мерой информативности участков изображений.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Сравнение и привязка изображений. Стереоотождествление
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты