Форма изображения как инвариант преобразований изображений, отвечающих вариациям условий регистрации

Материал из Техническое зрение
Перейти к: навигация, поиск

Поясним основную идею методов морфологического анализа изображений на следующем примере. Рассмотрим изображения кубика, сформированные при различных условиях наблюдения, рис. 5}. Они несут достаточно подробную информацию о геометрической форме объекта сцены (о кубике), так как области изображения, все точки которых имеют примерно одинаковые яркости, отображают грани кубика, обладающие одинаковыми геометрическими и оптическими свойствами. Изменение условий освещения приводит к изменениям яркости точек поля зрения, однако области, соответствующие граням кубика и фону, останутся неизменными.

6-2-5.jpg

Изображения кубика при различных условиях регистрации (освещения)

6-2-6.jpg

Математическая модель изображения кубика (слева) и разбиение поля зрения, определяющее его форму (справа)

В этой ситуации математическую модель изображения кубика можно определить как кусочно-постоянную функцию $f(\cdot )$, заданную на поле зрения в виде прямоугольной области $X$ на плоскости $R^2$, значение $f(\textbf{x})$ функции в точке $\textbf{x}$ поля зрения $X$ интерпретируется как яркость изображения в точке $\textbf{x}\in X$, а области постоянной яркости $A_1 ,\ldots, A_4 \subset X$ соответствуют фрагментам, изображающим три видимые грани кубика и фон (рис. 6). Вариация условий освещения приводит к изменению яркости исходного изображения точек, но не к произвольному, а такому, при котором области поля зрения постоянной яркости сохраняются либо объединяются, но не могут распадаться на более мелкие.

Таким образом, математическую модель множества изображений данной сцены, полученных при всевозможных условиях (однородного) освещения, можно определить как множество функций

$$ V_f =\big\{ {g(\textbf{x})=\sum\limits_{j=1}^4 {c_j \chi _j (\textbf{x})} ,\;\textbf{x}\in X;\;c_j \in \left( {-\infty ,\infty } \right),\;j=1,\ldots ,4} \big\}. $$

Здесь $\chi _j (\cdot )$ --- индикаторная функция множества $A_j $, т.\:е. функция, равная единице, когда ее аргумент принадлежит области $A_j $, и нулю в противном случае. Изменение условий регистрации приводит к изменению яркостей $c_1 ,\ldots ,c_4 $. Разбиение поля зрения $X$ на области $A_1 ,\ldots ,A_4 $ одинаковой яркости является максимальным инвариантом этого класса преобразований яркости. Это разбиение определяет все то, что относится к данной сцене и не зависит от условий формирования изображений. Его можно назвать формой изображения сцены. Изменения в геометрической форме объектов сцены (в данном случае кубика и фона), в их размерах, в расположении на поле зрения, в ракурсе, или появление новых объектов сцены приведут к тому, что области равной яркости на изображении этой измененной сцены изменят свои конфигурации по сравнению с областями $A_1 ,\ldots ,A_4 $ --- форма изображения изменится.

Для того чтобы узнать сцену на предъявленном изображении $\xi (\cdot )$, следует ответить на вопрос, принадлежит ли изображение $\xi (\cdot )$ множеству $V_f $. С формальной точки зрения для этого следует вычислить расстояние от $\xi (\cdot )$ до $V_f $, т.\:е. решить задачу наилучшего приближения изображения $\xi (\cdot )$ изображениями из $V_f $:

$$ \rho (V_f ,\xi )=\inf \big\{ {\big\| {\xi -\sum\limits_{j=1}^4 {c_j \chi _j } } \big\|,\;\;c_j \in \left( {-\infty ,\infty } \right),\;j=1,\ldots ,4} \big\}; $$

для того чтобы $\xi \in V_f $, необходимо и достаточно, чтобы $\rho (V_f ,\xi )=0$. Если изображения рассматривать как элементы евклидова пространства, то речь идет о расстоянии в пространстве $R$ всех изображений от точки (вектора) $\xi $ до четырехмерного линейного подпространства $V_f \subset R$, являющегося линейной оболочкой векторов $\chi _1 ,\ldots ,\chi _4 .$ Как известно, это расстояние измеряется расстоянием между $\xi $ и его ортогональной проекцией на $V_f $. Ортогональную проекцию $\xi $ на $V_f $ обозначим $P_f \xi $. Изображение $\xi (\cdot )$ будет изображением кубика (т.\:е. выполнено включение $\xi \in V_f )$ тогда и только тогда, когда $P_f \xi =\xi $. Ортогональная проекция $P_f \xi $ изображения $\xi $ на $V_f $ легко вычисляется и равна $P_f g=\sum\limits_{i=1}^4 {\frac{\left( {g,\chi _i } \right)}{\left\| {\chi _i } \right\|^2}} \chi _i $.

Итак, разбиение $A_1 ,\ldots ,A_4 $ поля зрения $X$ на непересекающиеся области $A_1 ,\ldots ,A_4 $ взаимно однозначно связано с множеством всех изображений кубика $V_f $ и с оператором ортогонального проецирования на $V_f $. В морфологических методах анализа изображений формой называют множество $V_f $ или оператор проецирования на $V_f $.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Морфологические методы анализа сцен
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты