Обнаружение объекта по его изображению и оценка его координат

Материал из Техническое зрение
Перейти к: навигация, поиск

На практике большой интерес представляют задачи совмещения и выделения фрагментов заданной формы на предъявленном изображении. Пример такой задачи приведен во введении. Как известно, если отличие яркостей сравниваемых по форме фрагментов не сводится к однородному изменению их яркости и контраста, то в таких задачах широко распространенные корреляционные методы работают недостаточно эффективно.

Пусть дано изображение $f$, причем на подмножестве $H$ поля зрения $X$ имеется фрагмент $f\cdot \chi _H $, форма которого рассматривается как эталон формы. Напомним, что функция $\chi _H $ равна нулю вне множества $H$ и равна единице на множестве $H$; таким образом, яркость изображения $f\cdot \chi _H $ равна яркости изображения $f$ на множестве $H$ и равна нулю вне $H$. Рассмотрим группу $G$ преобразований плоскости $R^2$ и $G_H $ --- множество преобразований из $G,$ таких, что $\gamma H$ полностью содержится в области $X$, если $\gamma \in G_H $. Следует найти такое преобразование $\gamma \in G_H $, чтобы фрагмент изображения $\xi $ на подмножестве $\gamma H$ был близок по форме к фрагменту изображения $f$ на подмножестве $H.$ Опишем эту задачу как рассмотренную выше задачу сравнения формы двух изображений, заданных на поле зрения $X$.

Определим меру близости указанных фрагментов по форме. Назовем формой фрагмента $f$ изображения на подмножестве $H$ множество $V_{f_H } $ изображений, форма которых не сложнее, чем форма любого изображения вида

$$ {\widetilde{f}}(\cdot )=f\chi _H (\cdot )+\phi (\cdot )(1-\chi _H (\cdot )), $$

где $\phi (\cdot )$ - произвольное изображение. Иными словами, форма изображения на $H$ определяется как множество изображений, яркость которых на $H$ может быть получена преобразованиями изображения $f_H (\cdot)$ вида $F(f_H) (\cdot)$, где $F$ пробегает по всему множеству ${\rm {\bf F}}$, а на дополнении к $H$ (на фоне) яркость изображения произвольна. Проектор на это множество обозначим $P_{f,H} $.

Фрагмент заданной формы на предъявленном для анализа изображении $\xi $ будет обнаружен, если $P_{f,H} \xi =\xi $, где $P_{f,H} $ - проектор на множество $V_{f_H } .$ Для определения близости фрагментов по форме обозначим $P_{0,H} $ проектор на множество изображений, форма которых не сложнее, чем форма любого из изображений вида $\widetilde {f}=f(\cdot )\chi _H (\cdot )+\phi (\cdot )(1-\chi _H (\cdot ))$, где $\phi \left( \cdot \right)\in L_2 \left( X \right)$ - произвольное изображение. Иными словами, $P_{0,H} $ - проектор на множество изображений, яркость которых равна константе на подмножестве $H$ и произвольна вне его. Тогда близость фрагмента предъявленного изображения $\xi $ к форме фрагмента изображения $f$ на подмножестве $H$ определим значением дроби

$$t_H (\xi )=\frac{\left\| {\xi -P_{f,H} \xi } \right\|^2}{\left\| {P_{0,H} \xi -P_{f,H} \xi } \right\|^2}.$$

Если на изображении $\xi $ фрагмент заданной формы расположен на подмножестве $\gamma H$, то сравнивать по форме на подмножестве $H$ следует фрагменты изображений $f_\gamma (\cdot )$ и $\xi (\cdot )$, где

$$ f_\gamma (\textbf{x})= \begin{cases} f(\gamma ^{-1}\textbf{x}), & \mbox{если }\gamma ^{-1} \textbf{x} \in X, \cr 0, & \mbox{если } \gamma ^{-1}\textbf{x}\notin X. \cr \end{cases} $$

Близость фрагмента изображения $\xi $ на множестве $\gamma H$ к форме фрагмента изображения $f$ на множестве $H$ определим значением дроби

$$ t_{H,\gamma } (\xi )=\frac{\left\| {\xi -P_{f_\gamma ,H} \xi } \right\|^2}{\left\| {P_{0,H} \xi -P_{f_\gamma ,H} \xi } \right\|^2}. $$

Пусть $G$ - группа сдвигов плоскости $R^2$ такая, что при задании декартовых прямоугольных координат любой вектор $(a,b)\in {R}^2$ преобразование $\gamma \in G$ превращает в вектор $\gamma _{\langle x,y \rangle} (\langle a,b \rangle )= \langle a+x,b+y \rangle \in {R}^2$. На рис. 4 приведены значения ${1 /} {t_{H,\gamma } (\xi )}$, обратные близости фрагментов по форме, в зависимости от координат вектора сдвига. Максимальное значение величины ${1 /} {t_{H,\gamma } (\xi )}$ определяет координаты вектора сдвига плоскости, совмещающие близкие по форме фрагменты изображений $\xi $ и $f$.


Полезные ссылки

  1. ☝ К началу
  2. ☜ Морфологические методы анализа сцен
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты