Морфологический анализ Пытьева

Материал из Техническое зрение
Версия от 01:58, 29 мая 2022; JIoku (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Пусть изображения являются элементами гильбертова пространства изображений $\Omega \sim L^{2}$. Тогда можно говорить о норме изображения $\vert \vert A\vert \vert $ и расстоянии между изображениями, равном $\vert \vert A-B\vert \vert $. Далее, пусть задано некоторое выпуклое и замкнутое подпространство изображений $M\in \Omega $. Тогда любому изображению $A\in \Omega $ может быть поставлено в соответствие изображение $L\in M$ такое, что

$$ \vert \vert L-A\vert \vert = \min \{\vert \vert B-A\vert \vert , B\in M\}. $$

Легко убедиться, что такое отображение $\phi (A): A\to M$ всегда будет $\textit{проектором, }$в том (алгебраическом) смысле, что $\phi (\phi (A))=\phi (A)$. Поэтому можно также обозначить $L=\textrm{Pr} (A,M)$, т.\:е. "$L$ есть проекция $A$ на $M$".

Используя введенное понятие проекции, можно определить численную меру близости изображения к множеству изображений $K(A,M)$ ($\textit{морфологический коэффициент корреляции}$) вида

$$ K(A,M)=\frac{\vert \vert \textrm{Pr} (A,M)\vert \vert} {\vert \vert A\vert \vert} , $$

обладающую следующими практически полезными свойствами:

1) $0\le K(A,M)\le 1$, $A\in \Omega $, $M\in \Omega $;

2) $K(A,M)=1 \Longleftrightarrow A\in M$.

3) $K(A,M)=0 \Longleftrightarrow \textrm{Pr} (A,M)=\emptyset $.

Преимущества морфологического коэффициента корреляции связаны с возможностью более полного учета условий регистрации изображений. Пусть процесс регистрации изображения описывается при помощи некоторой группы преобразований $T$ эталонного изображения $g(x,y)\in \Omega $. Определим $\textit{форму изображения}$ $g$ как

$$ M(g)=\{\tau (g): \tau \in T\}. $$

Тогда при помощи $K_{T}(f,g)=K(f,M)$ можно сравнивать изображение с эталоном инвариантно к любым преобразованиям типа $T$. Пусть, например, эталонное изображение $f$ является кусочно-постоянной двумерной функцией интенсивности вида

$$ f(x,y)=\sum_i^n a_{i}\chi _{i}(x,y), $$

где $\chi _{i}$ - индикаторная функция $i$-й области $\textit{разбиения}$ кадра, а $a_{i}$ - цвет закраски $i$-й области. Множество изображений $\textit{той же формы}$ имеет вид

$$ M=\left\{\sum_i^n b_{i} \chi _{i}(x,y): \langle b_{1},{\ldots},b_{n} \rangle \in R^{n}\right\}. $$

Тогда проекционное преобразование можно считать параметрическим вида $b_{i}=b(a_{i})$, где $i=1,{\ldots},n$ - количество уровней яркости на изображении. Соответственно для любого изображения $g(x,y)$ проекция $\textrm{Pr} (g,f)$ определяется набором параметров $\textbf{b}$:

$$ b_{i}=\frac {\int\!\!\!\int (g(x,y){\chi} _{i}(x,y)) dx dy}{\int\!\!\!\int \chi _{i}(x,y) dx dy}, \quad i=1,{\ldots},n. $$

Таким образом, в морфологическом подходе Пытьева проективные операторы используются для $\textit{сравнения изображений между собой}$, а также для $\textit{сравнения изображений с обобщенными моделями}$ ($\textit{формами}$). Данный подход позволяет сравнивать между собой и модели, устанавливая между ними отношения "$\textit{более простой/более сложный} \textit{по форме}$".

Именно формализм морфологии Ю.П.Пытьева послужил прообразом описываемого в данном разделе морфологического подхода к анализу изображений.


Полезные ссылки

  1. ☝ К началу
  2. ☜ Изображение как структура
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты