Изображение как функция векторного аргумента

Материал из Техническое зрение
Перейти к: навигация, поиск

Как правило, исходным описанием изображения на практике является $\textit{двумерная функция интенсивности f}$. В таком случае

$$ \Omega =F^{n}=\{f(x_{1},{\ldots},x_{n}): X(f)\subseteq {R}^{n}\to Z(f)\subseteq {R}\}, $$

где ${R}$ - множество действительных чисел; $F^{n}$ - пространство скалярных функций $n$-мерного аргумента; $X(f)$ - область определения $\textit{векторного аргумента}$ $\textbf{x}=\langle x_{1},{\ldots},x_{n}\rangle$; $Z(f)$ - область значения функции. При $n=2$ можно говорить о $\textit{морфологиях изображений}$ $f(x,y)$. Соответственно все ранее введенные понятия и утверждения, описывающие критерии морфологического анализа в терминах критериев-функций, необходимо в таком случае рассматривать в терминах $\textit{критериев-функционалов}$.

Многие методы анализа изображений, в которых изображения рассматриваются как двумерные функции, предполагают, что $\Omega =F^{n}$ является $\textit{гильбертовым пространством}$, то есть определены понятия сложения и умножения функций, умножения функции на число, скалярного произведения функций, нормы функции, линейного пространства, линейного подпространства, базиса подпространства и т.д. и т.п. Все эти понятия позволяют перенести в область анализа изображений все известные методы и результаты из области $\textit{линейной алгебры и векторных пространств}$. Также часто предполагается, что изображения-функции являются необходимое число раз непрерывно интегрируемыми и дифференцируемыми. Это позволяет перенести в область анализа изображений все известные методы и результаты из области $\textit{функционального анализа}$.

Функциональное представление изображений также естественным образом обобщается на случай $m$-компонентной $\textit{векторной функции} n$-мерного аргумента

$$ \Omega =\{\textbf{f}(\textbf{x})=\textbf{f}(x_{1},{\ldots},x_{n}): X(\textbf{f})\subseteq {R}^{n}\to Z(\textbf{f})\subseteq {R}^{m}\}, $$

причем векторные функции также могут рассматриваться как элементы гильбертова пространства. Важным частным случаем векторных изображений являются $\textit{цветные изображения}$ ($m=3$), описанные в одной из стандартных цветовых кодировок: RGB, CMY, YUV, YCbCr, HSV и т.\:п. При этом геометрия цветового пространства имеет ряд важных свойств, связанных с особенностями зрительного восприятия человека, которые существенно отличаются от обычных свойств многомерного пространства, описываемых евклидовой метрикой.

Векторные изображения также могут порождаться при съемке одной и той же сцены датчиками $\textit{различной физической природы}$ (электромагнитными, акустическими и др.) или набором датчиков, осуществляющих регистрацию электромагнитного излучения $\textit{различных длин волн}$ (видимый, инфракрасный, ультрафиолетовый диапазоны). Такая съемка называется $\textit{многозональной}, \textit{многоспектральной}$ или даже $\textit{гиперспектральной}$ (если используется большое количество узких диапазонов длин волн). Векторные изображения также порождаются искусственно - в результате выделения локальных признаков, когда каждый пиксел изображения описывается набором из $m$ признаков.

Заметим также, что вектор$\textit{ пространственных параметров изображения} \textbf{x}$ не всегда представляет собой набор компонент декартовых прямоугольных координат. Во многих системах получения и анализа изображений используются другие типы пространственных координат, например, $\textit{полярные координаты}$ азимут-дальность или кодирование узлов $\textit{шестиугольной решетки}$, обладающей лучшими топологическими свойствами по сравнению с прямоугольной решеткой, узлы которой отстоят друг от друга на неравные расстояния.

Более широким обобщением функционального представления изображений являются $\textit{наборы}$, или $\textit{ансамбли изображений}$:

$$ \Omega =\{\textbf{F}(\textbf{x})=\{f_{i}(x_{1},{\ldots},x_{n})\}_{i=1,{\ldots},p}: X_{i}(f_{i})\subseteq {R}^{n}\to Z_{i}(f_{i})\subseteq {R}^{m_i}\}. $$

Отличие ансамбля изображений от векторного изображения заключается в том, что хотя все изображения набора соответствуют одной и той же видимой сцене (наблюдаемому объекту или процессу), попиксельное соответствие $\textit{одноименных элементов}$ различных функций ансамбля, имеющих одинаковые значения аргумента, не предполагается. Можно считать, что векторные изображения, в которых такое попиксельное соответствие имеется, являются частным случаем ансамблей изображений. Типичными ансамблями изображений являются $\textit{стереоизображения}$, получаемые в результате съемки одной и той же статической сцены несколькими камерами, имеющими различное пространственное положение, и $\textit{видеопоследовательности}$, получаемые в результате съемки в различные моменты времени некоторой динамически изменяющейся сцены. Одноименные пикселы различных изображений ансамбля в общем случае могут соответствовать различным пространственным или временным элементам наблюдаемой сцены. Вследствие этого одной из первичных задач анализа ансамблей изображений является задача $\textit{отождествления}$ (matching) тех элементов (фрагментов) различных изображений ансамбля, которые соответствуют одним и тем же элементам сцены наблюдения. Конечной задачей анализа ансамбля изображений, как правило, является $\textit{реконструкция пространственной}$ (3D) или $\textit{пространственно-временной}$ (4D) $\textit{информации о сцене наблюдения}$.

Ниже, если иное дополнительно не оговаривается, мы будем предполагать, что $\Omega =F^{2}$ - пространство $\textit{полутоновых двумерных изображений}$.


Полезные ссылки

  1. ☝ К началу
  2. ☜ Морфологический взгляд на основные классы моделей, используемых в анализе изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты