Морфологические алгоритмы обнаружения объектов на изображениях

Материал из Техническое зрение
Перейти к: навигация, поиск

Пусть имеется морфо-геометрическая модель объекта вида $$ M(\textbf{p},\textbf{u})=\vee_{q\in Q }M(\textbf{u},\textbf{q}){\bullet}\phi (\textbf{p},\textbf{q}), $$ где $\textbf{u}$ - вектор параметров локализации объекта $M(\textbf{p},\textbf{u})$; $\textbf{q}\in Q$ - вектор параметров разложения; $M(\textbf{u},\textbf{q})\in \{0,1\}$ - модель локализации объекта, которая описывает все допустимые соответствия между параметрами локализации образа в целом и параметрами локализации составляющих его геометрических примитивов. Определим проекцию изображения на модель

$$ \textrm{Pr}(A(\textbf{p}),M(\textbf{p},\textbf{u})) = \vee_{q\in Q }M(\textbf{u},\textbf{q}){\bullet}A(\textbf{q}){\bullet}\phi (\textbf{p},\textbf{q}). $$

и соответствующий коэффициент морфологической корреляции

$$ \begin{gather}\tag{1} K_{M}(A(\textbf{p}),M(\textbf{p},\textbf{u})) = \frac{\vert \vert \mathrm{Pr}(A(p),M(p,u))\vert \vert} {\vert\vert A(p)\vert\vert} . \end{gather} $$

Как видно, коэффициент корреляции при этом оказывается функцией параметра \textbf{u}, то есть представляет собой корреляционное поле $K_{M}(\textbf{u})$, которое также может быть представлено и в пространстве параметров разложения

$$ \begin{gather}\tag{2} K_{M}(A(\textbf{q}),M(\textbf{u},\textbf{q})) = \frac{\vert\vert M(u,q){\bullet}A(q)\vert\vert}{\vert \vert A(q)\vert \vert}. \end{gather} $$

При этом локальные максимумы корреляционного поля соответствуют параметрам наиболее достоверной локализации объекта. Соответственно возникают две возможные стратегии анализа изображения.

Анализ изображения "сверху вниз" (от гипотез к данным) осуществляется путем последовательного вычисления значений корреляционного поля $K_{M}(\textbf{u})$ для каждого гипотетического значения вектора локализации \textbf{u} согласно формуле (11). Данный способ можно назвать согласованной морфологической фильтрацией в области изображения.

Анализ изображения "снизу вверх" (от данных к гипотезам) осуществляется согласно формуле (12) путем обнаружения значимых элементов разложения наблюдаемого образа ($\vert A(\textbf{q})\vert >0)$ и их голосования в пользу гипотетических значений параметров вектора \textbf{u}, определяемых выражением $M(\textbf{u},\textbf{q})=1$. Данный способ можно назвать согласованной морфологической фильтрацией в области разложения, которая, в зависимости от типа разложения, может иметь смысл пространственной, частотной, пространственно-частотной области и т.п. Данный способ конструирования вычислительно эффективных алгоритмов анализа изображений подробно рассмотрен в четвертой главе диссертационной работы, посвященной методам голосования и анализу свидетельств.

Генетический отбор морфологических моделей

Рассмотрим также возможный метод автоматизированного конструирования процедур обнаружения объектов, основанный на "генетическом отборе" информативных элементов. Пусть дан набор эталонных изображений $\textbf{A}=\{A_{i}(\textbf{p}): i=1,\ldots ,n\}\subseteq \Omega $ вместе с обучающей информацией об истинных параметрах локализации объектов на эталонных изображениях $\textbf{I}(\textbf{A})=\{A_{i}(\textbf{u})\in \{0,1\},\:\textbf{u}\in U: i=1,\ldots ,n\}$, где $U$ - пространство параметров локализации; $A_{i}(\textbf{u})$ - списки параметров локализации для объектов $A_{i}(\textbf{p})\in \textbf{A}$. Требуется сформировать модель $M(\textbf{p},\textbf{u})$ вида


$$ M(\textbf{p},\textbf{u}) = \vee_{k=1 ,\ldots, n }M_{k}(\textbf{u},\textbf{q}_{k}){\bullet}\phi _{k}(t_{k},\textbf{p},\textbf{q}_{k}), $$ где $n$ - количество значимых для модели яркостно-геометрических примитивов в наборе $\{\phi_{k}(t_{k},\textbf{p},\textbf{q}_{k}): k=1,\ldots ,n\}\subseteq \Omega $; $t_{k}$ - тип $k$-го примитива; $\textbf{q}_{k}\in Q$ - геометрические параметры $k$-го примитива; $M(\textbf{u},\textbf{q})=\mathop\cup\limits_{k=1,\ldots, n}M_{k}(\textbf{u},\textbf{q}_{k})$, $M(\textbf{u},\textbf{q})\in \{0,1\}$ - модель локализации объекта.

Пусть данной модели соответствует корреляционное поле $K_{M}(\textbf{u})$ (12) и пороговое правило принятия решения об обнаружении объекта $D(A,M,\textbf{u})\in \{0,1\}$. Определим функционал качества обнаружения $F(M,\textbf{A})$, штрафующий несовпадение множества результатов $\textbf{D}(M,\textbf{A})=\{D(A_{i}(\textbf{p}),M(\textbf{p},\textbf{u}),\textbf{u})\in \{0,1\},\textbf{u}\in U : i=1,\ldots ,n\}$ и обучающей информации $\textbf{I}(\textbf{A})$. Функционал качества должен быть составлен так, чтобы учитывать ошибки первого и второго рода, а также штрафовать аномальные и нормальные ошибки ("необнаружение объекта" и "неточную локализацию").

Необходимо решить следующую задачу условной оптимизации:


$$ \begin{gather}\tag{3} {F}(M,\textbf{A})\to \min(M : {T}(M)\le {T}_{\max}; \quad {V}(M)\le {V}_{\max}). \end{gather} $$

где $F(M,\textbf{A})=F(\textbf{D}(M,\textbf{A}),\;\textbf{I}(\textbf{A}))$ - функционал качества обнаружения; $T(M)$ - время вычисления $K_{M}(\textbf{u})$, $V(M$) - используемый объем памяти. Для решения данной задачи предложена и реализована следующая схема генетического отбора:

  1. Каждому $\textit{гену}$ соответствует один из возможных структурных примитивов, характеризуемый набором $\{M_{k}(\textbf{u},\textbf{q}_{k}), t_{k}, \textbf{q}_{k}\}$.
  2. $\textit{Хромосома - }$последовательность генов длины $n$. Каждая хромосома соответствует одной из возможных моделей $M(\textbf{p},\textbf{u})$.
  3. $\textit{Функция качества}$ для хромосомы вычисляется согласно критерию (13) с учетом аппаратно-программной архитектуры вычислителя.
  4. $\textit{Операция скрещивания}$ позволяет конструировать новые модели и процедуры на базе уже построенных. Новая процедура формируется путем перегруппировки составных частей существующих решений.
  5. $\textit{Операция мутации}$ позволяет изменить параметры локализации $\{M_{k}(\textbf{u},\textbf{q}_{k}), \textbf{q}_{k}\}$ для выбранного гена.
  6. $\textit{Генетический отбор}$ осуществляется путем итеративного "размножения", тестирования и селекции в каждом поколении хромосом с наилучшим значением функции качества. На каждом этапе случайным образом осуществляются мутации параметров и скрещивание моделей.

В отборе побеждает процедура с лучшим значением функции качества. Поскольку генетические алгоритмы не гарантируют нахождения оптимального решения, результат отбора понимается как близкая к оптимальной, но необязательно оптимальная процедура обнаружения.

Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты