Изображение как двумерная проекция трехмерной сцены

Материал из Техническое зрение
Перейти к: навигация, поиск

$\textit{Фотограмметрический подход}$, рассматривающий отдельные изображения и ансамбли изображений как двумерные проекции трехмерных сцен, регистрируемых с помощью оптических систем конкретной конфигурации (расстояния и углы между камерами, паспортные данные и дисторсии объективов камер), конечно, является существенным шагом в сторону имитационного моделирования. Однако заметим, что данный поход все же основан не на физическом, а на $\textit{геометрическом моделировании}$, поскольку традиционно ограничивается учетом $\textit{геометрии съемки}$ и не предполагает анализа других физических факторов, влияющих на качество получаемого изображения. Если понятие "яркостно-геометрическая модель" трактовать расширительно - как $\textit{распределение скалярной или векторной характеристики в пространстве}$ $R^{m}$, $m\ge 1$, тогда текстурированные трехмерные поверхности (2,5D) и объекты (3D), которые рассматриваются в фотограмметрии, можно также считать разновидностью "иконических объектов". Впрочем, такие фотограмметрические техники $\textit{как реконструкция трехмерных объектов по теням}$ следует все же отнести к методам имитационного моделирования.

Используемый в фотограмметрии математический аппарат целиком основан на стереометрии, проективной геометрии и геометрической оптике. Морфологическая интерпретация фотограмметрических моделей имеет следующий вид. Пусть дано двумерное изображение $A(x,y)\in \Omega =F^{2}$. $\textit{Гипотетическим прообразом}$ этого изображения является трехмерный объект $L(x,y,z)\in \Lambda =F^{3}$. Однозначная операция $\textit{проекции трехмерного объекта на плоскость}$ изображения играет в данном случае роль базового оператора $\textit{морфологической реконструкции изображения}$:

$$ A(x,y)=\delta (L(x,y,z)). $$

К сожалению, сопряженная процедура трехмерной морфологической сегментации

$$ L(x,y,z)=\epsilon (A(x,y)) $$

в общем случае (для одного изображения сцены) является неоднозначной. Поэтому фотограмметрический подход требует либо использовать некоторые дополнительные априорные сведения о модели съемки или характере снимаемых объектов, либо осуществлять трехмерную сегментацию на основе $\textit{ансамбля}$ (минимум - пары) $\textit{стереоизображений }\textbf{A}(x,y)$:

$$ \begin{gather*} \textbf{A}(x,y)={\delta}(L(x,y,z)),\\ L(x,y,z)=\epsilon (\textbf{A}(x,y)). \end{gather*} $$

С учетом этого задача морфологической сегментации (трехмерной реконструкции) может быть поставлена в традиционной форме

$$ \begin{multline*} \phi_{\textrm{Ф}}(\textbf{A}(x,y))=L(x,y,z): \textrm{Ф}(\textbf{A}(x,y),L(x,y,z))=\\ =K(\textbf{A}(x,y),\delta(L(x,y,z)))\cdot M(L(x,y,z))\to \max(L\in F^{3}), \end{multline*} $$

то есть задача заключается в том, чтобы подобрать такой трехмерный прообраз $L$, стереореконструкция которого $\delta(L(x,y,z))$ наилучшим образом соответствовала бы стереонаблюдению \textbf{A}$(x,y)$.

Далее этот подход можно развивать, объединяя его с рассмотренным выше структурным подходом. При этом $\textit{трехмерная структурная модель объекта} \lambda \in \Lambda $, как правило, представляет собой $\textit{структурный граф}$, вершинами которого являются фрагменты различных $\textit{аналитических 3D-поверхностей}$ (плоскостей, цилиндров, конусов, эллипсоидов и т.д.), либо границы между ними, которые, в свою очередь, представляют собой сегменты различных $\textit{аналитических 3D-кривых}$ (прямых, окружностей и т.п.) Ребра структурного графа соответствуют геометрическим отношениям между элементами-вершинами (расстояние между элементами, относительное расположение и т.д.) Задача $\textit{оптимальной индексации трехмерного структурного графа}$ на изображении или ансамбле стереоизображений также может быть представлена как типовая задача морфологического анализа данных

$$ \phi _{\textrm{Ф}}(\textbf{A}(x,y))= \lambda : \textrm{Ф}(\textbf{A}(x,y),\lambda )=K(\textbf{A}(x,y),\delta(\lambda ))\cdot M(\lambda )\to \max (\lambda \in \Lambda ). $$

Используемый в современной литературе по машинному зрению термин $\textit{модельный подход высокого уровня}$ предполагает решение именно этой задачи $\textit{отождествления (привязки) трехмерной структурной модели объекта}$.


Полезные ссылки

  1. ☝ К началу
  2. ☜ Морфологический взгляд на основные классы моделей, используемых в анализе изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты