Принцип максимума информационной энтропии

Материал из Техническое зрение
Перейти к: навигация, поиск

Обсуждаемые процедуры сегментации названы $\textit{критериальными}$ или $\textit{оптимальными}$, так как в основе их лежит решение задачи оптимизации для некоторого заданного вида функционала качества. Но как выбрать сам вид функционала и его параметры некоторым "наилучшим" образом? Это зависит от тех семантических соображений, которые служат основой для построения процедуры сегментации. Одним из возможных подходов здесь является так называемый $\textit{информационно-энтропийный подход}$. Рассмотрим его на примере задачи выделения видимых прямых линий (прямолинейных групп точек) в бинарном точечном паттерне (БТП).

Пусть критерий сегментации имеет вид

$$ \vert N_{0}-N_{1}\vert +\alpha n \to \min(n), $$

где $N_{0}$ - количество всех точек наблюдаемого бинарного паттерна, $N_{1}$ - количество точек, лежащих на $n$ выделенных прямых; $\vert N_{0}-N_{1}\vert $ - $\textit{критерий соответствия}$ наблюдения и модели, включающей $n$ линий; $n$ - число выделенных линий и, соответственно, $\textit{показатель структурной сложности}$ модели.

Очевидно, в зависимости от значения параметра $\alpha $ на изображении окажется целесообразным выделять прямые, содержащие большее или меньшее количество точек. Но как выбирать сам параметр $\alpha $? Обратимся к информационно-энтропийному подходу. Задача поиска фигур (линий) на изображениях точечных множеств в самой своей постановке опирается на произвольное допущение о том, что бинарные точечные паттерны действительно содержат искомые фигуры (линии). На самом деле точечные фигуры, которые видит в БТП человек, возникают лишь в процессе активного зрительного восприятия из-за свойства нашей зрительной системы "организовывать" видимый мир, используя при этом уже известные формы.

Одно из известных объяснений "организующего" характера зрительного восприятия основано на $\textit{принципе максимума энтропии.}$ В теории информации $\textit{энтропия} E$ связана с $\textit{количеством} \textit{информации} I$ соотношением $E=-I$. Поэтому в теории информации принцип максимума энтропии означает, что $\textit{любая} \textit{информационная система преобразует поступающие в нее сигналы так, чтобы обеспечить минимальное возможное количество информации, находящейся в системе}$.

Применительно к восприятию точечного паттерна это означает, что зрительная система группирует видимые точки в те или иные известные ей фигуры в том случае, когда такое представление информации выгоднее (в смысле экономии количества информации), чем ее исходное представление в виде неорганизованного (несегментированного) множества точек. Такой подход, в частности, позволяет дать строгую математическую формулировку задачи определения числа прямых, которые "имеет смысл обнаружить" при анализе аккумулятора преобразования Хафа. В более широком смысле он позволяет оценивать допустимую сложность моделей в различных задачах морфологической сегментации.


Полезные ссылки

  1. ☝ К началу
  2. ☜ Критерии, используемые в морфологическом анализе изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты