Яркость и цвет. Гистограммы, профили, проекции. Бинаризация и сегментация

Материал из Техническое зрение
Перейти к: навигация, поиск

Несмотря на все возможное богатство семантического, физического и любого другого содержания изображения, само это содержание определяется в конце концов только лишь распределением интенсивности некоторого сигнала по двумерной дискретной плоскости (или набором таких распределений, если изображение имеет несколько таких "цветовых", "диапазонных", "признаковых" или других плоскостей"). При этом каждый пиксел исходного цифрового изображения характеризуется тремя, вообще говоря, независимыми величинами - $\langle x, y, I \rangle$, где пара целочисленных значений $\langle x, y \rangle$ описывает $\textit{геометрическое положение}$ данного пиксела в плоскости изображения, а величина $I$ характеризует его $\it{яркость}$ или $\it{интенсивность}$ в данной точке плоскости. В соответствии с этим принято различать в изображении его $\it{яркостную}$ и $\it{геометрическую}$ составляющие.

Эти составляющие в принципе могут изменяться независимо друг от друга. Допустим, мы на протяжении некоторого времени наблюдаем через окно какую-нибудь статическую внешнюю сцену при неизменных условиях освещенности, а затем условия освещенности неожиданно меняются. Cкажем, солнце зашло за тучу или, наоборот, вышло из-за облака. При этом мы увидим, что, хотя $\it{яркость}$ (среднее значение интенсивности сигнала) и $\it{контраст}$ изображения (размах значений между минимальной и максимальной наблюдаемой яркостью) изменились, геометрическая $\it{форма}$ изображения (то есть положение видимых контуров объектов и областей различной яркости) - осталась неизменной. Возможна и обратная ситуация, когда яркостные характеристики изображения в среднем не меняются, несмотря на то, что явно наблюдаются изменения формы - например, движение каких-либо частей изображения относительно остальных его частей. Отсюда вытекает идея возможного $\textit{раздельного анализа яркости и геометрии изображения}$. Такое разделение не только облегчает разработчику логический анализ задачи, но и понижает "порядок" изображения как предмета обработки с третьего $\langle x, y, I\rangle$ до второго $\langle x, y \rangle$ и первого $\langle I \rangle$ соответственно, что, в свою очередь, позволяет экономить время вычислений и требуемый для решения задачи объем памяти.

Особенную привлекательность этой идее на ранних этапах развития обработки изображений придавало то, что анализ двумерных полей был сравнительно новой и неизведанной задачей, в то время как в области обработки одномерных функций и сигналов у математиков и специалистов в других областях знания был уже накоплен значительный опыт. Следовательно, выделив из изображения какой-либо характеризующий его одномерный сигнал, можно было применить для его обработки и анализа большое количество уже существующих готовых инструментов. Кроме того, как уже говорилось, обработка одномерных сигналов требует существенно меньшей затраты вычислительных ресурсов, что было крайне важно в те времена, когда вычислительная техника еще не была так мощна и совершенна, как сегодня. Да и сегодня актуальность экономии вычислительных ресурсов сохраняется во всех тех задачах, которые должны решаться системами машинного зрения в реальном масштабе времени.

Итак, яркостная составляющая изображения действительно характеризуется одномерным массивом $\it{гистограммы}$ (частоты встречаемости на изображениях пикселов одинаковой яркости). Однако геометрические характеристики изображения $\langle x, y \rangle$ по-прежнему требуют для своего описания двумерных данных. Естественно предположить, что первые исследователи изображений старались и в этой области найти такие характеристики, которые описывали бы двумерную геометрию изображения при помощи некоторых одномерных массивов. И такие полезные способы описания действительно были найдены. Это так называемые "профили" и "проекции" изображения. Профилем изображения вдоль некоторой линии называется функция интенсивности изображения, распределенного вдоль данной линии ($\it{прорезки}$). $\it{Проекцией}$ изображения на некоторую ось (направление) называется интеграл (сумма) интенсивности пикселов изображения, взятый в направлении, перпендикулярном данной оси.

Содержание

Сведение двумерных задач к одномерным

Итак, в данном разделе мы будем рассматривать основные способы обработки и анализа изображений путем $\textit{сведения двумерных задач к одномерным}$: построение и анализ гистограмм, гистограммную обработку изображений, а также построение и использование профилей и проекций изображения.

Еще одно предварительное замечание, прежде чем мы начнем непосредственно разбираться с различными видами и способами обработки и анализа изображений. Любая информация об изображении (а также и любая процедура его обработки) может носить $\it{глобальный}$ или $\it{локальный}$ характер$\it{. Глобальной}$ считается информация или обработка, относящаяся ко всему изображению в целом. $\it{Локальной}$ считается информация (или обработка), относящаяся (применяемая) к некоторой его выделенной области (фрагменту изображения, некоторой линии, определенному множеству точек и т. д. и т. п.). Соответственно, необходимо помнить, что и гистограммы, и профили, и проекции, рассматриваемые ниже, могут относиться как к изображению в целом, так и к определенным его локальным областям.

Подробнее

  1. Гистограмма и гистограммная обработка изображений
  2. Бинаризация полутоновых изображений
  3. Сегментация многомодальных изображений
  4. Обработка цветных изображений
  5. Профиль вдоль линии и анализ профиля
  6. Проекция и анализ проекции

Литература для самостоятельного изучения

В книге ($\textit{Гонсалес, Вудс}$) [$19$] обсуждаемым вопросам посвящены разделы $3.2$ (градационные преобразования), $3.3$ (видоизменение гистограммы), $10.3$ (пороговая обработка) и глава $6$ (обработка цветных изображений). Описана локальная пороговая обработка. Подробно рассмотрены вопросы не только сегментации, но и обработки цветных изображений - сглаживания, выделения контуров, сжатия - в нашем курсе все эти вопросы рассматриваются только применительно к полутоновым изображениям. Представляют интерес соответствующие разделы "Ссылки и литература для дальнейшего изучения" и "Библиографические замечания".

В книге ($\it{Форсайт, Понс}$) [$44$] работе с цветом посвящена глава $6$. Уделяется внимание физике формирования цветных изображений, а также особенностям их восприятия человеком. Обратите внимание на раздел "Примечания", содержащий интересные комментарии и библиографические ссылки.

В книге ($\it{Шапиро, Стокман}$) [$49$] пороговой бинаризации посвящен раздел $3.8$, работе с гистограммой - раздел $5.2$, работе с цветом - глава $6$.

Список источников к разделу

  1. $\it{Бердж В.}$ Методы рекурсивного программирования. - М: Машиностроение, 1983. [5]
  2. $\it{Тихонов А. Н.}$ Теория восстановления сигналов. - М.: Наука, 1983. [42]
  3. $\it{Otsu N.}$ A threshold selection method from gray-level histograms // IEEE Trans. Systems. Man and Cybernetics. 1979. Vol. SMC-9. № 1. [230]

Полезные ссылки

  1. ☝ К началу
  2. ☜ Обработка изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты