Бинаризация полутоновых изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

В обработке изображений часто используется процедура "пороговой бинаризации" - разбиение изображения на две области, одна из которых содержит все пикселы со значением ниже некоторого порога, а другая содержит все пикселы со значением выше этого порога.

Алгоритмы адаптивной бинаризации изображений базируются на использовании локальной или глобальной гистограммы изображения [$20$]. Подход, основанный на использовании гистограммы яркостей пикселов, является одним из самых известных и, безусловно, наиболее простым.

Оптимальная пороговая сегментация основана на приближении гистограммы изображения к некоторой кривой с использованием весовых сумм двух или более вероятностей интенсивности с нормальным распределением. Тогда порог - это набор ближайших уровней яркости, соответствующих минимуму вероятности между максимумами двух или более нормальных распределений.

3-1-1.jpg

Уровни яркости гистограммы аппроксимируются двумя нормальными распределениями: $\it{а}$ - функции распределения объекта и фона; $\it{б}$ - cоответствующие гистограммы и оптимальный порог

Для определения оптимального порога бинаризации предложено большое количество различных подходов. Наиболее удачным из них представляется подход Otsu [$230$], который предполагает не только определение оптимального порога бинаризации, но и вычисление некоторого критерия бимодальности, то есть оценку того, действительно ли исследуемая гистограмма содержит именно две моды (два выраженных пика). Идея данного подхода заключается в следующем.

Пусть изображение представляет собой двумерный массив Im размера $X\times Y$, причем его элементы (пикселы) принимают целочисленные значения на отрезке~[$0, 255$]. Тогда гистограмма этого изображения представляет собой одномерный массив Hist[$0\ldots 255$], в каждой ячейке которого Hist[$i$] содержится число пикселов изображения, имеющих значение, равное $i$. Рассмотрим теперь "подгистограмму" Hist[$k\ldots l$], $0\le k \le l\le 255$. Для любой такой подгистограммы (окна) $[k,l]$ можно вычислить оценку дисперсии яркости DISP$(k,l)$.

Пусть дан порог $t$: $0\le t\le 255$. Для него можно вычислить "$\it{критерий разделимости"}$ SC вида $$ \begin{gather}\tag{1} \mbox{SC}(t) = 1 - \frac{{\rm DISP}(0,t) + {\rm DISP}(t+1,255)} {{\rm DISP}(0,255)}. \end{gather} $$ Критерий SC$(t)$ всегда принимает значение на отрезке $[0,1]$, причем значение его тем больше, чем лучше разделимость яркостного распределения на два класса относительно порога $t$. Алгоритм Отсу предполагает вычисление SC($t$) для всех $t\in \{0, \ldots , 255\}$, после чего оптимальный порог Отсу определяется как $$ \begin{gather}\tag{2} T = \mathop{\textrm{argmax}}\limits_{ t\in \{0, \ldots , 255\}} {\rm SC}(t) . \end{gather} $$ Этот алгоритм имеет ясный статистический смысл и, как показывает практика, является эффективным и устойчивым способом определения адаптивного порога для бинаризации бимодальных изображений.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Яркость и цвет. Гистограммы, профили, проекции. Бинаризация и сегментация
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты