Гистограмма и гистограммная обработка изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

$\it{Гистограмма}$ характеризует частоту встречаемости на изображении пикселов одинаковой яркости.

Для $8$-битного полутонового изображения гистограмма яркости представляет собой одномерный целочисленный массив из $256$ элементов:

Hist: 1D-array $[0\ldots 255]$ of unsigned long ($32$-bit integer).

Элементы гистограммы Hist[$i$] содержат целые значения, равные количеству пикселов изображения, яркость которых равна значению $i$. Визуально гистограмма обычно отображается как обычный график одномерной функции. Гистограмма позволяет оценить и необходимым образом изменить яркость изображения, его контраст, площадь изображения, которую занимают светлые, темные и другие яркостные элементы, и, наконец, определить, где на плоскости изображения находятся отдельные области (объекты), соответствующие тем или иным диапазонам значений яркости.

Содержание

Яркостными преобразованиями изображения

Яркостными преобразованиями изображения называются преобразования двумерных функций яркости, описываемые простой формулой: $$ {I}^{\prime}(x,y) = f({I}(x,y)). $$ Здесь $f(\cdot)$ - $\it{функция отображения яркости}$, которая никак не зависит от положения пиксела $\langle x,y \rangle$. Простейшим случаем яркостных преобразований изображения являются линейные преобразования яркости, в которых функция отображения яркости имеет вид $$ f(I) = aI + b, $$ где $a$ - коэффициент, определяющий изменение контраста изображения, $b$ - коэффициент, определяющий изменение средней яркости изображения, $I$ - собственно яркость в текущей точке изображения Im$[x,y]$. Такие линейные преобразования яркости называют также $\it{фотографическими}$, так как при традиционной фотосъемке их можно устанавливать при помощи изменения характеристик выдержки и диафрагмы объектива. Возможны и другие функции отображения яркости.

Гистограммные преобразования

Яркостные преобразования цифровых изображений часто называют $\it{гистограммными}$, так как при этом, во-первых, изменяется гистограмма изображения, во-вторых, вид функции преобразования (параметры преобразования) часто определяются $\it{адаптивно}$, на основании ранее собранной гистограммы исходного изображения.

В случае дискретных цифровых изображений функция отображения яркости принимает вид так называемой $\it{таблицы отображения яркости}$ $\it{LUT (Look-Up-Table, просмотровой таблицы).}$ Гистограммная обработка изображения при помощи таблицы отображения яркости осуществляется следующим образом: $$ {\rm Im}[i,j] = {\rm LUT[Im}[i,j]], $$ где Im$[i,j]$ - пиксел изображения с координатами $\langle i,j \rangle$, а LUT - целочисленный массив размера $256$ элементов для $8$-битного изображения или длиной $65 536$ элементов для $16$-битного изображения. Далее без принципиальной потери общности будем рассматривать гистограммную обработку на примере $8$-битных полутоновых изображений. При этом LUT может задаваться:


  1. произвольной таблицей отображения, формируемой пользователем непосредственно;
  2. некоторой математической функцией, выбранной из заданного набора функций;
  3. адаптивно по гистограмме данного анализируемого изображения.

Пользовательские таблицы отображения позволяют выполнять следующие типовые операции:


  1. ручное вырезание определенных диапазонов яркости;
  2. ручное вырезание битовых плоскостей;
  3. ручная бинаризация изображения по одному или двум порогам;
  4. ручная сегментация изображения на несколько яркостных диапазонов.

Стандартные математические функции, используемые для формирования LUT, как правило, выделяются из следующего типового набора:


  1. Линейное преобразование;
  2. Логарифмическая функция;
  3. Экспонента;
  4. Квадратичная функция;
  5. Квадратный корень;
  6. Степенная функция;
  7. Обратная степенная функция.

Инвертирование яркости

Известным частным случаем стандартной обработки изображений является $\textit{инвертирование яркости}$, определяемое зависимостью вида $$ {\rm LUT}[i] = 255 - i. $$ В результате инвертирования изображения получается его $\it{негатив}$. При этом темные области становятся светлыми, и наоборот.

Другое широко используемое преобразование - степенной закон вида $$ {\rm LUT}[i] = r(i)^{\gamma }, $$ где $r$ - коэффициент контраста, а $\gamma $ - степень преобразования. Такие преобразования известны в области аналогового телевидения как процедура $\it{гамма-коррекции}$. Легко увидеть, что изменяя параметр $\gamma $, мы можем получать LUT различного типа. При $\gamma =1$ преобразование будет линейным, при $\gamma < 1$ предпочтение будет отдаваться более светлым цветам (на них придется большая часть диапазона), при $\gamma > 1$ предпочтение будет отдаваться более темным цветам. Такие преобразования часто используются для "выравнивания" яркости изображений, получаемых на электронно-лучевых трубках (ЭЛТ).

Рассмотрим теперь простейший способ $\it{адаптивной}$ (то есть не наперед заданной, а зависящей от данного конкретного изображения) гистограммной обработки. Начнем с линейной адаптивной процедуры, называемой $\it{яркостной нормализацией}$ изображения и описываемой следующей математической зависимостью: $$ {\rm LUT}[i] = 255 \cdot \frac {i - {I_{\min}}} {I_{\max} - I_{\min}}. $$ $I_{\min} = \min\limits_{x,y} \textrm{Im} [x,y]$, $I_{\max} = \max\limits_{x, y} \textrm{Im} [x,y]$. Значения $I_{\min}$ и $I_{\max}$ определяются как минимальный и максимальный номера ненулевых ячеек гистограммы Hist(Im). Данное преобразование равномерно "растягивает" диапазон яркостей [$I_{\min}, I_{\max}$], присутствующих на исходном изображении Im, на максимально возможный диапазон $[0, 255]$. Это способствует максимально возможному улучшению контраста изображения без потери каких-либо различий элементов яркости исходного изображения.

Другой популярной процедурой адаптивной гистограммной обработки изображения является $\it{эквализация}$ изображения. Эквализация также отображает реальный яркостный диапазон данного изображения (от минимального до максимального значения интенсивности) на диапазон [$0$, $255$]. При этом обеспечивается "выравнивание" числа пикселов изображения, имеющих различные значения яркости. Математическая форма данного преобразования имеет вид $$ {\rm LUT}[i] = 255 \cdot \frac{\sum\limits_{j=1}^i \textrm{Hist}[j]} {\sum\limits_{j=1}^{255} \textrm{Hist}[j]}, $$ В тех случаях, когда в диапазоне [$I_{\min}, I_{\max}$] более или менее равномерно присутствуют все градации, визуальный эффект от эквализации трудно отличить от эффекта нормализации. Однако в случае, когда значительная часть градаций яркости отсутствует, эквализация позволяет более равномерно использовать диапазон $[0, 255]$ для более контрастного отображения присутствующих на изображении градаций. Визуально это выглядит как "проявление" большего количества ранее не заметных на изображении деталей и контуров.

В заключение этого краткого введения в гистограммную обработку и анализ изображений необходимо отметить, что наиболее общей смысловой единицей анализа гистограммы является $\it{мода}$. Это понятие, позаимствованное из математической статистики, означает максимум (или "горб") графика гистограммы. Если гистограмма имеет одну моду, такая гистограмма называется $\it{унимодальной}$ и свидетельствует о яркостной однородности изображения. $\it{Бимодальная}$ гистограмма с двумя явно наблюдающимися модами, разделенными заметной "впадиной", скорее всего означает, что данное изображение содержит заметно отличающиеся друг от друга "светлую" и "темную" области, часто называемые "фоном" и "объектом" или "фоном" и "символом". Разделение этих областей порогом, определяемым по гистограмме, называется $\it{адаптивной бинаризацией изображения}$. Наконец, если на гистограмме наблюдается несколько мод, такая гистограмма называется $\it{мультимодальной}$, и ее анализ осуществляется более сложными методами.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Яркость и цвет. Гистограммы, профили, проекции. Бинаризация и сегментация
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты