Нелинейная фильтрация полутоновых изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

Алгоритмы нелинейной оконной фильтрации полутоновых изображений делятся на две большие группы: нелинейные ранговые и морфологические фильтры. Ранговая фильтрация рассматривается в данном разделе. Морфологические фильтры будут подробно описаны в гл. 6.

Содержание

Ранговая оконная фильтрация.

Нелинейная ранговая фильтрация является непосредственным обобщением бинарной ранговой фильтрации и опирается на понятие $\textit{порядковой статистики}$. Вокруг каждого элемента изображения выбирается окрестность, входящие в нее элементы изображения упорядочиваются по возрастанию яркости. $\textit{Ранговый фильтр}$ порядка $r$ ($1 \le r \le N$, где $N$ - число отсчетов в окрестности) выбирает из полученного ряда элемент с номером $r$ и присваивает его значение исходному элементу изображения. Когда число $N$ нечетное и $r = ( N+1 ) /2 $, то фильтр называется $\textit{медианным}$. Медианный фильтр имеет важное значение в обработке изображений вследствие высокой $\textit{робастности}$, то есть нечувствительности результатов фильтрации к плотности распределения (первого порядка) шумовой компоненты. Это связано с тем, что медианный фильтр с апертурой площадью $2M + 1$ эффективно подавляет локальные области площадью менее $M$ пикселов. В то же время, при фильтрации контрастных крупноразмерных объектов медианный фильтр не размывает и не смещает их края (точки перепада яркости).

Рассмотрим примеры ранговой полутоновой фильтрации по аналогии с тем, как ранее были рассмотрены примеры ранговой бинарной фильтрации. Изображения зашумлены гауссовским аддитивным шумом (см. рис. 2 - 8).

На рис. 38 - 43 приводятся примеры фильтрации полутонового изображения с различными степенями зашумления медианным фильтром с размером окна 3$\times $3. Как видно, данный фильтр хорошо справляется со слабой и средней степенью зашумления (рис. 38 - 42), однако при дальнейшем увеличении мощности шума фильтр с апертурой $3\times 3$ начинает ошибаться (рис. 44, 43).

Для подавления более интенсивных шумов необходимо использовать медианный фильтр с большими размерами окна фильтрации. На рис. 44 - 49 приводятся примеры медианной фильтрации с различными размерами апертуры.

3-2-38.jpg 3-2-39.jpg
Слабая степень зашумления исходного изображения Результат фильтрации медианой med $3\times 3$

Как видно из рис. 45 - 47, с увеличением размера окна растет способность медианного фильтра подавлять шумовую компоненту. Однако при слишком больших размерах апертуры (рис. 48, 49), как и в случае бинарной фильтрации, очертания объектов оказываются слишком сильно искажены. Кроме того, меньшие по размеру объекты оказываются целиком удалены с изображения. Поэтому в каждом конкретном случае фильтры необходимо настраивать в зависимости от наблюдаемой степени искажений характерных размеров наблюдаемых объектов.

3-2-40.jpg 3-2-41.jpg
Средняя степень зашумления исходного изображения}3_2_40 Результат фильтрации med $3\times 3$}3_2_41
3-2-42.jpg 3-2-43.jpg
Сильная степень зашумления исходного изображения}3_2_42 Результат фильтрации med $3\times 3$}3_2_43
3-2-44.jpg 3-2-45.jpg
Зашумленное изображение}3_2_44 Результат медианной фильтрации med $5\times 5$}3_2_45
3-2-46.jpg 3-2-47.jpg
Результат медианной фильтрации med $7\times 7$}3_2_46 Результат медианной фильтрации med $9\times 9$}3_2_47
3-2-48.jpg 3-2-49.jpg
Результат медианной фильтрации med $15\times 15$}3_2_48 Результат медианной фильтрации med $31\times 31$}3_2_49

Имеется значительное число обобщений и модификаций процедур нелинейной ранговой обработки. Введем необходимые понятия для их краткого описания в соответствии с терминологией, предложенной в работе:

$\langle i,j \rangle$ - координаты текущего пиксела на изображении;

$f_{ij }\in [0, Q-1]$ - дискретное значение яркости изображения $f(i,j)$ в точке $\langle i,j \rangle$;


$Q$ - число уровней яркости;

$\textit{$S$-окрестность}$ элемента $\langle i,j \rangle$ - заданное определенным образом множество элементов изображения, окружающих "центральный" элемент $\langle i,j\rangle$ (форма апертуры). Примеры типичных S-окрестностей: квадрат, прямоугольник, крест, окружность и т. п.;

$\textit{$M$-окрестность}$ - подмножество элементов S-окрестности, обладающих каким-либо нужным свойством, например, подмножество отсчетов, превышающих заданный порог и др.;

$N_m$ - число элементов M-окрестности;

$f_{m}(r)$ - $r$-я порядковая статистика по M-окрестности;

${\rm MEAN (M)} = \frac{1}{N_m }\sum\limits_{i,j\in \textrm{M}} {f_{i,j} } $ - среднее арифметическое значение элементов M-окрестности;

${\rm MED(M)} = f_{m} (\left[ (N_m + 1)/2\right])$ - медиана элементов M-окрестности.

Наиболее важные типы M-окрестности:

$\textit{KSN-окрестность}$ состоит из $k$ элементов, ближайших по какой-либо метрике на растре к заданному элементу;

$\textit{KNV-окрестность}$ из $k$ ближайших соседей к данному элементу по значению сигнала;

$\textit{EV-окрестность}$: ${\rm EV}(f) = \{f_{s}(k): f_{ij} - \epsilon _{v} \le k \le f_{ij} + \epsilon _{v}\}$;

и $\textit{ER-окрестность:}$ ${\rm ER}(f) = \{f_{s}(k): r_{m}(f_{ij}) - r_{r} \le k \le r_{m}(f_{ij}) + r_{r}\}$,

где $f_{s}(k)$ - элемент S-окрестности точки $\langle i,j\rangle$ со значением яркости $k$; $r_{m}(f)$ - ранг элементов $f$ в вариационном ряду M-окрестности.

Введем модель импульсного шума замещения в виде $$f_{ij}^\prime = f_{ij} \delta _{ij} + (1 - \delta_{ij}) f^{k}_{ij},$$ где $\delta _{ij}$ - случайная величина, принимающая значения 0 или 1 с вероятностью $p$ и характеризующая наличие ($\delta = 0$) или отсутствие ($\delta = 1$) сбоя сигнала.

Можно показать, что для этой модели шума строгая постановка задачи оптимального сглаживания по методу максимального правдоподобия приводит к итеративной (с номером итерации $t=0,1,{\ldots}$) процедуре фильтрации вида $$ f^{(t+1)} = {\rm MEAN(EV}(f^{ (t)})) $$ или $$ f^{(t+1)} = {\rm MED (EV}(f^{ (t)})) $$ в зависимости от выбора статистики сигнала (гауссовская или лапласовская).

С точки зрения задачи подавления шума без потери формы сигнала критерии оптимальности можно определить следующим образом. Ранговым алгоритмам, использующим EV-окрестности, соответствует критерий максимального подавления шума при уровне смаза, не превышающем заданного, а ранговым алгоритмам, использующим KNV-окрестность - критерий минимума смаза при заданном уровне подавления шума. Возможность выбора KNV-окрестности позволяет учесть априорную информацию о геометрических размерах деталей изображения, которые необходимо сохранить; в свою очередь, выбор EV-окрестности позволяет учитывать априорную информацию о дисперсии шума, который должен быть устранен.

К числу нелинейных ранговых фильтров относятся многие известные алгоритмы, в частности $\textit{сигма-фильтр}$ [$50$], [$164$] $$ f^{\prime}_{ij} = {\rm MEAN(EV}(f_{ij})), $$ где $\epsilon _{v} = 1,5\sigma $, а $\sigma $ - параметр СКО локальной статистики окна обработки, и $\textit{сигма-медианный}$ фильтр $$ f^{\prime}_{ij}= {\rm MED(EV(}f_{ij})), $$ причем, вообще говоря, отсечение отсчетов для усреднения может происходить на любом уровне значимости $\alpha $: $\epsilon _{v}=\alpha \sigma $. Таким образом, эти формулы охватывают случай $\alpha $ - $\textit{усеченных фильтров}$ [$164$].

Эффективной разновидностью ранговых алгоритмов сглаживания является так называемый $\textit{SNN-алгоритм}$. В этом алгоритме может быть применена любая схема сигма-фильтрации. Однако выбор M-окрестности обработки ведется, исходя из геометрических соображений, таким способом, что усредняемые отсчеты не могли в силу геометрических свойств апертуры находиться по разные стороны от границы возможного перепада яркости (края).

Заканчивая краткий обзор методов нелинейной ранговой фильтрации, можно отметить, что этот класс алгоритмов имеет высокую способность к подавлению шумовой компоненты, устойчив к различным видам шумов, допускает параллельную обработку информации и быстрые алгоритмы реализации.

"Быстрые" алгоритмы оконной фильтрации.

Ключевая идея ускорения вычислений при пространственной фильтрации изображений заключается в использовании метода скользящего окна, аналогичного известному методу вычисления "скользящих сумм", описанному, например Хуангом [47]. Суть этого метода заключается в хранении предвычисленных статистик по столбцам окна с последующим рекуррентным вычитанием статистик "уходящих столбцов" и добавлением в общую статистику статистик "приходящих" столбцов по ходу движения скользящего окна вдоль строки изображения.

Рассмотрим этот метод на примере вычисления скользящего среднего арифметического элементов S-окрестности (окна) $\Omega $ согласно следующей формуле:

$$ s_l (x_l ,y_l )=\sum\limits_{x=-a}^a {\sum\limits_{y=-b}^b {g_l (x_l +x, y_l +y)} } ,\quad (x_l ,y_l )\in \Omega . $$

Непосредственное вычисление среднего в каждом положении окна на изображении потребует порядка ${abLN}$ операций, где $a \times b$ - размеры окна, $N\times L$ - размеры изображения.

Введем теперь дополнительный массив для хранения сумм элементов столбцов, принадлежащих текущему окну:

$$ sum(i)=\sum\limits_{y=-b}^b {g_l (x_l +x_i , y_l +y)}, \quad i=0,\ldots, 2a . $$

Тогда по мере сдвига окна вправо по строке для перевычисления суммы элементов окна достаточно всего лишь одного сложения и одного вычитания элементов из $sum(i)$ (см. рис. 3)

3-2-0000.jpg

Алгоритм вычисления скользящей суммы с опорой на два столбца

Вычислительная сложность такой операции будет порядка $\textit{bLN}$, то есть в $a$ раз меньше, чем раньше.

Аналогичным образом можно осуществить и $\textit{вычисление ранговых статистик}$ (например, $\textit{медианы)}$ в скользящем окне. Алгоритм имеет следующий вид.

  1. В крайнем левом положении окна в строке собрать гистограмму элементов

окна и вычислить значение медианы.

  1. Сместить окно на один пиксел вправо.
  2. Обновить гистограмму: декрементировать значения ячеек, соответствующие

"уходящему" столбцу окна, инкрементировать значения ячеек, соответствующие "приходящему" столбцу окна.

  1. Обновить значение медианы, двигаясь по гистограмме из предыдущего

положения до тех пор, пока сумма элементов справа не окажется больше или равна сумме элементов слева.


При этом выигрыш во времени вычислений получается не только за счет того, что исключается многократный опрос одних и тех же элементов окна, но и за счет того, что исключается этап сортировки значений яркости в окне (так как гистограмма и представляет собой уже упорядоченный массив значений яркости).

Минимаксная фильтрация.

Наряду с медианными фильтрами широко применяется метод минимаксной фильтрации, использующий для обработки значения минимального и максимального элементов вариационного ряда, построенного из отсчетов окна фильтра. При наличии униполярного импульсного шума, характеризующегося либо положительными, либо отрицательными выбросами из среднего уровня фоновой составляющей, медианный фильтр может оказаться недостаточно надежным, когда плотность шума высока и более половины пикселов окна обработки составляют выбросы одинаковой полярности. Очевидный выход из этой ситуации - использовать элемент минимального ранга для выбросов положительной полярности и элемент максимального ранга для выбросов отрицательной полярности. В этом случае шумовые импульсы удаляются даже при очень сильном уровне засоренности. В то же время отдельное применение минимального и максимального фильтра во многом аналогично действию операций сжатия и расширения, рассмотренных выше, и приводят к искажению формы сигнала объекта. Поэтому с целью сохранения формы полезного сигнала целесообразна последовательная схема минимаксной фильтрации, состоящая из двух проходов по изображению и обработки сначала минимальным (максимальным), а затем максимальным (минимальным) рангом локальной статистики, что увеличивает эффективность фильтрации и в случае биполярного импульсного шума. Оптимальная последовательность, в которой следует выбирать минимальную (максимальную) процедуру, определяется характеристиками входного изображения: если неискаженное изображение состоит из ярких объектов на темном фоне, то правильная последовательность min-max. Обратная процедура справедлива для негативного изображения.


Сравнение минимаксной фильтрации с медианной может вестись в двух направлениях: эффективности результатов фильтрации и требуемых вычислительных затрат. При удалении шума минимаксный фильтр требует меньших размеров апертур фильтра, чем медианный, но зато выполняет обработку в два прохода (медианный за один). Однако сложность построения ранговой статистики растет сверхлинейно с размером апертуры, ввиду этого минимаксный фильтр в вычислительном аспекте представляется более предпочтительным. Учитывая, что при организации процедуры фоновой нормализации удаление сигнала от объекта требует для минимаксного фильтра меньших размеров апертуры, чем для медианного (примерно вдвое), данный тип фильтра может обеспечить б ольшую надежность нормализации при одних и тех же вычислительных затратах или меньшую вычислительную нагрузку при одинаковом уровне надежности. Недостаток минимаксного фильтра проявляется при обработке биполярного импульсного шума, где он не дает какого-либо выигрыша по сравнению с медианным фильтром, и, кроме того, процедура нормализации фона остается недостаточно эффективной вследствие того, что ранговая обработка, хотя и в меньшей степени, чем линейная, - но все же искажает яркостно-геометрические свойства фона при больших размерах апертуры.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Нелинейная фильтрация бинарных и полутоновых изображений
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты