Нелинейная фильтрация бинарных и полутоновых изображений

Материал из Техническое зрение
(Различия между версиями)
Перейти к: навигация, поиск
(Новая страница: « \Paragraph {} {Нелинейная фильтрация бинарных и полутоновых изображений} {Нелинейная фильтра…»)
 
Строка 1: Строка 1:
 +
[[Задача фильтрации изображений]]
  
\Paragraph
+
$\textbf{Зашумление изображения. Модели шумов}$.
{}
+
{Нелинейная фильтрация бинарных и полутоновых изображений}
+
{Нелинейная фильтрация}
+
 
+
\vspace{-16pt}
+
 
+
\noindent\parbox{13.5cm}{\Section{Задача фильтрации изображений}}
+
 
+
\noindent\textbf{Зашумление изображения. Модели шумов}.
+
 
Выше мы уже писали о том, что под задачей "фильтрации изображений" в
 
Выше мы уже писали о том, что под задачей "фильтрации изображений" в
 
широком смысле иногда понимают любые процедуры обработки изображений, при
 
широком смысле иногда понимают любые процедуры обработки изображений, при
Строка 17: Строка 9:
  
 
Однако чаще под "фильтрацией" в более узком смысле понимают так называемую
 
Однако чаще под "фильтрацией" в более узком смысле понимают так называемую
$\it{помеховую фильтрацию}$, или фильтрацию изображений от "шума". При этом неявно предполагается, что
+
$\textit{помеховую фильтрацию}$, или фильтрацию изображений от "шума". При этом неявно предполагается, что
 
первоначально где-то существовало некое "исходное" идеально чистое
 
первоначально где-то существовало некое "исходное" идеально чистое
 
(незашумленное) изображение, из которого затем путем $\it{зашумления}$ (определенного вида
 
(незашумленное) изображение, из которого затем путем $\it{зашумления}$ (определенного вида
Строка 75: Строка 67:
 
частную модель зашумления -  $\it{аддитивный шум}$, которая предполагает, что зашумленное
 
частную модель зашумления -  $\it{аддитивный шум}$, которая предполагает, что зашумленное
 
изображение порождается по  закону
 
изображение порождается по  закону
 +
 
$$
 
$$
 
{\rm Im}^{\prime} [x,y] = {\rm Im} [x,y] + R(x,y),
 
{\rm Im}^{\prime} [x,y] = {\rm Im} [x,y] + R(x,y),
 
$$
 
$$
 +
 
где ${\rm Im}^{\prime} [x,y]$ -  пиксел зашумленного изображения, ${\rm Im} [x,y]$ -  пиксел
 
где ${\rm Im}^{\prime} [x,y]$ -  пиксел зашумленного изображения, ${\rm Im} [x,y]$ -  пиксел
 
исходного изображения, а $R(x,y)$ -  случайная $\it{аддитивная шумовая компонента}$. Кроме того, в
 
исходного изображения, а $R(x,y)$ -  случайная $\it{аддитивная шумовая компонента}$. Кроме того, в
Строка 89: Строка 83:
 
{\rm Im}^{\prime} [x,y] = {\rm Im}[x,y] + N(0,\sigma ),
 
{\rm Im}^{\prime} [x,y] = {\rm Im}[x,y] + N(0,\sigma ),
 
$$
 
$$
 +
 
где $N(a,\sigma )$ -  нормальное распределение, $a$ -  математическое
 
где $N(a,\sigma )$ -  нормальное распределение, $a$ -  математическое
 
ожидание нормально распределенного сигнала, $\sigma $ -  средний квадрат
 
ожидание нормально распределенного сигнала, $\sigma $ -  средний квадрат
Строка 95: Строка 90:
 
изображений.
 
изображений.
  
На рис. \refFigure{3_2_2} - \refFigure{3_2_8} показаны примеры искусственного зашумления исходного
+
На рис. 2 - 8 показаны примеры искусственного зашумления исходного
полутонового изображения лейкоцитов (рис. \refFigure{3_2_1}) специально сгенерированным
+
полутонового изображения лейкоцитов (рис. 1) специально сгенерированным
 
аддитивным гауссовским шумом с различными значениями СКО. Как видно, чем
 
аддитивным гауссовским шумом с различными значениями СКО. Как видно, чем
 
больше параметр зашумления $\sigma $, тем более искаженным выглядит
 
больше параметр зашумления $\sigma $, тем более искаженным выглядит
изображение. При больших значениях $\sigma $ (рис. \refFigure{3_2_7}, \refFigure{3_2_8}) даже
+
изображение. При больших значениях $\sigma $ (рис. 7, 8) даже
 
человеческий глаз уже с трудом различает общие очертания крупноразмерных
 
человеческий глаз уже с трудом различает общие очертания крупноразмерных
 
объектов изображения (в данном случае -  лейкоцитов), более мелкие и менее
 
объектов изображения (в данном случае -  лейкоцитов), более мелкие и менее
Строка 107: Строка 102:
 
различные методы фильтрации цифровых изображений.
 
различные методы фильтрации цифровых изображений.
  
\vspace{-4pt}
+
<center>
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-1.jpg]]
{Исходное полутоновое изображение, $\sigma  = 0$}3_2_1
+
|align="center"|[[Файл:3-2-2.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_01.eps}\quad
+
|-
\Figure
+
|align="center"|Исходное полутоновое изображение, $\sigma  = 0$
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 20$}3_2_2
+
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 20$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_02.eps}
+
|}
\end{cFigures}
+
</center>
\vspace{-12pt}
+
\begin{cFigures}
+
\Figure
+
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 40$}3_2_3
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_03.eps}\quad
+
\Figure
+
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 60$}3_2_4
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_04.eps}
+
\end{cFigures}
+
  
\begin{cFigures}
+
<center>
\Figure
+
{|
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 80$}3_2_5
+
|align="center"|[[Файл:3-2-3.jpg]]
[t]{4.5cm}{4.3cm}{PIC/pic3_2_05.eps}\quad
+
|align="center"|[[Файл:3-2-4.jpg]]
\Figure
+
|-
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 100$}3_2_6
+
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 40$
[t]{4.5cm}{4.3cm}{PIC/pic3_2_06.eps}
+
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 60$
\end{cFigures}
+
|}
\vspace{-16pt}
+
</center>
\begin{cFigures}
+
\Figure
+
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 200$}3_2_7
+
[t]{4.5cm}{4.3cm}{PIC/pic3_2_07.eps}\quad
+
\Figure
+
{Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 300$}3_2_8
+
[t]{4.5cm}{4.3cm}{PIC/pic3_2_08.eps}
+
\end{cFigures}
+
  
\textbf{Оконная фильтрация изображений в пространственной области}.
+
<center>
 +
{|
 +
|align="center"|[[Файл:3-2-5.jpg]]
 +
|align="center"|[[Файл:3-2-6.jpg]]
 +
|-
 +
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 80$
 +
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 100$
 +
|}
 +
</center>
 +
 
 +
<center>
 +
{|
 +
|align="center"|[[Файл:3-2-7.jpg]]
 +
|align="center"|[[Файл:3-2-8.jpg]]
 +
|-
 +
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 200$
 +
|align="center"|Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma  = 300$
 +
|}
 +
 
 +
 
 +
$\textbf{Оконная фильтрация изображений в пространственной области}$.
 
Исходя из задачи восстановления исходных значений яркости
 
Исходя из задачи восстановления исходных значений яркости
 
незашумленного изображения, а также из того, что шумовая компонента каждого
 
незашумленного изображения, а также из того, что шумовая компонента каждого
 
пиксела является заранее не известной случайной величиной, следует, что для
 
пиксела является заранее не известной случайной величиной, следует, что для
 
решения данной задачи необходимо использовать ту или иную процедуру
 
решения данной задачи необходимо использовать ту или иную процедуру
$\it{статистического оценивания}$. Это может быть Байесовское оценивание, оценивание по методу наибольшего
+
$\textit{статистического оценивания}$. Это может быть Байесовское оценивание, оценивание по методу наибольшего
 
правдоподобия или любой другой метод, известный из курса математической
 
правдоподобия или любой другой метод, известный из курса математической
 
статистики. Однако все эти методы требуют использовать для оценки искомой
 
статистики. Однако все эти методы требуют использовать для оценки искомой
 
величины не одно единственное измерение (ведь оно также может быть
 
величины не одно единственное измерение (ведь оно также может быть
зашумлено), а б {о}льшую или меньшую $\it{статистическую выборку, }$всегда включающую несколько отсчетов,
+
зашумлено), а большую или меньшую $\textit{статистическую выборку, }$всегда включающую несколько отсчетов,
 
характеризующих данную величину. В связи с этим и основная идея помеховой
 
характеризующих данную величину. В связи с этим и основная идея помеховой
 
фильтрации изображений заключается в том, что для оценки исходного значения
 
фильтрации изображений заключается в том, что для оценки исходного значения
Строка 160: Строка 158:
 
значения еще нескольких близких к нему пикселов, попадающих в так называемое
 
значения еще нескольких близких к нему пикселов, попадающих в так называемое
 
"$\it{окно}$" или $\it{апертуру}$ фильтра. При этом "близость" пикселов к оцениваемому понимается
 
"$\it{окно}$" или $\it{апертуру}$ фильтра. При этом "близость" пикселов к оцениваемому понимается
в буквальном геометрическом смысле.\looseness=-1
+
в буквальном геометрическом смысле.
  
 
Наиболее простыми для вычислительной реализации являются традиционно
 
Наиболее простыми для вычислительной реализации являются традиционно
используемые $\it{прямоугольные окна}$ (апертуры) фильтрации, определяемые простым условием типа
+
используемые $\textit{прямоугольные окна}$ (апертуры) фильтрации, определяемые простым условием типа
"$\it{все пикселы данного окна отстоят от тестируемого центрального пиксела на более чем на WinX/2
+
"$\textit{все пикселы данного окна отстоят от тестируемого центрального пиксела на более чем на WinX/2
 
по горизонатали и WinY/2 по вертикали}$", где WinX и WinY -  горизонтальный и вертикальный размер окна
 
по горизонатали и WinY/2 по вертикали}$", где WinX и WinY -  горизонтальный и вертикальный размер окна
 
фильтрации соответственно. Возможны и другие, более сложные способы
 
фильтрации соответственно. Возможны и другие, более сложные способы
Строка 171: Строка 169:
  
 
Типовая процедура оконной фильтрации предполагает, что окно фильтрации
 
Типовая процедура оконной фильтрации предполагает, что окно фильтрации
последовательно движется по $\it{входному изображению}$ (например, алгоритм может обходить изображение
+
последовательно движется по $\textit{входному изображению}$ (например, алгоритм может обходить изображение
 
"в порядке чтения": сверху вниз по строкам, слева направо в каждой
 
"в порядке чтения": сверху вниз по строкам, слева направо в каждой
 
строке), при этом в каждом положении окна происходит анализ всех пикселов,
 
строке), при этом в каждом положении окна происходит анализ всех пикселов,
 
принадлежащих в данный момент окну, и на основе такого анализа центральному
 
принадлежащих в данный момент окну, и на основе такого анализа центральному
пикселу окна на $\it{выходном изображении}$ присваивается то или иное финальное значение.
+
пикселу окна на $\textit{выходном изображении}$ присваивается то или иное финальное значение.
 
Сформированное таким образом выходное изображение также называется
 
Сформированное таким образом выходное изображение также называется
$\it{результатом фильтрации}$.
+
$\textit{результатом фильтрации}$.
  
 
Процедуры оконной фильтрации могут различаться:
 
Процедуры оконной фильтрации могут различаться:
Строка 202: Строка 200:
 
пикселами. Таким образом, мы видим, что на границах однородных областей
 
пикселами. Таким образом, мы видим, что на границах однородных областей
 
оконные фильтры не могут работать эффективно, напротив, здесь они с большой
 
оконные фильтры не могут работать эффективно, напротив, здесь они с большой
вероятностью будут ошибаться, что визуально приведет к эффекту $\it{искажения формы контуров}$. Более того,
+
вероятностью будут ошибаться, что визуально приведет к эффекту $\textit{искажения формы контуров}$. Более того,
 
если на исходном изображении присутствуют контрастные объекты (области),
 
если на исходном изображении присутствуют контрастные объекты (области),
 
размер которых существенно меньше размера окна фильтрации, фильтр может
 
размер которых существенно меньше размера окна фильтрации, фильтр может
 
просто "не заметить" такой объект, отфильтровать его как шум, что приведет
 
просто "не заметить" такой объект, отфильтровать его как шум, что приведет
к $\it{исчезновению мелкоразмерных объектов}$ на результирующем выходном изображении.\looseness=-1
+
к $\textit{исчезновению мелкоразмерных объектов}$ на результирующем выходном изображении.
  
 
Казалось бы, из предыдущих рассуждений вытекает необходимость работать с
 
Казалось бы, из предыдущих рассуждений вытекает необходимость работать с
Строка 221: Строка 219:
  
 
Таким образом, конструируя и исследуя оконные процедуры фильтрации
 
Таким образом, конструируя и исследуя оконные процедуры фильтрации
изображений, мы всегда должны оценивать наблюдаемое $\it{качество фильтрации}$ по двум следующим
+
изображений, мы всегда должны оценивать наблюдаемое $\textit{качество фильтрации}$ по двум следующим
 
основным позициям:
 
основным позициям:
  
Строка 241: Строка 239:
 
изображений. Поскольку принципиальный смысл основных процедур фильтрации
 
изображений. Поскольку принципиальный смысл основных процедур фильтрации
 
проще почувствовать на примере фильтрации бинарных изображений, мы начнем с
 
проще почувствовать на примере фильтрации бинарных изображений, мы начнем с
изучения простейших $\it{бинарных фильтров}$.
+
изучения простейших $\textit{бинарных фильтров}$.
  
\Section{Фильтрация бинарных изображений}
+
[[Фильтрация бинарных изображений]]
  
\noindent\textbf{Модель шума "соль и перец".} Выше мы уже говорили о том, что для бинарных изображений наиболее удобной и
+
$\textbf{Модель шума "соль и перец".}$ Выше мы уже говорили о том, что для бинарных изображений наиболее удобной и
 
соответствующей природе изображения является модель шума замещения типа
 
соответствующей природе изображения является модель шума замещения типа
 
"соль и перец". Под шумом Salt-and-Pepper (соль и перец) на бинарном
 
"соль и перец". Под шумом Salt-and-Pepper (соль и перец) на бинарном
Строка 252: Строка 250:
 
бинарного шума имеет вид:
 
бинарного шума имеет вид:
  
\vspace{-12pt}
+
<center>
\begin{Table}{Переходные вероятности для бинарного шума "соль и перец"}
+
{Переходные вероятности для бинарного шума "соль и перец"}
{|c|c|c|}
+
\hline
+
${\rm Im}[x,y]\to {\rm Im}^\prime[x,y]$& ${\rm Im}^\prime [x,y]=1$& ${\rm Im}^\prime [x,y]=0$ \\
+
\hline
+
${\rm Im} [x,y]=1$& $1-p$& $p$ \\
+
\hline
+
${\rm Im}[x,y]=0$& $q$& $1-q$ \\
+
\hline
+
\end{Table}
+
\vspace{-8pt}
+
  
 +
{|
 +
|align="center"|${\rm Im}[x,y]\to {\rm Im}^\prime[x,y]$
 +
|align="center"|${\rm Im}^\prime [x,y]=1$
 +
|align="center"|${\rm Im}^\prime [x,y]=0$
 +
|-
 +
|align="center"|${\rm Im} [x,y]=1$
 +
|align="center"|$1-p$
 +
|align="center"|$p$
 +
|-
 +
|align="center"|${\rm Im}[x,y]=0$
 +
|align="center"|$q$
 +
|align="center"|$1-q$
 +
|}
 +
</center>
  
На рис. \refFigure{3_2_10} - \refFigure{3_2_16} показаны примеры искусственного зашумления исходного
+
 
бинарного изображения лейкоцитов (рис. \refFigure{3_2_9}) специально сгенерированным
+
На рис. 10 - 16 показаны примеры искусственного зашумления исходного
 +
бинарного изображения лейкоцитов (рис. 9) специально сгенерированным
 
шумом "соль и перец". Как видно, чем больше параметры зашумления $p$ и
 
шумом "соль и перец". Как видно, чем больше параметры зашумления $p$ и
 
$q$, тем более искаженным выглядит изображение. При больших вероятностях
 
$q$, тем более искаженным выглядит изображение. При больших вероятностях
 
замещения человеческий глаз уже с трудом различает общие очертания объектов
 
замещения человеческий глаз уже с трудом различает общие очертания объектов
изображения (рис. \refFigure{3_2_15}, \refFigure{3_2_16}).
+
изображения (рис. 15, 16).
 
+
\begin{cFigures}
+
\Figure
+
{Исходное изображение, $p=0, q=0$}3_2_9
+
[t]{4.5cm}{4.4cm}{PIC/pic3_2_09.eps}\quad
+
\Figure
+
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}02$, $q=0{,}02$}3_2_10
+
[t]{4.5cm}{4.4cm}{PIC/pic3_2_10!.eps}
+
\end{cFigures}
+
  
 +
<center>
 +
{|
 +
|align="center"|[[Файл:3-2-9.jpg]]
 +
|align="center"|[[Файл:3-2-10.jpg]]
 +
|-
 +
|align="center"|Исходное изображение, $p=0, q=0$
 +
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}02$, $q=0{,}02$
 +
|}
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-11.jpg]]
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}1$, $q=0{,}1$}3_2_11
+
|align="center"|[[Файл:3-2-12.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_11!.eps}\quad
+
|-
\Figure
+
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}1$, $q=0{,}1$
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}2$, $q=0{,}2$}3_2_12
+
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}2$, $q=0{,}2$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_12!.eps}
+
|}
\end{cFigures}
+
\begin{cFigures}
+
\Figure
+
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}25$, $q=0{,}25$}3_2_13
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_13!.eps}\quad
+
\Figure
+
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}3$, $q=0{,}3$}3_2_14
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_14!.eps}
+
\end{cFigures}
+
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-13.jpg]]
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}4$, $q=0{,}4$}3_2_15
+
|align="center"|[[Файл:3-2-14.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_15!.eps}\quad
+
|-
\Figure
+
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}25$, $q=0{,}25$
{Зашумление бинарного изображения шумом "соль и перец", $p=0{,}45$, $q=0{,}45$}3_2_16
+
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}3$, $q=0{,}3$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_16!.eps}
+
|}
\end{cFigures}
+
  
 +
{|
 +
|align="center"|[[Файл:3-2-15.jpg]]
 +
|align="center"|[[Файл:3-2-16.jpg]]
 +
|-
 +
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}4$, $q=0{,}4$
 +
|align="center"|Зашумление бинарного изображения шумом "соль и перец", $p=0{,}45$, $q=0{,}45$
 +
|}
 +
</center>
  
\textbf{Структура оконного фильтра.}
+
$\textbf{Структура оконного фильтра.}$
 
Введем ряд определений и обозначений, позволяющих формально описать процедуру оконной
 
Введем ряд определений и обозначений, позволяющих формально описать процедуру оконной
 
фильтрации бинарного изображения.
 
фильтрации бинарного изображения.
Строка 351: Строка 351:
  
 
Апертура может иметь любую произвольную конфигурацию, например
 
Апертура может иметь любую произвольную конфигурацию, например
\begin{center}
+
<center>
$\Omega
+
$$\Omega
 
_{ij} ={\begin{array}{*{20}c}
 
_{ij} ={\begin{array}{*{20}c}
 
  1 \hfill & 0 \hfill & 1 \hfill \\
 
  1 \hfill & 0 \hfill & 1 \hfill \\
 
  0 \hfill & 1 \hfill & 0 \hfill \\
 
  0 \hfill & 1 \hfill & 0 \hfill \\
 
  1 \hfill & 0 \hfill & 1 \hfill \\
 
  1 \hfill & 0 \hfill & 1 \hfill \\
\end{array} }$.
+
\end{array} }.$$
\end{center}
+
</center>
  
 
Рассмотрим теперь, используя введенную терминологию, различные методы
 
Рассмотрим теперь, используя введенную терминологию, различные методы
 
оконной фильтрации бинарных изображений.
 
оконной фильтрации бинарных изображений.
  
\textbf{Логическая фильтрация помех}.
+
$\textbf{Логическая фильтрация помех}$.
 
Назовем \it{проколотой} окрестность, в которой базовый пиксел не учитывается при сборе
 
Назовем \it{проколотой} окрестность, в которой базовый пиксел не учитывается при сборе
 
статистики. В таблице 3.2.2 приведен пример проколотой окрестности $3\times 3$.
 
статистики. В таблице 3.2.2 приведен пример проколотой окрестности $3\times 3$.
  
\begin{Table}{Пример проколотой окрестности $3\times 3$}
+
<center>
%{|c|c|c|}
+
 
{|>{\columncolor[gray]{0.8}}c|
+
Пример проколотой окрестности $3\times 3$
>{\columncolor[gray]{1.}}c|
+
 
>{\columncolor[gray]{0.8}}c|}
+
{|{|>{\columncolor[gray]{0.8}}c|>{\columncolor[gray]{1.}}c|>{\columncolor[gray]{0.8}}c|}
\hline
+
|\rowcolor[gray]{0.8}$(-1, -1)$
\rowcolor[gray]{0.8}$(-1, -1)$& $(0, -1)$ & $(1, -1)$ \\
+
|$(0, -1)$
\hline
+
|$(1, -1)$
$(-1, 0)$& $(0, 0)$& $(1, 0)$ \\
+
|-
\hline
+
|$(-1, 0)$
\rowcolor[gray]{0.8}$(-1, -1)$& $(0, -1)$& $(1, -1)$ \\
+
|$(0, 0)$
\hline
+
|$(1, 0)$
\end{Table}
+
|-
 +
|\rowcolor[gray]{0.8}$(-1, -1)$
 +
|$(0, -1)$
 +
|$(1, -1)$  
 +
|}
 +
 
 +
</center>
  
 
Проколотая окрестность $3\times 3$ содержит $8$ пикселов, влияющих на принятие
 
Проколотая окрестность $3\times 3$ содержит $8$ пикселов, влияющих на принятие
Строка 406: Строка 412:
 
требуется более мощное решающее правило.
 
требуется более мощное решающее правило.
  
\textbf{Бинарная медианная фильтрация}.
+
$\textbf{Бинарная медианная фильтрация}$.
\it{Медианный фильтр} действует следующим образом. Пусть выбрана некоторая
+
\textit{Медианный фильтр} действует следующим образом. Пусть выбрана некоторая
 
(чаще всего не проколотая) апертура $\Omega_{ij} $, содержащая нечетное число $n$
 
(чаще всего не проколотая) апертура $\Omega_{ij} $, содержащая нечетное число $n$
 
элементов. После опроса апертуры получаем $\left\{ {x^1,\ldots ,x^n} \right\}$ -  последовательность
 
элементов. После опроса апертуры получаем $\left\{ {x^1,\ldots ,x^n} \right\}$ -  последовательность
Строка 418: Строка 424:
  
  
Для \it{бинарного медианного фильтра} мы получаем следующее ППР:
+
Для \textit{бинарного медианного фильтра} мы получаем следующее ППР:
 +
 
 
$$
 
$$
 
y_{ij} =
 
y_{ij} =
Строка 426: Строка 433:
 
\end{cases}
 
\end{cases}
 
$$
 
$$
На рис. \refFigure{3_2_17} - \refFigure{3_2_22} приводятся примеры фильтрации бинарного изображения с
+
 
 +
На рис. 17 - 22 приводятся примеры фильтрации бинарного изображения с
 
различными степенями зашумления медианным фильтром с размером окна $3\times
 
различными степенями зашумления медианным фильтром с размером окна $3\times
 
3$. Как видно, данный фильтр хорошо справляется со слабой и средней степенью
 
3$. Как видно, данный фильтр хорошо справляется со слабой и средней степенью
зашумления (рис. \refFigure{3_2_17} - \refFigure{3_2_20}), однако при дальнейшем увеличении мощности
+
зашумления (рис. 17 - 20), однако при дальнейшем увеличении мощности
шума фильтр с апертурой $3\times 3$ начинает ошибаться (рис. \refFigure{3_2_21}, \refFigure{3_2_22}).
+
шума фильтр с апертурой $3\times 3$ начинает ошибаться (рис. 21, 22).
  
 +
<center>
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-17.jpg]]
{Слабая степень зашумления изображения}3_2_17
+
|align="center"|[[Файл:3-2-18.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_17!.eps}\quad
+
|-
\Figure
+
|align="center"|Слабая степень зашумления изображения
{Результат фильтрации исходного  изображения медианой med $3\times 3$}3_2_18
+
|align="center"|Результат фильтрации исходного  изображения медианой med $3\times 3$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_18!.eps}
+
|}
\end{cFigures}
+
  
 +
{|
 +
|align="center"|[[Файл:3-2-19.jpg]]
 +
|align="center"|[[Файл:3-2-20.jpg]]
 +
|-
 +
|align="center"|Cредняя степень зашумления
 +
|align="center"|Результат фильтрации исходного изображения изображения med $3\times 3$
 +
|}
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-21.jpg]]
{Средняя степень зашумления}3_2_19
+
|align="center"|[[Файл:3-2-22.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_19!.eps}\quad
+
|-
\Figure
+
|align="center"|Сильная степень зашумления
{Результат фильтрации исходного изображения изображения med $3\times 3$}3_2_20
+
|align="center"|Результат фильтрации исходного изображения изображения med $3\times 3$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_20!.eps}
+
|}
\end{cFigures}
+
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-23.jpg]]
{Сильная степень зашумления}3_2_21
+
|align="center"|[[Файл:3-2-24.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_21!.eps}\quad
+
|-
\Figure
+
|align="center"|Высокая степень зашумления
{Результат фильтрации исходного изображения изображения med $3\times 3$}3_2_22
+
|align="center"|Результат фильтрации исходного изображения изображения медианой med $5\times 5$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_22!.eps}
+
|}
\end{cFigures}
+
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-25.jpg]]
{Высокая степень зашумления}3_2_23
+
|align="center"|[[Файл:3-2-26.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_23!.eps}\quad
+
|-
\Figure
+
|align="center"|Результат фильтрации изображения med $7\times 7$
{Результат фильтрации исходного изображения изображения медианой med $5\times 5$}3_2_24
+
|align="center"|Результат фильтрации изображения med $9\times 9$
[t]{4.5cm}{4.5cm}{PIC/pic3_2_24!.eps}
+
|}
\end{cFigures}
+
  
\begin{cFigures}
+
{|
\Figure
+
|align="center"|[[Файл:3-2-27.jpg]]
{Результат фильтрации изображения med $7\times 7$}3_2_25
+
|align="center"|[[Файл:3-2-28.jpg]]
[t]{4.5cm}{4.5cm}{PIC/pic3_2_25!.eps}\quad
+
|-
\Figure
+
|align="center"|Результат фильтрации изображения med 15$\times $15
{Результат фильтрации изображения med $9\times 9$}3_2_26
+
|align="center"|Результат фильтрации изображения med 31$\times $31
[t]{4.5cm}{4.5cm}{PIC/pic3_2_26!.eps}
+
|}
\end{cFigures}
+
  
\begin{cFigures}
+
</center>
\Figure
+
{Результат фильтрации изображения med 15$\times $15}3_2_27
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_27!.eps}\quad
+
\Figure
+
{Результат фильтрации изображения med 31$\times $31}3_2_28
+
[t]{4.5cm}{4.5cm}{PIC/pic3_2_28!.eps}
+
\end{cFigures}
+
  
 
Для подавления более интенсивных шумов необходимо использовать медианный
 
Для подавления более интенсивных шумов необходимо использовать медианный
фильтр с б {о}льшими размерами окна фильтрации. На рис. \refFigure{3_2_24} - \refFigure{3_2_28}
+
фильтр с бoльшими размерами окна фильтрации. На рис. 24 - 28
 
приводятся примеры медианной фильтрации с различными размерами апертуры.
 
приводятся примеры медианной фильтрации с различными размерами апертуры.
  
  
Как видно из рис. \refFigure{3_2_24} - \refFigure{3_2_26}, с увеличением размера окна растет
+
Как видно из рис. 24 - 26, с увеличением размера окна растет
 
способность медианного фильтра подавлять шумовые точки. Однако при слишком
 
способность медианного фильтра подавлять шумовые точки. Однако при слишком
 
больших размерах апертуры очертания объектов оказываются слишком сильно
 
больших размерах апертуры очертания объектов оказываются слишком сильно
искажены (рис. \refFigure{3_2_27}, \refFigure{3_2_28}). Поэтому в каждом конкретном случае фильтры
+
искажены (рис. 27, 28). Поэтому в каждом конкретном случае фильтры
 
необходимо настраивать в зависимости от наблюдаемой степени искажений
 
необходимо настраивать в зависимости от наблюдаемой степени искажений
 
характерных размеров наблюдаемых объектов.
 
характерных размеров наблюдаемых объектов.
  
  
Рассмотрим еще раз \it{медиану} как правило принятия решения в бинарном оконном фильтре,
+
Рассмотрим еще раз $\it{медиану}$ как правило принятия решения в бинарном оконном фильтре,
 
действующем на изображении в присутствии шума "соль и перец". Легко
 
действующем на изображении в присутствии шума "соль и перец". Легко
заметить, что такое правило принятия решения соответствует \it{максимуму апостериорной вероятности} в том случае,
+
заметить, что такое правило принятия решения соответствует $\textit{максимуму апостериорной вероятности}$ в том случае,
 
если
 
если
 +
 
$$
 
$$
 
p = q < 0,5.
 
p = q < 0,5.
 
$$
 
$$
 +
 
Действительно, если в среднем инвертирование белых и черных элементов
 
Действительно, если в среднем инвертирование белых и черных элементов
 
происходит с равной вероятностью (но не более 1/2), то в апертуре будет
 
происходит с равной вероятностью (но не более 1/2), то в апертуре будет
Строка 515: Строка 521:
 
"средняя" ранговая оценка может оказаться неоптимальной.
 
"средняя" ранговая оценка может оказаться неоптимальной.
  
\textbf{Бинарная ранговая фильтрация.}
+
$\textbf{Бинарная ранговая фильтрация.}$
Правило принятия решения для \it{рангового} или \it{процентильного} фильтра имеет вид, аналогичный ППР для
+
Правило принятия решения для $\it{рангового}$ или $\it{процентильного}$ фильтра имеет вид, аналогичный ППР для
 
медианного фильтра,
 
медианного фильтра,
 +
 
$$
 
$$
 
y_{ij} =\left\{ {\begin{array}{l}
 
y_{ij} =\left\{ {\begin{array}{l}
Строка 524: Строка 531:
 
  \end{array}} \right.
 
  \end{array}} \right.
 
$$
 
$$
 +
 
где $k=\const$ -  задаваемое значение, причем $0<k \leqslant n$.
 
где $k=\const$ -  задаваемое значение, причем $0<k \leqslant n$.
  
Строка 537: Строка 545:
 
1$. С более "высокими" рангами следует работать в том случае, если
 
1$. С более "высокими" рангами следует работать в том случае, если
 
вероятность перехода $0\to 1$ существенно больше вероятности перехода $1\to
 
вероятность перехода $0\to 1$ существенно больше вероятности перехода $1\to
0$. Предельным случаем такого "асимметричного" шума является \it{униполярный} шум c
+
0$. Предельным случаем такого "асимметричного" шума является $\it{униполярный}$ шум c
 
параметрами ($p=0,  q>0$) или ($q=0,  p>0$). В этих случаях оптимальная ранговая
 
параметрами ($p=0,  q>0$) или ($q=0,  p>0$). В этих случаях оптимальная ранговая
фильтрация принимает вид \it{максимального} или\it{ минимального} фильтра соответственно.
+
фильтрация принимает вид $\it{максимального}$ или$\it{ минимального}$ фильтра соответственно.
  
\textbf{Взвешенные ранговые фильтры.}
+
$\textbf{Взвешенные ранговые фильтры.}$
 
Как уже говорилось, использование процентильных фильтров для подавления
 
Как уже говорилось, использование процентильных фильтров для подавления
 
помех основано на предположении, что объекты (однородные области) на
 
помех основано на предположении, что объекты (однородные области) на
 
исходном изображении настолько велики, что число положений апертуры $\Omega
 
исходном изображении настолько велики, что число положений апертуры $\Omega
 
_{ij} $, в которых она целиком (всеми пикселами) попадает на объект или
 
_{ij} $, в которых она целиком (всеми пикселами) попадает на объект или
также целиком на фон, намного больше числа "переходных состояний" (рис. \refFigure{3_2_29}).\looseness=-1
+
также целиком на фон, намного больше числа "переходных состояний" (рис. 29).
  
\begin{cFigures}
+
<center>
\Figure
+
{Положение фильтра относительно объекта}3_2_29
+
[t]{4.86cm}{3.64cm}{PIC/pic3_2_29.eps}\qquad
+
\Figure
+
{"Переходные состояния" фильтра на сцене вида "шахматная доска" (положение фильтра относительно объекта)}3_2_30
+
[t]{4.91cm}{2.83cm}{PIC/pic3_2_30.eps}
+
\end{cFigures}
+
  
 +
{|
 +
|align="center"|[[Файл:3-2-29.jpg]]
 +
|align="center"|[[Файл:3-2-30.jpg]]
 +
|-
 +
|align="center"|Положение фильтра относительно объекта
 +
|align="center"|"Переходные состояния" фильтра на сцене вида "шахматная доска" (положение фильтра относительно объекта)
 +
|}
 +
</center>
  
 
Если это предположение не выполняется (например, сцена имеет вид "шахматной
 
Если это предположение не выполняется (например, сцена имеет вид "шахматной
доски" (рис. \refFigure{3_2_30}), то процентильная фильтрация приведет лишь к усилению
+
доски" (рис. 30), то процентильная фильтрация приведет лишь к усилению
 
помех (увеличению числа ошибок на сцене). Это связано с тем, что,
 
помех (увеличению числа ошибок на сцене). Это связано с тем, что,
 
подсчитывая число единиц и нулей в апертуре, мы как бы заранее предполагаем,
 
подсчитывая число единиц и нулей в апертуре, мы как бы заранее предполагаем,
Строка 569: Строка 578:
 
устойчивость фильтрации можно, придав более близким точкам окрестности
 
устойчивость фильтрации можно, придав более близким точкам окрестности
 
большее влияние на окончательный результат, чем дальним. Это  можно
 
большее влияние на окончательный результат, чем дальним. Это  можно
осуществить при помощи \it{матрицы весов}.
+
осуществить при помощи $\textit{матрицы весов}$.
 
При этом значения каждого пиксела апертуры $x_{ij} $ при подсчете модифицированного числа единиц $k$
 
При этом значения каждого пиксела апертуры $x_{ij} $ при подсчете модифицированного числа единиц $k$
 
умножается на определенный вес
 
умножается на определенный вес
 +
 
$$
 
$$
 
k =\sum\limits_{x_{ij} \in \Omega } {q_{ij} x_{ij} } ,
 
k =\sum\limits_{x_{ij} \in \Omega } {q_{ij} x_{ij} } ,
 
$$
 
$$
 +
 
где $q_{ij} $ -  весовые коэффициенты элементов апертуры (целые
 
где $q_{ij} $ -  весовые коэффициенты элементов апертуры (целые
 
числа).
 
числа).
  
 
Модифицированный размер апертуры для взвешенного фильтра теперь имеет вид
 
Модифицированный размер апертуры для взвешенного фильтра теперь имеет вид
 +
 
$$
 
$$
 
n=\sum\limits_{x_{ij} \in \Omega } {q_{ij}
 
n=\sum\limits_{x_{ij} \in \Omega } {q_{ij}
 
} .
 
} .
 
$$
 
$$
 +
 
ППР $\left( {k \mathord{\left/ {\vphantom {k n}} \right.
 
ППР $\left( {k \mathord{\left/ {\vphantom {k n}} \right.
 
\kern-\nulldelimiterspace} n} \right)_n $ для взвешенного процентильного
 
\kern-\nulldelimiterspace} n} \right)_n $ для взвешенного процентильного
 
фильтра практически эквивалентно прежнему с учетом новых значений $k $ и
 
фильтра практически эквивалентно прежнему с учетом новых значений $k $ и
$n$. Приведем два возможных примера весовых матриц (\refEquation{3_2_1}) и (\refEquation{3_2_2}).
+
$n$. Приведем два возможных примера весовых матриц (1) и (2).
  
 
$$
 
$$
 +
\begin{gather}\label(3-2-1)
 
{\begin{array}{*{20}c}
 
{\begin{array}{*{20}c}
 
  0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0 \hfill \\
 
  0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0 \hfill \\
Строка 595: Строка 609:
 
  0 \hfill & 2 \hfill & 4 \hfill & 2 \hfill & 0 \hfill \\
 
  0 \hfill & 2 \hfill & 4 \hfill & 2 \hfill & 0 \hfill \\
 
  0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0, \hfill \\
 
  0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0, \hfill \\
\end{array} } \eqMark{3_2_1}
+
\end{array} }
 +
\end{gather}  
 
$$
 
$$
 
$$
 
$$
 +
begin{gather}\label{3-2-2}
 
{\begin{array}{*{20}c}
 
{\begin{array}{*{20}c}
 
  1 \hfill & 0 \hfill & 1 \hfill \\
 
  1 \hfill & 0 \hfill & 1 \hfill \\
 
  0 \hfill & 1 \hfill & 0 \hfill \\
 
  0 \hfill & 1 \hfill & 0 \hfill \\
 
  1 \hfill & 0 \hfill & 1. \hfill \\
 
  1 \hfill & 0 \hfill & 1. \hfill \\
\end{array} } \eqMark{3_2_2}
+
\end{array} }  
 +
\end{gather}
 
$$
 
$$
Матрица (\refEquation{3_2_1}) реализует описанный выше принцип "штрафа за удаление". Общий
+
Матрица (1) реализует описанный выше принцип "штрафа за удаление". Общий
размер апертуры в этом случае равен $n=36$. Матрица (\refEquation{3_2_2}) является весовой
+
размер апертуры в этом случае равен $n=36$. Матрица (2) является весовой
 
матрицей типа "маска" (матрица весов состоит из нулей и единиц). Данная
 
матрицей типа "маска" (матрица весов состоит из нулей и единиц). Данная
 
маска с $n=5$ позволяет фильтровать даже сцены типа "шахматная доска" (см.
 
маска с $n=5$ позволяет фильтровать даже сцены типа "шахматная доска" (см.
рис. \refFigure{3_2_30}).
+
рис.30).
  
\textbf{Анизотропная фильтрация.}
+
[[Анизотропная фильтрация|$\textbf{Анизотропная фильтрация.}$]]
 
Анизотропная фильтрация отличается от описанных ранее алгоритмов тем, что
 
Анизотропная фильтрация отличается от описанных ранее алгоритмов тем, что
 
обладает инерционностью, т. е. "помнит" свои предыдущие состояния.
 
обладает инерционностью, т. е. "помнит" свои предыдущие состояния.

Версия 04:32, 16 июля 2020

Задача фильтрации изображений

$\textbf{Зашумление изображения. Модели шумов}$. Выше мы уже писали о том, что под задачей "фильтрации изображений" в широком смысле иногда понимают любые процедуры обработки изображений, при которых на вход процедуры подается (одно) растровое изображение, и на выходе также формируется растровое изображение. Такие процедуры типа (один растровый вход, один растровый выход) называют\linebreak $\it{фильтрами}$.

Однако чаще под "фильтрацией" в более узком смысле понимают так называемую $\textit{помеховую фильтрацию}$, или фильтрацию изображений от "шума". При этом неявно предполагается, что первоначально где-то существовало некое "исходное" идеально чистое (незашумленное) изображение, из которого затем путем $\it{зашумления}$ (определенного вида искажения), было получено то реальное изображение, которое мы наблюдаем. Задача помеховой фильтрации, таким образом, сводится к тому, чтобы путем некоторой обработки наблюдаемого реального изображения как можно лучше "очистить его от шума", то есть получить изображение, наиболее близкое по своим характеристикам к исходному "незашумленному" изображению.

На самом деле необходимо понимать, что "зашумление" - это всего лишь очень упрощенная идеализированная модель возникновения искажений в цифровых изображениях реальных объектов. Вообще же говоря, искажения изображения, получаемого путем видеосъемки реального трехмерного объекта в природной обстановке, могут носить весьма сложный характер, зависящий от условий съемки (освещенность, туман, блики, тени, дождь, снег и т. п.), характеристик оптической системы (дисторсии, расфокусировки, замутненность линз и зеркал и т. п.), характеристик электронной регистрирующей аппаратуры, характеристик канала передачи, характеристик устройств оцифровки и еще многих и многих факторов. Приближенные к реальности математические модели формирования цифровых изображений содержат сотни сложных нелинейных уравнений и множество табличных поправок. При этом закон формирования значения яркости каждого пиксела изображения, как правило, не является независимым от формирования соседних пикселов, яркостные параметры изображения зависят от геометрических, и так далее. При попытке математически "скорректировать" подобную сложную модель регистрации изображения говорят уже не о фильтрации от шума, а о $\it{реставрации}$ или $\it{реконструкции}$ изображений.

К сожалению, методы реставрации изображений слишком сложны в вычислительном смысле, чтобы на практике использоваться в системах машинного зрения, работающих в реальном масштабе времени. Кроме того, они требуют точного знания математической модели и всех параметров системы видеорегистрации, что на практике также практически невозможно. Поэтому в реальных системах машинного зрения, как правило, используются более простые, но тем не менее достаточно эффективные процедуры помеховой фильтрации, разработанные для борьбы с гораздо более простыми искажениями в виде $\it{независимого зашумления пикселов}$ изображения.

Наиболее общей моделью независимого зашумления пикселов является $\it{шум замещения}$. Пусть дано исходное ("незашумленное") полутоновое изображение Im$[x,y]$, каждый пиксел которого может принимать значения в диапазоне $[0,\ldots , I_{\textrm{max}}-1]$. Общая модель шума замещения предполагает, что после зашумления каждый пиксел изображения, имевший ранее значение яркости $i$, либо с некоторой известной вероятностью $p(i)$ это значение сохранит, либо данное значение яркости будет случайным образом замещено с вероятностью $q(i,j)$ некоторым другим значением яркости $j$ из того же конечного дискретного диапазона $[0,\ldots , I_{\textrm{max}}-1]$. Как видно, для описания такой общей модели случайного замещения нам потребуется задать таблицу $\it{переходных вероятностей}$ размера $I_{\textrm{max}}^{2}$, что составляет весьма значительное количество в случае обычного $8$-битового полутонового изображения (размер таблицы - $256\times 256$ элементов). Такое описание явно является некомпактным и поэтому редко используется на практике для полутоновых изображений. В то же время, для бинарных изображений, в которых $I_{\rm {max}} = 2$, такое описание является наиболее удобным, простым и естественным. Чуть ниже мы еще рассмотрим модель шума замещения на бинарных изображениях - так называемую модель шума "соль и перец".

Для полутоновых изображений, как правило, рассматривают другую, более частную модель зашумления - $\it{аддитивный шум}$, которая предполагает, что зашумленное изображение порождается по закону

$$ {\rm Im}^{\prime} [x,y] = {\rm Im} [x,y] + R(x,y), $$

где ${\rm Im}^{\prime} [x,y]$ - пиксел зашумленного изображения, ${\rm Im} [x,y]$ - пиксел исходного изображения, а $R(x,y)$ - случайная $\it{аддитивная шумовая компонента}$. Кроме того, в большинстве приложений зависимость шума от координат пиксела считается несущественной. Наконец, исходя из известного в статистике $\it{закона больших чисел}$, закон распределения аддитивной шумовой компоненты предпочитают описывать удобным параметрическим семейством $\it{нормальных}$ ($\it{гауссовских}$) распределений с нулевым средним. Таким образом, $\it{гауссовский аддитивный шум}$ описывается выражением

$$ {\rm Im}^{\prime} [x,y] = {\rm Im}[x,y] + N(0,\sigma ), $$

где $N(a,\sigma )$ - нормальное распределение, $a$ - математическое ожидание нормально распределенного сигнала, $\sigma $ - средний квадрат отклонения (СКО) нормально распределенной величины. Именно такая модель зашумления чаще всего рассматривается в задачах фильтрации полутоновых изображений.

На рис. 2 - 8 показаны примеры искусственного зашумления исходного полутонового изображения лейкоцитов (рис. 1) специально сгенерированным аддитивным гауссовским шумом с различными значениями СКО. Как видно, чем больше параметр зашумления $\sigma $, тем более искаженным выглядит изображение. При больших значениях $\sigma $ (рис. 7, 8) даже человеческий глаз уже с трудом различает общие очертания крупноразмерных объектов изображения (в данном случае - лейкоцитов), более мелкие и менее контрастные объекты становятся практически неразличимы.

В следующих разделах мы будем иметь в виду этот пример, рассматривая различные методы фильтрации цифровых изображений.

3-2-1.jpg 3-2-2.jpg
Исходное полутоновое изображение, $\sigma = 0$ Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 20$
3-2-3.jpg 3-2-4.jpg
Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 40$ Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 60$
3-2-5.jpg 3-2-6.jpg
Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 80$ Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 100$
3-2-7.jpg 3-2-8.jpg
Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 200$ Зашумление полутонового изображения аддитивным гауссовским шумом, $\sigma = 300$


$\textbf{Оконная фильтрация изображений в пространственной области}$. Исходя из задачи восстановления исходных значений яркости незашумленного изображения, а также из того, что шумовая компонента каждого пиксела является заранее не известной случайной величиной, следует, что для решения данной задачи необходимо использовать ту или иную процедуру $\textit{статистического оценивания}$. Это может быть Байесовское оценивание, оценивание по методу наибольшего правдоподобия или любой другой метод, известный из курса математической статистики. Однако все эти методы требуют использовать для оценки искомой величины не одно единственное измерение (ведь оно также может быть зашумлено), а большую или меньшую $\textit{статистическую выборку, }$всегда включающую несколько отсчетов, характеризующих данную величину. В связи с этим и основная идея помеховой фильтрации изображений заключается в том, что для оценки исходного значения каждого пиксела изображения используется не только значение самого данного пиксела (как в ранее рассмотренных градационных преобразованиях), но и значения еще нескольких близких к нему пикселов, попадающих в так называемое "$\it{окно}$" или $\it{апертуру}$ фильтра. При этом "близость" пикселов к оцениваемому понимается в буквальном геометрическом смысле.

Наиболее простыми для вычислительной реализации являются традиционно используемые $\textit{прямоугольные окна}$ (апертуры) фильтрации, определяемые простым условием типа "$\textit{все пикселы данного окна отстоят от тестируемого центрального пиксела на более чем на WinX/2 по горизонатали и WinY/2 по вертикали}$", где WinX и WinY - горизонтальный и вертикальный размер окна фильтрации соответственно. Возможны и другие, более сложные способы формирования окон фильтрации - круглой, треугольной или любой другой произвольной формы.

Типовая процедура оконной фильтрации предполагает, что окно фильтрации последовательно движется по $\textit{входному изображению}$ (например, алгоритм может обходить изображение "в порядке чтения": сверху вниз по строкам, слева направо в каждой строке), при этом в каждом положении окна происходит анализ всех пикселов, принадлежащих в данный момент окну, и на основе такого анализа центральному пикселу окна на $\textit{выходном изображении}$ присваивается то или иное финальное значение. Сформированное таким образом выходное изображение также называется $\textit{результатом фильтрации}$.

Процедуры оконной фильтрации могут различаться:


  1. размером и формой окна (апертуры);
  2. типом собираемых в окне локальных статистик;
  3. способом принятия решения на основе собранных статистик.

В любом случае, речь идет об использовании для оценивания значения центрального пиксела апертуры информации о значениях его соседей по изображению. В статистическом смысле это означает, что мы неявно опираемся на предположение о том, что на исходном незашумленном изображении значения яркостей всех этих соседних пикселов были одинаковыми или очень близкими, и наблюдаемые различия в их яркостях на зашумленном изображении определяются только присутствием шумовой компоненты, которую и необходимо исключить. Между тем, как мы уже видели, исследуя профили изображения, содержательное изображение вовсе не представляет собой одну сплошную "плоскость". В тех областях, которые визуально кажутся нам областями одинаковой или медленно меняющейся яркости, значения соседних пикселов действительно различаются незначительно. В то же время, на границах таких областей наблюдаются порой весьма резкие перепады яркости - разница значений составляет от десятков до сотен градаций интенсивности даже между непосредственно соседствующими пикселами. Таким образом, мы видим, что на границах однородных областей оконные фильтры не могут работать эффективно, напротив, здесь они с большой вероятностью будут ошибаться, что визуально приведет к эффекту $\textit{искажения формы контуров}$. Более того, если на исходном изображении присутствуют контрастные объекты (области), размер которых существенно меньше размера окна фильтрации, фильтр может просто "не заметить" такой объект, отфильтровать его как шум, что приведет к $\textit{исчезновению мелкоразмерных объектов}$ на результирующем выходном изображении.

Казалось бы, из предыдущих рассуждений вытекает необходимость работать с небольшими по размеру апертурами фильтров. Ведь чем меньше окно фильтра, тем меньшее число точек контура будет им "задето" и тем больше будет число точек, расположенных на "плато" однородных областей, для которых предположение о равной яркости всех пикселов в окружающей их области будет справедливо. Однако интуитивно понятно, что чем сильнее присутствующий на изображении шум (чем противоречивее и "лживее" в среднем свидетельства точек об их яркости), тем большее количество пикселов приходится опрашивать, чтобы добиться необходимой степени уверенности в ответе. То есть апертуры большего размера обладают большей способностью к подавлению шумовой компоненты, для чего в принципе и создается помеховый фильтр.

Таким образом, конструируя и исследуя оконные процедуры фильтрации изображений, мы всегда должны оценивать наблюдаемое $\textit{качество фильтрации}$ по двум следующим основным позициям:


  1. способность фильтра удалять (отфильтровывать) с изображения шум;
  2. способность фильтра сохранять на изображении мелкоразмерные детали и форму контуров.

С точки зрения последующего анализа изображения идеальным был бы такой помеховый фильтр, который мог бы полностью отфильтровывать шум, не искажая при этом формы контуров. К сожалению, эти требования противоречивы, поэтому в различных методах фильтрации мы имеем дело лишь с различными вариантами компромисса между ними. Выбор конкретного помехового фильтра для реализации в практической системе машинного зрения определяется тем, какое из требований является более важным в данной конкретной задаче, а также ограничениями, налагаемыми на систему архитектурой и скоростью имеющихся вычислительных средств.

Перейдем теперь к рассмотрению конкретных алгоритмов оконной фильтрации изображений. Поскольку принципиальный смысл основных процедур фильтрации проще почувствовать на примере фильтрации бинарных изображений, мы начнем с изучения простейших $\textit{бинарных фильтров}$.

Фильтрация бинарных изображений

$\textbf{Модель шума "соль и перец".}$ Выше мы уже говорили о том, что для бинарных изображений наиболее удобной и соответствующей природе изображения является модель шума замещения типа "соль и перец". Под шумом Salt-and-Pepper (соль и перец) на бинарном изображении понимают замещение $1$ на $0$ с вероятностью $p$ и замещение $0$ на $1$ c вероятностью $q$. Табл. 3.2.1 переходных вероятностей для такого бинарного шума имеет вид:

<center> {Переходные вероятности для бинарного шума "соль и перец"}

${\rm Im}[x,y]\to {\rm Im}^\prime[x,y]$ ${\rm Im}^\prime [x,y]=1$ ${\rm Im}^\prime [x,y]=0$
${\rm Im} [x,y]=1$ $1-p$ $p$
${\rm Im}[x,y]=0$ $q$ $1-q$


На рис. 10 - 16 показаны примеры искусственного зашумления исходного бинарного изображения лейкоцитов (рис. 9) специально сгенерированным шумом "соль и перец". Как видно, чем больше параметры зашумления $p$ и $q$, тем более искаженным выглядит изображение. При больших вероятностях замещения человеческий глаз уже с трудом различает общие очертания объектов изображения (рис. 15, 16).

3-2-9.jpg 3-2-10.jpg
Исходное изображение, $p=0, q=0$ Зашумление бинарного изображения шумом "соль и перец", $p=0{,}02$, $q=0{,}02$
3-2-11.jpg 3-2-12.jpg
Зашумление бинарного изображения шумом "соль и перец", $p=0{,}1$, $q=0{,}1$ Зашумление бинарного изображения шумом "соль и перец", $p=0{,}2$, $q=0{,}2$
3-2-13.jpg 3-2-14.jpg
Зашумление бинарного изображения шумом "соль и перец", $p=0{,}25$, $q=0{,}25$ Зашумление бинарного изображения шумом "соль и перец", $p=0{,}3$, $q=0{,}3$
3-2-15.jpg 3-2-16.jpg
Зашумление бинарного изображения шумом "соль и перец", $p=0{,}4$, $q=0{,}4$ Зашумление бинарного изображения шумом "соль и перец", $p=0{,}45$, $q=0{,}45$

$\textbf{Структура оконного фильтра.}$ Введем ряд определений и обозначений, позволяющих формально описать процедуру оконной фильтрации бинарного изображения.

$\textit{Входное изображение}$ $X[i,j]$ - массив $l\times k$ элементов $x_{ij}$ ($i=1,{\ldots},l$; $j=1,{\ldots},k)$ каждый из которых соответствует некоторой точке (пикселу) изображения и принимает значения $x_{ij} \in {\{}0,1{\}}$.

$\textit{Выходное изображение}$ $Y$[$i,j$] - массив $l\times k$ элементов $y_{ij}$ ($i=1,{\ldots},l$; $j$=1,{\ldots},$k)$ каждый из которых соответствует некоторой точке (пикселу) изображения и принимает значения $y_{ij} \in {\{}0,1{\}}$.

$\textit{ППР - правило принятия решения}$ - правило, по которому принимается решение о значении элемента выходного изображения $y_{ij}$ ($i=1,{\ldots},l$; $j=1,{\ldots},k)$.

$\it{Апертура}$ или $\textit{Окрестность}$ точки (пиксела) - множество пикселов изображения расположенное некоторым образом относительно базового пиксела.

$\it{Базовым}$ называется пиксел, для которого применяется ППР. Положение апертуры на изображении определяется координатами базового пиксела апертуры. Базовый пиксел может находиться и не в геометрическом центре апертуры. Апертура определяется как массив $d\times c$ элементов $\Omega _{ij}$ ($i=1,{\ldots},d$; $j=1,{\ldots},c)$, каждый из которых соответствует точке (пикселу) апретуры и принимает значения $\Omega _{ij} \in {\{}0,1{\}}$. Также, при определении апертуры, указываются координаты базового пиксела апертуры (горизонтальная координата $i\in \overline {1,d} $; вертикальная координата $j\in \overline {1,c} )$ относительно элемента апертуры с координатами $\left( {i=1; j=1} \right)$ (левый верхний угол массива $d\times c)$. Значение элемента апертуры, равное $0$, показывает, что данный пиксел не включен в апертуру, равное $1$ - что данный пиксел включен в апертуру.

Число элементов или размер апертуры обозначается $n$, $$ n=\sum\limits_{i=1}^d {\sum\limits_{j=1}^c {\Omega _{ij} } } . $$ Число единиц будем обозначать $k_1 $, число нулей - $k_0 $.



Апертура может иметь любую произвольную конфигурацию, например

$$\Omega _{ij} ={\begin{array}{*{20}c} 1 \hfill & 0 \hfill & 1 \hfill \\ 0 \hfill & 1 \hfill & 0 \hfill \\ 1 \hfill & 0 \hfill & 1 \hfill \\ \end{array} }.$$

Рассмотрим теперь, используя введенную терминологию, различные методы оконной фильтрации бинарных изображений.

$\textbf{Логическая фильтрация помех}$. Назовем \it{проколотой} окрестность, в которой базовый пиксел не учитывается при сборе статистики. В таблице 3.2.2 приведен пример проколотой окрестности $3\times 3$.

Пример проколотой окрестности $3\times 3$

\rowcolor[gray]{0.8}$(-1, -1)$ $(0, -1)$ $(1, -1)$
$(-1, 0)$ $(0, 0)$ $(1, 0)$
\rowcolor[gray]{0.8}$(-1, -1)$ $(0, -1)$ $(1, -1)$

Проколотая окрестность $3\times 3$ содержит $8$ пикселов, влияющих на принятие решения. При \it{логической} фильтрации помех решение принимается после опроса проколотой окрестности $\Omega _{ij} $ для каждого пиксела $y_{ij} $ следующим образом:

$$ y_{ij} = \begin{cases} 1, &\mbox{ если все пикселы в } \Omega _{ij} \mbox{ равны 1,} \cr 0,&\mbox{ если все пикселы в }\Omega _{ij} \mbox{ равны 0,} \cr x_{ij} , &\mbox{ в остальных случаях.} \end{cases} $$

Смысл этого выражения заключается в том, что если все соседние с центральным пикселы голосуют в пользу $0$, центральный пиксел устанавливается в $0$. Если все соседние пикселы голосуют в пользу $1$, центральный пиксел устанавливается в $1$. Если соседи не голосуют единогласно, центральный пиксел остается без изменений.

Такая фильтрация хорошо справляется с редкими одиночными (изолированными) пикселами-артефактами (как на рис. \refFigure{3_2_10}), но при более интенсивных шумах данный алгоритм оказывается практически бесполезен, так как изолированные белые и черные шумовые точки встречаются все реже. Для таких случаев требуется более мощное решающее правило.

$\textbf{Бинарная медианная фильтрация}$. \textit{Медианный фильтр} действует следующим образом. Пусть выбрана некоторая (чаще всего не проколотая) апертура $\Omega_{ij} $, содержащая нечетное число $n$ элементов. После опроса апертуры получаем $\left\{ {x^1,\ldots ,x^n} \right\}$ - последовательность из $n$ чисел. ППР для медианы заключается в том, что мы упорядочиваем элементы последовательности $\left\{{x^1,\ldots,x^n} \right\}$ в порядке возрастания и в качестве значения выхода $y_{ij} $ выбираем "средний по номеру" элемент упорядоченной последовательности $\left\{ {x^1,\ldots,x^n} \right\}$, то есть значение, стоящее на $\left( {\frac{n+1}{2}} \right)$ месте в упорядоченном списке значений входных пикселов.


Для \textit{бинарного медианного фильтра} мы получаем следующее ППР:

$$ y_{ij} = \begin{cases} 1, &\mbox{ если в апертуре }\Omega _{ij} \mbox{ больше единиц чем нулей}, \cr 0, &\mbox{ если в апертуре }\Omega _{ij} \mbox{ больше нулей чем единиц}. \end{cases} $$

На рис. 17 - 22 приводятся примеры фильтрации бинарного изображения с различными степенями зашумления медианным фильтром с размером окна $3\times 3$. Как видно, данный фильтр хорошо справляется со слабой и средней степенью зашумления (рис. 17 - 20), однако при дальнейшем увеличении мощности шума фильтр с апертурой $3\times 3$ начинает ошибаться (рис. 21, 22).

3-2-17.jpg 3-2-18.jpg
Слабая степень зашумления изображения Результат фильтрации исходного изображения медианой med $3\times 3$
3-2-19.jpg 3-2-20.jpg
Cредняя степень зашумления Результат фильтрации исходного изображения изображения med $3\times 3$
3-2-21.jpg 3-2-22.jpg
Сильная степень зашумления Результат фильтрации исходного изображения изображения med $3\times 3$
3-2-23.jpg 3-2-24.jpg
Высокая степень зашумления Результат фильтрации исходного изображения изображения медианой med $5\times 5$
3-2-25.jpg 3-2-26.jpg
Результат фильтрации изображения med $7\times 7$ Результат фильтрации изображения med $9\times 9$
3-2-27.jpg 3-2-28.jpg
Результат фильтрации изображения med 15$\times $15 Результат фильтрации изображения med 31$\times $31

Для подавления более интенсивных шумов необходимо использовать медианный фильтр с бoльшими размерами окна фильтрации. На рис. 24 - 28 приводятся примеры медианной фильтрации с различными размерами апертуры.


Как видно из рис. 24 - 26, с увеличением размера окна растет способность медианного фильтра подавлять шумовые точки. Однако при слишком больших размерах апертуры очертания объектов оказываются слишком сильно искажены (рис. 27, 28). Поэтому в каждом конкретном случае фильтры необходимо настраивать в зависимости от наблюдаемой степени искажений характерных размеров наблюдаемых объектов.


Рассмотрим еще раз $\it{медиану}$ как правило принятия решения в бинарном оконном фильтре, действующем на изображении в присутствии шума "соль и перец". Легко заметить, что такое правило принятия решения соответствует $\textit{максимуму апостериорной вероятности}$ в том случае, если

$$ p = q < 0,5. $$

Действительно, если в среднем инвертирование белых и черных элементов происходит с равной вероятностью (но не более 1/2), то в апертуре будет наблюдаться в среднем больше тех элементов, каких там и было больше до зашумления. Однако это не обязательно так, если вероятность перехода $0\to 1$ больше вероятности перехода $1\to 0$ или наоборот. В этом случае "средняя" ранговая оценка может оказаться неоптимальной.

$\textbf{Бинарная ранговая фильтрация.}$ Правило принятия решения для $\it{рангового}$ или $\it{процентильного}$ фильтра имеет вид, аналогичный ППР для медианного фильтра,

$$ y_{ij} =\left\{ {\begin{array}{l} 1,\mbox{ если число единиц в апертуре }\Omega _{ij} :k_1 \ge k; \\ 0,\mbox{ если число нулей в апертуре }\Omega _{ij} :k_0 \ge n+1-k; \\ \end{array}} \right. $$

где $k=\const$ - задаваемое значение, причем $0<k \leqslant n$.


Процентильные фильтры обозначаются $\left( {{k}/{n}} \right)_n $.

Легко заметить, что медианный фильтр есть частный случай процентильного $\left( {{k}/{n}} \right)_n $ при $k=\left( {\frac{n+1}{2}} \right)$.

В свете приведенных выше рассуждений ясно, что фильтрацию с более "низкими" рангами, чем медиана следует применять в том случае, если вероятность перехода $1\to 0$ существенно больше вероятности перехода $0\to 1$. С более "высокими" рангами следует работать в том случае, если вероятность перехода $0\to 1$ существенно больше вероятности перехода $1\to 0$. Предельным случаем такого "асимметричного" шума является $\it{униполярный}$ шум c параметрами ($p=0, q>0$) или ($q=0, p>0$). В этих случаях оптимальная ранговая фильтрация принимает вид $\it{максимального}$ или$\it{ минимального}$ фильтра соответственно.

$\textbf{Взвешенные ранговые фильтры.}$ Как уже говорилось, использование процентильных фильтров для подавления помех основано на предположении, что объекты (однородные области) на исходном изображении настолько велики, что число положений апертуры $\Omega _{ij} $, в которых она целиком (всеми пикселами) попадает на объект или также целиком на фон, намного больше числа "переходных состояний" (рис. 29).

3-2-29.jpg 3-2-30.jpg
Положение фильтра относительно объекта "Переходные состояния" фильтра на сцене вида "шахматная доска" (положение фильтра относительно объекта)

Если это предположение не выполняется (например, сцена имеет вид "шахматной доски" (рис. 30), то процентильная фильтрация приведет лишь к усилению помех (увеличению числа ошибок на сцене). Это связано с тем, что, подсчитывая число единиц и нулей в апертуре, мы как бы заранее предполагаем, что на исходной сцене (в неискаженном состоянии) все соседние пикселы в подавляющем большинстве случаев имели одинаковые значения. И поэтому число единиц воспринимается как число свидетельств в пользу предположения, что базовый пиксел до зашумления имел значение $1$, а число нулей - что его значение было $0$. Пусть, однако, нам известен только минимальный размер объектов и минимальное расстояние между ними. Повысить устойчивость фильтрации можно, придав более близким точкам окрестности большее влияние на окончательный результат, чем дальним. Это можно осуществить при помощи $\textit{матрицы весов}$. При этом значения каждого пиксела апертуры $x_{ij} $ при подсчете модифицированного числа единиц $k$ умножается на определенный вес

$$ k =\sum\limits_{x_{ij} \in \Omega } {q_{ij} x_{ij} } , $$

где $q_{ij} $ - весовые коэффициенты элементов апертуры (целые числа).

Модифицированный размер апертуры для взвешенного фильтра теперь имеет вид

$$ n=\sum\limits_{x_{ij} \in \Omega } {q_{ij} } . $$

ППР $\left( {k \mathord{\left/ {\vphantom {k n}} \right. \kern-\nulldelimiterspace} n} \right)_n $ для взвешенного процентильного фильтра практически эквивалентно прежнему с учетом новых значений $k $ и $n$. Приведем два возможных примера весовых матриц (1) и (2).

$$ \begin{gather}\label(3-2-1) {\begin{array}{*{20}c} 0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0 \hfill \\ 0 \hfill & 2 \hfill & 4 \hfill & 2 \hfill & 0 \hfill \\ 1 \hfill & 4 \hfill & 8 \hfill & 2 \hfill & 1 \hfill \\ 0 \hfill & 2 \hfill & 4 \hfill & 2 \hfill & 0 \hfill \\ 0 \hfill & 0 \hfill & 1 \hfill & 0 \hfill & 0, \hfill \\ \end{array} } \end{gather} $$ $$ begin{gather}\tag{1} {\begin{array}{*{20}c} 1 \hfill & 0 \hfill & 1 \hfill \\ 0 \hfill & 1 \hfill & 0 \hfill \\ 1 \hfill & 0 \hfill & 1. \hfill \\ \end{array} } \end{gather} $$ Матрица (1) реализует описанный выше принцип "штрафа за удаление". Общий размер апертуры в этом случае равен $n=36$. Матрица (2) является весовой матрицей типа "маска" (матрица весов состоит из нулей и единиц). Данная маска с $n=5$ позволяет фильтровать даже сцены типа "шахматная доска" (см. рис.30).

$\textbf{Анизотропная фильтрация.}$ Анизотропная фильтрация отличается от описанных ранее алгоритмов тем, что обладает инерционностью, т. е. "помнит" свои предыдущие состояния.

Пусть фиксированы параметры $n_1 $, $n_2 $ и $k_1 $, $k_2$ $\left( {0<k_1 \le n_1 ,\mbox{ }0<k_2 \le n_2 } \right)$. Введем переменную состояния $z$, принимающую значения $0$ и $1$.

ППР для анизотропного фильтра опишем как последовательность выполняемых операций для каждой строки $\left( {j= {1,\ldots, m} } \right)$.

\it{Шаг 0.} Присвоить $z:=0$; $i:=1$.

\it{Шаг 1.} Просмотреть $n_2 $ элементов строки, начиная с элемента $x_{ij} $. Если число единиц среди них превышает $k_2 $, то $z:=1$.

\it{Шаг 2. }Просмотреть $n_1 $ элементов строки, начиная с элемента $x_{ij} $. Если число нулей среди них превышает $k_1 $, то $z:=0$.

\it{Шаг 3.} Принять решение $y_{ij} :=z$.

\it{Шаг 4.} $i:=i+1$. Перейти к шагу $1$, если строка еще не окончена.

Таким образом, состояние (а следовательно, и выход этого фильтра) изменится только в том случае, если будет принято решение $\left( {{k_2 } \mathord{\left/ {\vphantom {{k_2 } {n_2 }}} \right. \kern-\nulldelimiterspace} {n_2 }} \right)_\infty $ по единице или решение $\left( {{k_1 } \mathord{\left/ {\vphantom {{k_1 } {n_1 }}} \right. \kern-\nulldelimiterspace} {n_1 }} \right)_\infty $ по нулю. Индекс $\infty $, в отличие от $n$, в процентильных фильтрах означает, что память о принятом однажды решении может сохранятся бесконечно долго, если не встретится таких положений, в которых будет принято противоположное решение). Этот фильтр применяется только для помеховой фильтрации изображений.

\textbf{Расширение - сжатие (простая морфология).} \it{Расширением} называется итеративно применяемый к бинарному изображению максимальный фильтр с квадратной апертурой размера $3\times 3$ пиксела. Соответственно, \it{сжатием} называется итеративно применяемый минимальный фильтр с той же апертурой $3\times 3$. Параметром, определяющим свойства фильтрации, при этом считается \it{количество циклов} сжатия и расширения.

Фильтрация типа расширение - сжатие может применяться для удаления слабого шума типа соль - перец, однако в этом качестве она уступает медианной фильтрации. Однако основная область применения таких фильтров - удаление сложных неслучайных искажений формы фигур. Недаром изначально такой прием фильтрации был предложен для выявления дефектов типа "разрывов" и "перемычек" металлических дорожек на изображениях печатных плат в задачах технического и технологического контроля.

Рассмотрим геометрический смысл операций расширения и сжатия на примере обработки искусственного изображения (рис. \refFigure{3_2_31}), на котором представлен прямоугольный объект, имеющий "дефекты формы" типа внутренних "дырок" и внешних "выступов". Попробуем средствами расширения-сжатия удалить эти дефекты формы объекта.

Начнем с удаления внешних "выступов" формы. Для этого используется последовательность операций \it{расширение - сжатие}. На первом этапе этой процедуры выполняется операция расширения светлого фона (т. е. сжатия темного объекта) с таким числом циклов, которое полностью удаляет ("съедает") внешние "выступы" формы. \cFigure {Изображение с "дефектами" типа "дырок" и "выступов"}3_2_31 {6.5cm}{4.34cm}{PIC/pic3_2_31.eps} Однако внешний размер объекта при этом уменьшается, а внутренние дефекты, напротив, увеличиваются в размерах, в связи с чем после этого необходимо выполнить сжатие фона (т. е. расширение объекта) с тем же числом циклов. В результате выполнения обоих этапов операции расширения - сжатия внешние размеры и форма объекта оказываются полностью восстановлены, но внутренние дефекты формы сохраняются (рис. \refFigure{3_2_32}, \refFigure{3_2_33}).


Рассмотрим теперь аналогичную технику удаления внутренних дефектов формы ("дырок"). Для этого используется обратный порядок операций: \it{сжатие - расширение}. На первом этапе этой процедуры выполняется операция сжатия фона (т. е. расширения объекта) необходимым числом циклов, которое удаляет ("заращивает") внутренние "дыры" и "каналы". Однако внешний размер объекта при этом увеличивается, внешние дефекты, также увеличиваются в размерах, в связи с чем после этого необходимо выполнить расширение фона (сжатие объекта) с тем же числом циклов. В результате выполнения всей операции сжатия-расширения в целом размеры и внутренняя целостность объекта оказываются восстановлены, но внешние дефекты формы сохраняются (рис. \refFigure{3_2_34}, \refFigure{3_2_35}).

\begin{cFigures} \Figure {Результат сжатия объекта}3_2_32 [t]{6.5cm}{3.0cm}{PIC/pic3_2_32.eps}\quad \Figure {Результат расширения после сжатия объекта (удаление внешних "выступов" \linebreak формы)}3_2_33 [t]{6.5cm}{3.0cm}{PIC/pic3_2_33.eps} \end{cFigures} \begin{cFigures} \Figure {Результат расширения объекта}3_2_34 [t]{6.5cm}{4.72cm}{PIC/pic3_2_34.eps}\quad \Figure {Результат сжатия после расширения объекта (удаление внутренних "дырок" \linebreak формы)}3_2_35 [t]{6.5cm}{4.72cm}{PIC/pic3_2_35.eps} \end{cFigures} \begin{cFigures} \Figure {Результат рас\-ши\-ре\-ния - сжатия}3_2_36 [t]{6.5cm}{2.98cm}{PIC/pic3_2_36.eps}\quad \Figure {Результат сжатия - рас\-ширения после расширения - сжатия (полное восстановление формы)}3_2_37 [t]{6.5cm}{2.98cm}{PIC/pic3_2_37.eps} \end{cFigures}



Для того чтобы устранить и внешние, и внутренние дефекты формы в данном примере, необходимо сначала применить к исходному изображению (рис. \refFigure{3_2_31}) расширение - сжатие, а затем к результату этой операции - сжатие - расширение с тем же числом циклов (рис. \refFigure{3_2_36}, \refFigure{3_2_37}).



Операции расширения - сжатия представляют собой простейший эвристический вариант операций \it{математической морфологии} (Серра), которая будет подробно рассматриваться в главе 6 данной книги.

\textbf{Стирание бахромы}. Данный фильтр также является морфологическим в том смысле, что он направлен не на удаление произвольного случайного шума, а на удаление неких формозависимых искажений, определяемых заданной моделью. Алгоритм осуществляет стирание бахромы, т. е. неровностей границ объекта, которые мешают его распознаванию по контурному признаку. Суть алгоритма заключается в последовательном стирании крайних элементов.

Пусть в качестве апертуры выбрана окрестность второго порядка:

\begin{center} \includegraphics[width=3.52cm,height=1.44cm]{PIC/pic3_2_37after.eps} \end{center}

Введем понятие крайнего верхнего пиксела.

Крайним верхним пикселом будем называть такой пиксел $X_{ij} $, в апертуре $\Omega _{ij} $ которого наблюдаются следующие сочетания:

\begin{center} а) UNIQ7c01194c4f7483f-MathJax-253-QINU б) UNIQ7c01194c4f7483f-MathJax-254-QINU в) UNIQ7c01194c4f7483f-MathJax-255-QINU г) UNIQ7c01194c4f7483f-MathJax-256-QINU д) UNIQ7c01194c4f7483f-MathJax-257-QINU е) UNIQ7c01194c4f7483f-MathJax-258-QINU \end{center} (а) - е) - фрагменты изображения, $0$ - элемент фона, $1$ - элемент изображения).

С помощью поворота матриц а) - е) на $90\degree$, $180\degree$, $270\degree$ мы получим определение соответственно крайних левого нижнего и правого пикселов.

Все краевые пикселы стираются при фильтрации. Стираются также изолированные пикселы, не имеющие соседних пикселов в апертуре:

\begin{center} ж) UNIQ7c01194c4f7483f-MathJax-264-QINU \end{center}

\noindent Остальные (пикселы, не являющиеся крайними или изолированными) переносятся на отфильтрованное изображение без изменения.

По аналогии с описанным стиранием бахромы из единиц можно ввести стирание бахромы из нулей. При этом "краевые нули", апертуры которых соответствуют матрицам а) - ж) с заменой единиц на нули и нулей на единицы, "стираются", т. е. замещаются единицами.

Наконец, можно определить алгоритм комбинированного стирания бахромы: и по единицам (по объекту) и по нулям (по фону) одновременно. Стирание бахромы используется как предварительная обработка перед оконтуриванием. Комбинированное стирание бахромы может быть использовано также для подавления помех без искажения контуров.

\Section{Нелинейная фильтрация полутоновых изображений} Алгоритмы нелинейной оконной фильтрации полутоновых изображений делятся на две большие группы: нелинейные ранговые и морфологические фильтры. Ранговая фильтрация рассматривается в данном разделе. Морфологические фильтры будут подробно описаны в гл. 6.\looseness=-1

\textbf{Ранговая оконная фильтрация.} Нелинейная ранговая фильтрация является непосредственным обобщением бинарной ранговой фильтрации и опирается на понятие \it{порядковой статистики}. Вокруг каждого элемента изображения выбирается окрестность, входящие в нее элементы изображения упорядочиваются по возрастанию яркости. \it{Ранговый фильтр} порядка $r$ ($1 \le r \le N$, где $N$ - число отсчетов в окрестности) выбирает из полученного ряда элемент с номером $r$ и присваивает его значение исходному элементу изображения. Когда число $N$ нечетное и $r = ( N+1 ) /2 $, то фильтр называется \it{медианным}. Медианный фильтр имеет важное значение в обработке изображений вследствие высокой \it{робастности}, то есть нечувствительности результатов фильтрации к плотности распределения (первого порядка) шумовой компоненты. Это связано с тем, что медианный фильтр с апертурой площадью $2M + 1$ эффективно подавляет локальные области площадью менее $M$ пикселов. В то же время, при фильтрации контрастных крупноразмерных объектов медианный фильтр не размывает и не смещает их края (точки перепада яркости).

Рассмотрим примеры ранговой полутоновой фильтрации по аналогии с тем, как ранее были рассмотрены примеры ранговой бинарной фильтрации. Изображения зашумлены гауссовским аддитивным шумом (см. рис. \refFigure{3_2_2} - \refFigure{3_2_8}).

На рис. \refFigure{3_2_38} - \refFigure{3_2_43} приводятся примеры фильтрации полутонового изображения с различными степенями зашумления медианным фильтром с размером окна 3$\times $3. Как видно, данный фильтр хорошо справляется со слабой и средней степенью зашумления (рис. \refFigure{3_2_38} - \refFigure{3_2_42}), однако при дальнейшем увеличении мощности шума фильтр с апертурой $3\times 3$ начинает ошибаться (рис. \refFigure{3_2_44}, \refFigure{3_2_43}).

Для подавления более интенсивных шумов необходимо использовать медианный фильтр с б {о}льшими размерами окна фильтрации. На рис. \refFigure{3_2_44} - \refFigure{3_2_49} приводятся примеры медианной фильтрации с различными размерами апертуры.\looseness=1

\begin{cFigures} \Figure {Слабая степень зашумления исходного изображения}3_2_38 [t]{4.6cm}{4.6cm}{PIC/pic3_2_38.eps}\quad \Figure {Результат фильтрации медианой med UNIQ7c01194c4f7483f-MathJax-275-QINU}3_2_39 [t]{4.6cm}{4.6cm}{PIC/pic3_2_39.eps} \end{cFigures}


{Как видно из рис. \refFigure{3_2_45} - \refFigure{3_2_47}, с увеличением размера окна растет способность медианного фильтра подавлять шумовую компоненту. Однако при слишком больших размерах апертуры (рис. \refFigure{3_2_48}, \refFigure{3_2_49}), как и в случае бинарной фильтрации, очертания объектов оказываются слишком сильно искажены. Кроме того, меньшие по размеру объекты оказываются целиком удалены с изображения. Поэтому в каждом конкретном случае фильтры необходимо настраивать в зависимости от наблюдаемой степени искажений характерных размеров наблюдаемых объектов.\parfillskip=0pt

}


\begin{cFigures} \Figure {Средняя степень зашумления исходного изображения}3_2_40 [t]{4.6cm}{4.6cm}{PIC/pic3_2_40.eps}\quad \Figure {Результат фильтрации med UNIQ7c01194c4f7483f-MathJax-276-QINU}3_2_41 [t]{4.6cm}{4.6cm}{PIC/pic3_2_41.eps} \end{cFigures} \begin{cFigures} \Figure {Сильная степень зашумления исходного изображения}3_2_42 [t]{4.6cm}{4.6cm}{PIC/pic3_2_42.eps}\quad \Figure {Результат фильтрации med UNIQ7c01194c4f7483f-MathJax-277-QINU}3_2_43 [t]{4.6cm}{4.6cm}{PIC/pic3_2_43.eps} \end{cFigures} \begin{cFigures} \Figure {Зашумленное изображение}3_2_44 [t]{4.5cm}{4.5cm}{PIC/pic3_2_44.eps}\quad \Figure {Результат медианной фильтрации med UNIQ7c01194c4f7483f-MathJax-278-QINU}3_2_45 [t]{4.5cm}{4.5cm}{PIC/pic3_2_45.eps} \end{cFigures}

\begin{cFigures} \Figure {Результат медианной фильтрации med UNIQ7c01194c4f7483f-MathJax-279-QINU}3_2_46 [t]{4.5cm}{4.5cm}{PIC/pic3_2_46.eps}\quad \Figure {Результат медианной фильтрации med UNIQ7c01194c4f7483f-MathJax-280-QINU}3_2_47 [t]{4.5cm}{4.5cm}{PIC/pic3_2_47.eps} \end{cFigures} \begin{cFigures} \Figure {Результат медианной фильтрации med UNIQ7c01194c4f7483f-MathJax-281-QINU}3_2_48 [t]{4.5cm}{4.5cm}{PIC/pic3_2_48.eps}\quad \Figure {Результат медианной фильтрации med UNIQ7c01194c4f7483f-MathJax-282-QINU}3_2_49 [t]{4.5cm}{4.5cm}{PIC/pic3_2_49.eps} \end{cFigures}


Имеется значительное число обобщений и модификаций процедур нелинейной ранговой обработки. Введем необходимые понятия для их краткого описания в соответствии с терминологией, предложенной в работе [$164$]:

$\langle i,j \rangle$ - координаты текущего пиксела на изображении;

$f_{ij }\in [0, Q-1]$ - дискретное значение яркости изображения $f(i,j)$ в точке $\langle i,j \rangle$;


$Q$ - число уровней яркости;

\it{$S$-окрестность} элемента $\langle i,j \rangle$ - заданное определенным образом множество элементов изображения, окружающих "центральный" элемент $\langle i,j\rangle$ (форма апертуры). Примеры типичных S-окрестностей: квадрат, прямоугольник, крест, окружность и т. п.;

\it{$M$-окрестность} - подмножество элементов S-окрестности, обладающих каким-либо нужным свойством, например, подмножество отсчетов, превышающих заданный порог и др.;

$N_m$ - число элементов M-окрестности;

$f_{m}(r)$ - $r$-я порядковая статистика по M-окрестности;

${\rm MEAN (M)} = \frac{1}{N_m }\sum\limits_{i,j\in \textrm{M}} {f_{i,j} } $ - среднее арифметическое значение элементов M-окрестности;

${\rm MED(M)} = f_{m} (\left[ (N_m + 1)/2\right])$ - медиана элементов M-окрестности.

Наиболее важные типы M-окрестности:

\it{KSN-окрестность} состоит из $k$ элементов, ближайших по какой-либо метрике на растре к заданному элементу;

\it{KNV-окрестность} из $k$ ближайших соседей к данному элементу по значению сигнала;

\it{EV-окрестность}: ${\rm EV}(f) = \{f_{s}(k): f_{ij} - \epsilon _{v} \le k \le f_{ij} + \epsilon _{v}\}$;

и \it{ER-окрестность:} ${\rm ER}(f) = \{f_{s}(k): r_{m}(f_{ij}) - r_{r} \le k \le r_{m}(f_{ij}) + r_{r}\}$,

где $f_{s}(k)$ - элемент S-окрестности точки $\langle i,j\rangle$ со значением яркости $k$; $r_{m}(f)$ - ранг элементов $f$ в вариационном ряду M-окрестности.

Введем модель импульсного шума замещения в виде $$f_{ij}^\prime = f_{ij} \delta _{ij} + (1 - \delta_{ij}) f^{k}_{ij},$$ где $\delta _{ij}$ - случайная величина, принимающая значения 0 или 1 с вероятностью $p$ и характеризующая наличие ($\delta = 0$) или отсутствие ($\delta = 1$) сбоя сигнала.

Можно показать, что для этой модели шума строгая постановка задачи оптимального сглаживания по методу максимального правдоподобия приводит к итеративной (с номером итерации $t=0,1,{\ldots}$) процедуре фильтрации вида $$ f^{(t+1)} = {\rm MEAN(EV}(f^{ (t)})) $$ или $$ f^{(t+1)} = {\rm MED (EV}(f^{ (t)})) $$ в зависимости от выбора статистики сигнала (гауссовская или лапласовская).

С точки зрения задачи подавления шума без потери формы сигнала критерии оптимальности можно определить следующим образом. Ранговым алгоритмам, использующим EV-окрестности, соответствует критерий максимального подавления шума при уровне смаза, не превышающем заданного, а ранговым алгоритмам, использующим KNV-окрестность - критерий минимума смаза при заданном уровне подавления шума. Возможность выбора KNV-окрестности позволяет учесть априорную информацию о геометрических размерах деталей изображения, которые необходимо сохранить; в свою очередь, выбор EV-окрестности позволяет учитывать априорную информацию о дисперсии шума, который должен быть устранен.

К числу нелинейных ранговых фильтров относятся многие известные алгоритмы, в частности \it{сигма-фильтр} [$50$], [$164$] $$ f^{\prime}_{ij} = {\rm MEAN(EV}(f_{ij})), $$ где $\epsilon _{v} = 1,5\sigma $, а $\sigma $ - параметр СКО локальной статистики окна обработки, и \it{сигма-медианный} фильтр $$ f^{\prime}_{ij}= {\rm MED(EV(}f_{ij})), $$ причем, вообще говоря, отсечение отсчетов для усреднения может происходить на любом уровне значимости $\alpha $: $\epsilon _{v}=\alpha \sigma $. Таким образом, эти формулы охватывают случай $\alpha $ - \it{усеченных фильтров} [$164$].

Эффективной разновидностью ранговых алгоритмов сглаживания является так называемый \it{SNN-алгоритм}. В этом алгоритме может быть применена любая схема сигма-фильтрации. Однако выбор M-окрестности обработки ведется, исходя из геометрических соображений, таким способом, что усредняемые отсчеты не могли в силу геометрических свойств апертуры находиться по разные стороны от границы возможного перепада яркости (края).

Заканчивая краткий обзор методов нелинейной ранговой фильтрации, можно отметить, что этот класс алгоритмов имеет высокую способность к подавлению шумовой компоненты, устойчив к различным видам шумов, допускает параллельную обработку информации и быстрые алгоритмы реализации.

\textbf{"Быстрые" алгоритмы оконной фильтрации.} Ключевая идея ускорения вычислений при пространственной фильтрации изображений заключается в использовании метода скользящего окна, аналогичного известному методу вычисления "скользящих сумм", описанному, например Хуангом [47]. Суть этого метода заключается в хранении предвычисленных статистик по столбцам окна с последующим рекуррентным вычитанием статистик "уходящих столбцов" и добавлением в общую статистику статистик "приходящих" столбцов по ходу движения скользящего окна вдоль строки изображения.

Рассмотрим этот метод на примере вычисления скользящего среднего арифметического элементов S-окрестности (окна) $\Omega $ согласно следующей формуле: $$ s_l (x_l ,y_l )=\sum\limits_{x=-a}^a {\sum\limits_{y=-b}^b {g_l (x_l +x, y_l +y)} } ,\quad (x_l ,y_l )\in \Omega . $$ Непосредственное вычисление среднего в каждом положении окна на изображении потребует порядка ${abLN}$ операций, где $a \times b$ - размеры окна, $N\times L$ - размеры изображения.

Введем теперь дополнительный массив для хранения сумм элементов столбцов, принадлежащих текущему окну: $$ sum(i)=\sum\limits_{y=-b}^b {g_l (x_l +x_i , y_l +y)}, \quad i=0,\ldots, 2a . $$ Тогда по мере сдвига окна вправо по строке для перевычисления суммы элементов окна достаточно всего лишь одного сложения и одного вычитания элементов из $sum(i)$ (см. рис. \refFigure{3_dop})

\cFigure {Алгоритм вычисления скользящей суммы с опорой на два столбца}3_dop {7.64cm}{4.71cm}{PIC/pic3_dop.eps}

Вычислительная сложность такой операции будет порядка $\textit{bLN}$, то есть в $a$ раз меньше, чем раньше.

Аналогичным образом можно осуществить и $\textit{вычисление ранговых статистик}$ (например, $\textit{медианы)}$ в скользящем окне. Алгоритм имеет следующий вид.

  1. В крайнем левом положении окна в строке собрать гистограмму элементов

окна и вычислить значение медианы.

  1. Сместить окно на один пиксел вправо.
  2. Обновить гистограмму: декрементировать значения ячеек, соответствующие

"уходящему" столбцу окна, инкрементировать значения ячеек, соответствующие "приходящему" столбцу окна.

  1. Обновить значение медианы, двигаясь по гистограмме из предыдущего

положения до тех пор, пока сумма элементов справа не окажется больше или равна сумме элементов слева.


При этом выигрыш во времени вычислений получается не только за счет того, что исключается многократный опрос одних и тех же элементов окна, но и за счет того, что исключается этап сортировки значений яркости в окне (так как гистограмма и представляет собой уже упорядоченный массив значений яркости).

\textbf{Минимаксная фильтрация.} Наряду с медианными фильтрами широко применяется метод минимаксной фильтрации, использующий для обработки значения минимального и максимального элементов вариационного ряда, построенного из отсчетов окна фильтра. При наличии униполярного импульсного шума, характеризующегося либо положительными, либо отрицательными выбросами из среднего уровня фоновой составляющей, медианный фильтр может оказаться недостаточно надежным, когда плотность шума высока и более половины пикселов окна обработки составляют выбросы одинаковой полярности. Очевидный выход из этой ситуации - использовать элемент минимального ранга для выбросов положительной полярности и элемент максимального ранга для выбросов отрицательной полярности. В этом случае шумовые импульсы удаляются даже при очень сильном уровне засоренности. В то же время отдельное применение минимального и максимального фильтра во многом аналогично действию операций сжатия и расширения, рассмотренных выше, и приводят к искажению формы сигнала объекта. Поэтому с целью сохранения формы полезного сигнала целесообразна последовательная схема минимаксной фильтрации, состоящая из двух проходов по изображению и обработки сначала минимальным (максимальным), а затем максимальным (минимальным) рангом локальной статистики, что увеличивает эффективность фильтрации и в случае биполярного импульсного шума. Оптимальная последовательность, в которой следует выбирать минимальную (максимальную) процедуру, определяется характеристиками входного изображения: если неискаженное изображение состоит из ярких объектов на темном фоне, то правильная последовательность min-max. Обратная процедура справедлива для негативного изображения.


Сравнение минимаксной фильтрации с медианной может вестись в двух направлениях: эффективности результатов фильтрации и требуемых вычислительных затрат. При удалении шума минимаксный фильтр требует меньших размеров апертур фильтра, чем медианный, но зато выполняет обработку в два прохода (медианный за один). Однако сложность построения ранговой статистики растет сверхлинейно с размером апертуры, ввиду этого минимаксный фильтр в вычислительном аспекте представляется более предпочтительным. Учитывая, что при организации процедуры фоновой нормализации удаление сигнала от объекта требует для минимаксного фильтра меньших размеров апертуры, чем для медианного (примерно вдвое), данный тип фильтра может обеспечить б ольшую надежность нормализации при одних и тех же вычислительных затратах или меньшую вычислительную нагрузку при одинаковом уровне надежности. Недостаток минимаксного фильтра проявляется при обработке биполярного импульсного шума, где он не дает какого-либо выигрыша по сравнению с медианным фильтром, и, кроме того, процедура нормализации фона остается недостаточно эффективной вследствие того, что ранговая обработка, хотя и в меньшей степени, чем линейная, - но все же искажает яркостно-геометрические свойства фона при больших размерах апертуры.\looseness=-1

\Section{Задача выделения объектов интереса} Традиционные схемы обнаружения мелко- и среднеразмерных объектов на изображениях заключались в проведении первоначальной яркостной сегментации анализируемого изображения с целью установления "области интереса", ограничивающей объект изображения, а затем использовании различных признаковых описаний формы объекта для соотнесения найденных значений признаков с их эталонными значениями [$20$], [$24$], [$28$], [$146$]. Различные системы подобных признаков будут рассмотрены нами позднее.

К сожалению, при усложнении состава сцены, условий наблюдения и увеличении шумовой компоненты для таких методов наблюдается существенный рост вероятности аномальных ошибок обнаружения. Особенно это относится к простым схемам яркостной сегментации по порогу, которые обычно использовались при обнаружении области интереса или "носителя" объекта. Однако использование методов нелинейной фильтрации непосредственно на этапе сегментации изображения позволяет разительно повысить эффективность процедур выделения мелко- и среднеразмерных объектов на цифровых изображениях.

\textbf{Бинарные фильтры для выделения объектов}.

\so {Сгущение}. Пусть выбрана апертура $\Omega _{ij} $. Определим некоторый фиксированный параметр $N (0<N\le n)$, где $n$ - число пикселов в апертуре $\Omega _{ij} $ (размер апертуры). Введем следующее ППР:

1) заполнить единицами всю апертуру, если число единиц в $\Omega _{ij} : k_1 \ge N$;

2) заполнить нулями всю апертуру, если число единиц в $\Omega _{ij} : k_1 <N$.

В зависимости от выбираемой формы $\Omega _{ij} $, величины апертуры $n$ и выбора параметра сгущения $N$ этот фильтр может служить и для подавления помех, и для поиска небольших объектов непосредственно в зашумленных (неотфильтрованных предварительно) сценах.

\so{Селекция с восстановлением}. Этот алгоритм есть в некотором смысле аналог алгоритма логической фильтрации для выхода, формируемого, как в предыдущем случае ("сгущение"). Пусть выбрана апертура $\Omega _{ij} $ и фиксированы два параметра селекции: верхнее граничное значение $N_2 $ $\left( {N_1 \le N_2 <n} \right)$ и нижнее граничное значение $N_1 $ $\left( {0<N_1 \le N_2 } \right)$.

Пусть число единиц в апертуре $\Omega _{ij} $ равно $k_1 $. ППР этого фильтра имеет следующий вид:

1) заполнить единицами всю апертуру, если $k_1 \ge N_2 $;

2) заполнить нулями всю апертуру, если $k_1 <N_1 $;

3) перенести на отфильтрованное изображение все пикселы апертуры без изменений, если $N_1 \le k_1 <N_2 $.

Этот фильтр может одновременно выполнять и функцию подавления помех, и функцию обнаружения мелкоразмерных объектов.

\so{Селекция по площади}. Этот алгоритм напоминает предыдущий, однако имеет совершенно иное назначение.

Пусть определены $\Omega _{ij} $ размера $n$ и параметры $N_1 $ и $N_2 $ $\left( {0<N_1 <N_2 \le n} \right)$. ППР имеет вид:

1) заполнить апертуру единицами, если $N_1 \le k_1 <N_2 $;

2) заполнить апертуру нулями, если $\left( {k_1 <N_1 } \right) \vee \left( {k_1 \ge N_2 } \right)$.

Этот фильтр предназначен только для обнаружения мелкоразмерных объектов, а также при определенном выборе $\Omega _{ij} $, $N_1 $ и $N_2 $ способен выделять контуры крупных объектов на изображении. Для помеховой фильтрации не применяется.

\so{Пеленг}. Одной из важнейших характеристик фильтров является их быстродействие. Очевидно, что время работы фильтра пропорционально числу опрашиваемых элементов, т. е. размеру апертуры. Предположим, что нужно обнаружить на изображении некоторый объект значительных размеров. Можно сделать это, например, при помощи сгущения с соответствующей апертурой $\Omega $ и значением $N$ или аналогично с помощью селекции с восстановлением или селекции по площади. Однако размер апертуры $n$ в этом случае будет пропорционален не линейному размеру искомого объекта, а его квадрату (рис. \refFigure{3_2_50}).

\cFigure {Принцип действия фильтра "пеленг"}3_2_50 {7.69cm}{4.66cm}{PIC/pic3_2_50.eps}

Наиболее простое решение заключается в следующем. Выделим несколько характерных направлений $l_1, \ldots , l_p $, по которым искомый объект обладает наибольшей протяженностью, и расположим вдоль этих направлений $p$ линейных апертур соответствующей длины $n_1,\ldots , n_p $. Теперь для обнаружения объекта достаточно объявить частные решения по каждой из апертур.

В данной реализации фильтра выбраны четыре направления, два - параллельные осям $i$ и $j$ (направления $l_1 $ и $l_2 )$, и два - вдоль направлений под $45^{\circ}$ к осям $i$ и $j$ (направления $l_3 $ и $l_4 )$, как показано на рис. \refFigure{3_2_50}\it{б}. Пусть длина апертуры по направлению $l_1 $ равна $n_1 $, по направлению $l_2 $ равна $n_2 $, по направлению $l_3 $ равна $n_3 $ и по направлению $l_4 $ равна $n_4 $. Пусть фиксированы также $k_1 $, $k_2 $, $k_3 $, $k_4 $ ($0<k_1 \le n_1$, $0<k_2 \le n_2 $, $0<k_3 \le n_3 ,$ $0<k_4 \le n_4$). Тогда для пеленгующего фильтра ППР примет вид\looseness=-1 $$ y_{ij} = \begin{cases} 1, & \mbox{если} \cr \quad & \mbox{ (число единиц в апертуре }n_1 \ge k_1 ) \wedge \cr \quad & \wedge \mbox{ (число единиц в апертуре }n_2 \ge k_2 ) \wedge \cr \quad & \wedge \mbox{ (число единиц в апертуре }n_3 \ge k_3 ) \wedge \cr \quad & \wedge \mbox{ (число единиц в апертуре }n_4 \ge k_4 ); \cr 0,& \mbox{если не выполняется предыдущее условие}. \end{cases} $$

Согласно с ППР, если найден объект на обрабатываемом изображении, то на выходном изображении устанавливается в "1" только лишь один пиксел, соответствующий базовому пикселу (комбинированной апертуры) на обрабатываемом изображении.

Таким образом, пеленг в каком-то смысле является логической комбинацией процентильных фильтров. Возможны и другие варианты таких логических комбинаций.

\so{Пеленг с окаймлением}. Этот алгоритм служит для случая, когда на изображении могут присутствовать объекты еще большего размера, чем искомый. Тогда пеленгующий фильтр сработает во всех точках объектов (не являющихся искомыми), таких что его апертуры целиком поместятся на объекте (рис. \refFigure{3_2_51}).

Поэтому необходимо добавить еще одно условие, которое ограничивало бы размер обнаруживаемого объекта сверху. Эта можно сделать, добавив в ППР еще один процентильный фильтр, но с решением по нулю для апертуры в виде описанной рамки-окаймления, как это сделано на рис. \refFigure{3_2_51}\it{б}. Пусть фиксировано $k_{\textrm{ок}} $ $\left( {0<k_{\textrm {ок}} \le n_{\textrm{ок}} } \right)$, $n_{\textrm{ок}} $ - число пикселов в окаймлении. ППР для пеленга с окаймлением будет иметь вид\looseness=-1 $$y_{ij} = \begin{cases} 1,&{ \textrm {если} }\left( {\textrm {сработал пеленг}} \right)\wedge \left( {\textrm {число нулей в окаймлении }k_0 \ge n_{\textrm{ок}} +1-k_{\textrm{ок}} } \right); \cr 0,&{ \textrm {в противном случае}}. \end{cases} $$ Пеленг с окаймлением гарантирует, что обнаруженный на зашумленном изображении объект является изолированным объектом, а не частью большего поля единиц.

\cFigure {Принцип действия фильтра "пеленг с окаймлением"}3_2_51 {7.2cm}{3.96cm}{PIC/pic3_2_51.eps}

\textbf{Метод нормализации фона.} Метод \it{нормализации фона} был разработан для обнаружения малоразмерных объектов на полутоновых изображениях в составе сложных сцен и в присутствии интенсивных шумов. Он основан на использовании \it{селектирующих} свойств нелинейных оконных фильтров [164].

Как уже упоминалось выше, медианный фильтр с апертурой площадью $2M + 1$ эффективно подавляет локальные области с линейным площадью менее $M$ пикселов. Таким образом, возникает чрезвычайно важная практическая возможность комбинированной обработки при обнаружении малых площадных объектов, заключающаяся в устранении как импульсного шума, так и неоднородного фона за счет применения сочетания медианных фильтров разного размера апертуры (рис. \refFigure{3_2_52}).

На первом шаге здесь применяется обработка фильтром малой апертуры \linebreak \mbox{($3\times 3 ) \div ( 5 \times 5$)} для устранения импульсного шума. Затем осуществляется обработка фильтром большой размерности (например $35\times 35$), оставляющая на изображении только фон и подавляющая полезный сигнал от объекта. На завершающем этапе производится вычитание из изображения, полученного на первом шаге, карты фона, полученной на втором шаге. Таким образом, окончательное обнаружение объекта сводится к хорошо изученным процедурам сегментации по яркости. Данный прием получил в теории название \it{нормализации фона} и позволяет обеспечить обнаружение сигнала от объекта даже при очень малых соотношениях сигнал/шум ($<1$), однако его практическое применение сдерживается необходимостью достижения высокой производительности вычислительной техники, так как требуемый объем операций растет пропорционально квадрату размера апертуры.

Как видно из примера рис. \refFigure{3_2_53} - \refFigure{3_2_55}, в зависимости от того, какую последовательность фильтров мы выберем, метод нормализации фона может выделять объекты "положительного" или "отрицательного" контраста.

\cFigure {Выделение объектов по схеме "нормализация фона"}3_2_52 {7.44cm}{10.8cm}{PIC/pic3_2_52.eps}

\begin{cFigures} \Figure {Исходное изображение}3_2_53 [t]{4.2cm}{4.2cm}{PIC/pic3_2_53.eps}\quad \Figure {Результат нормализации фона с параметрами (UNIQ7c01194c4f7483f-MathJax-401-QINU)}3_2_54 [t]{4.2cm}{4.2cm}{PIC/pic3_2_54.eps}\quad \Figure {Результат нормализации фона с параметрами (UNIQ7c01194c4f7483f-MathJax-402-QINU)}3_2_55 [t]{4.2cm}{4.2cm}{PIC/pic3_2_55.eps} \end{cFigures}


Классическая процедура нормализации фона, являясь эффективным методом обнаружения простых объектов по признакам размера, может быть развита и усилена за счет применения морфологических (ММ Серра) методов обработки, которые позволяют строить обнаружение объектов также по априорным данным об их яркостно-геометрической структуре (модели). Процедуры математической морфологии Серра будут подробно рассмотрены в главе 6.

\Section{Литература для самостоятельного изучения} В книге (\it{Гонсалес, Вудс}) [19] фильтрации изображений посвящен ряд разделов главы 3 и глава 5. В главе 3 фильтрация рассматривается как один способов "улучшения изображения" в некотором общем смысле. В главе 5 рассматривается задача восстановления изображения, искаженного помехами, имеющими некоторую заданную модель. При этом, помимо рассматриваемой нами здесь достаточно наивной модели "пиксельного шума", рассматриваются также другие, достаточно сложные и содержательные модели искажений. Линейные и нелинейные методы фильтрации при таком изложении смешаны достаточно произвольным образом, зато возникает существенно более полное представление о задаче восстановления изображения.

Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты