Обработка цветных изображений

Материал из Техническое зрение
Перейти к: навигация, поиск

В главе $2$ мы уже писали о том, что цветные цифровые изображения представляют собой совокупность трех цветовых плоскостей, каждая из которых характеризует одну независимую составляющую цвета, представленную в том же формате, что и обычное $8$-битное полутоновое изображение. Следовательно, все описанные процедуры обработки полутоновых изображений

3-1-4.jpg

Цветовая модель RGB

в яркостной области могут быть обобщены и на случай обработки цветных изображений. Специфика же здесь связана прежде всего с различными цветовыми моделями, позволяющими по-разному работать с разными цветовыми и другими составляющими изображения.

Назначение цветовой модели - дать средства описания цвета в пределах некоторого цветового охвата. Наиболее часто в компьютерном зрении используются модели RGB, CMY, YUV, YCbCr, HSV.

Содержание

Цветовая модель RGB.

RGB (Red, Green, Blue - красный, зеленый, синий) - аппаратно-ориентированная модель, используемая в дисплеях для аддитивного формирования оттенков самосветящихся объектов (пикселов экрана). Система координат RGB - куб с началом отсчета $\langle 0,0,0 \rangle$, соответствующим черному цвету (рис. 4). Максимальное значение RGB - $\langle 255,255,255 \rangle$ соответствует белому цвету. В модели RGB не разделены яркостная и оттеночная компоненты цвета, здесь легко указать яркости для одного из основных цветов, но затруднительно указать оттенок с требуемым цветовым тоном (например, телесным) и насыщенностью.

3-1-5.jpg

Цветовая модель HSV

Цветовая модель HSV.

Цветовая модель HSV (Hue, Saturation, Value - цветовой тон, насыщенность, мера яркости) - модель, ориентированная на человека и обеспечивающая возможность явного задания требуемого оттенка цвета. Среди прочих используемых в настоящее время моделей, эта модель отражает физические свойства цвета и наиболее точно соответствует способу восприятия цвета человеческим глазом. Оттенок цвета (H) ассоциируется в человеческом сознании с обусловленностью окраски предмета определенным типом пигмента, краски, красителя. Составляющая Н - это длина световой волны, отраженной или прошедшей через объект. Данная составляющая является объективной и отражает физическую сущность цвета. Насыщенность (S) характеризует степень, силу, уровень выражения оттенка цвета. Этот атрибут в человеческом сознании связан с количеством (концентрацией) пигмента, краски, красителя. Насыщенность позволяет оценить, насколько "глубоким" и "чистым" является данный цвет, то есть как он отличается от ахроматического. Она определяет соотношение серого цвета и выбранного оттенка и выражается в долях от $0$ (серый) до $1$ (полностью насыщенный). Мера яркости (V) характеризует относительную освещенность или затемненность цвета (интенсивность цвета), поэтому она измеряется в диапазоне от 0 (черный) до 1 (белый). При увеличении яркости цвет становится более светлым (белым). Составляющая V является нелинейной, что близко соответствует восприятию человеком светлых и темных цветов. Две последние составляющие являются субъективно определяемыми, так как отражают психологические особенности восприятия цвета.

Подпространство, определяемое данной моделью, соответствует проекции цветового пространства на главную диагональ RGB-куба в направлении от белого к черному и являет собой перевернутый шестигранный конус (рис. 5). По вертикальной оси конуса задается V - мера яркости. Значению $\rm{V} = 0$ соответствует вершина конуса, значению $\rm{V}=1$ - основание конуса; цвета при этом наиболее интенсивны. Цветовой тон H задается углом, отсчитываемым вокруг вертикальной оси. В частности, $0$ ° - чистый красный цвет (Red), $60$° - желтый (Yellow), $120$° - зеленый (Green), $180$° - голубой (Cyan), $240$° - синий (Blue), $300$ ° - пурпурный (Magenta), то есть дополнительные цвета расположены друг против друга (отличаются на $180$°). Насыщенность S определяет, насколько близок цвет к "чистому" пигменту и меняется от $0$ на вертикальной оси V до 1 на боковых гранях шестигранного конуса. Точка $\rm{V} = 0$, в которой находится вершина конуса, соответствует черному цвету. Значение S при этом может быть любым в диапазоне $0$ - $1$. Точка с координатами $\rm{V} = 1$, $\rm{S} = 0$ - центр основания конуса, соответствует белому цвету. Промежуточные значения координаты V при $\rm{S} = 0$, то есть на оси конуса, соответствуют серым цветам. Если $\rm{S} = 0$, то значение оттенка H считается неопределенным.


Цветовая модель HSV может быть получена из модели RGB следующим образом: $$ {\rm H}_1 =\arccos \left( {\frac{\frac{1}{2}\left[ {\left( {{\rm R}-{\rm G}} \right)+\left( {{\rm R}-{\rm B}} \right)} \right]}{\sqrt {\left( {{\rm R} - {\rm G}} \right)^2+\left( {{\rm R}-{\rm B}} \right) \left( {{\rm G} - {\rm B}} \right)} }} \right), \quad {\rm H} = \begin{cases} {\rm H}_1, & {\rm if} {\rm B} \le {\rm G}, \cr 360° - {\rm H}_1, & {\rm if} {\rm B} > {\rm G}, \cr \end{cases} $$ $$ {\rm S} = \frac {\max \left( {{\rm R}, {\rm G}, {\rm B}} \right) - \min \left( {{\rm R}, {\rm G}, {\rm B}}\right)} {\max \left( {{\rm R}, {\rm G}, {\rm B}} \right)}, \quad {\rm V} = \frac{\max \left( {{\rm R}, {\rm G}, {\rm B}} \right)}{255}. $$ Данное преобразование является нелинейным, что затрудняет его практическое использование. Аппроксимация преобразования линейными зависимостями существенно упрощает алгоритм перевода из RGB в HSV и обеспечивает высокую вычислительную эффективность. Цветовая модель HSV является наиболее удобным представлением цветных изображений для их цветовой сегментации.

Цветовая модель YUV.

Остановимся также на цветовом пространстве YUV, которое широко применяется в телевещании и соответственно пришло на компьютер вместе с MPEG-форматом. Дело в том, что глаз человека наиболее чувствителен к яркости изображения и несколько менее - к цветности.

Если аддитивные составляющие RGB-сигнала представить в виде яркости (Y) и двух различных составляющих сигнала цветности (U и V) по формулам $$ \mbox{Y} = 0,299 \mbox{R} + 0,587 \mbox{G} + 0,114 \mbox{B}, $$ $$ \mbox{U} = 0,493 (\mbox{B} - \mbox{Y}), $$ $$ \mbox{V} = 0,877 (\mbox{R} - \mbox{Y}), $$ то U в таком соотношении выражает различия между синей и желтой составляющими цветного изображения, а V - между красной и зеленой компонентами цветного изображения. Известно, что глаз человека легче различает градации яркости и оттенки зеленого, поэтому U и V можно отображать с меньшей точностью, что способно существенно уменьшить количество информации, сохраняемой при сжатии. Таким образом, используя особенности человеческого зрения, еще до того, как будет применяться компрессия данных, мы можем получить выигрыш только за счет перехода к другому цветовому пространству. Поэтому, когда говорят, например, что сжатие в MPEG осуществляется с коэффициентом $100:1$ и более, часто забывают, что часть информации была "потеряна" уже при переходе к другому цветовому пространству.

Формат кодирования YUV $4:1:1$ отличается от $4:2:2$ способом дискретизации сигнала, которая вычисляется для конкретного канала как произведение базовой частоты цифрового кодирования на соответствующий коэффициент: например, на $4$ отсчета для канала Y берется по одному отсчету для каждого из цветоразностных каналов.

Цветовая сегментация изображения.

Цветовая сегментация обычно производится по предварительно построенной модели распределения цвета искомого объекта в

3-1-6.jpg 3-1-7.jpg
Взаимное соотношение компонент H и S на изображениях кожи Взаимное соотношение компонент H и V на изображениях кожи

цветовом пространстве HSV. Рассмотрим работу процедуры подобного рода на примере задачи сегментации на изображении лица человека на основе цветовых характеристик человеческой кожи.

Построение модели рассматривается как задача поиска группы кластеров, соответствующих оттенкам кожи. Структура и параметры модели формируются путем обработки изображений участков кожи, выделенных вручную. Распределение, отражающее соотношение параметров цвета H и S, получено в данном примере в результате обработки порядка $900$ изображений фрагментов кожи размерами $3\times 3$ пиксела (рис. \refFigure{3_1_6}).

Как видно, "трубки" распределений $\langle$H, S$\rangle$ и $\langle$H, V$\rangle$, характеризующие оттенки кожи, являются достаточно компактными в цветовом пространстве и составляют группу первичных признаков на этапе построения модели. "Трубки" распределений $\langle$H, S$\rangle$ и $\langle$H, V$\rangle$ могут быть разделены на подобласти, образующие группы $\it{кластеров}$ (компактных множеств точек). На этапе сегментации каждому пикселу изображения ставится в соответствие вектор параметров цвета $\langle$H, S, V$\rangle$ и проверяется принадлежность параметров цвета к одному из кластеров модели кожи. Область изображения кожи формируется из пикселов, параметры которых вошли в один из кластеров. На рис. 8 - 10 приведены результаты работы алгоритма цветовой пиксельной сегментации лиц с различными оттенками кожи.

Аналогичным образом получено распределение, отражающее соотношение параметров цвета H и V (рис. 7).

После того как на изображении выделены пикселы, цвет которых соответствует оттенкам кожи, производится слияние выделенных пикселов в систему кластеров по

3-1-8.jpg

Пример цветовой пиксельной сегментации кожи

3-1-9.jpg

Пример цветовой пиксельной сегментации кожи

3-1-10.jpg

Пример цветовой пиксельной сегментации кожи

3-1-11.jpg

Пример работы алгоритма обнаружения лиц

мере близости их местоположения. Далее производится комплексная проверка кластеров для выявления кластеров, действительно являющихся лицами. Правило, которому должен отвечать фрагмент изображения, на котором присутствует лицо, достаточно очевидно: лицо обычно должно быть симметрично относительно вертикальной оси. На рис. 11 показан пример работы алгоритма обнаружения лиц на цветных изображениях. Фрагменты изображения с обнаруженными лицами выделены рамкой.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Яркость и цвет. Гистограммы, профили, проекции. Бинаризация и сегментация
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты