Тип пиксела

Материал из Техническое зрение
Перейти к: навигация, поиск

Рассмотрим теперь растровое цифровое изображение как чистую структуру данных, абстрагировавшись от всего, что было изложено выше и касалось физических особенностей и способов их получения. Поскольку с геометрической (и программной) точки зрения структура любого изображения совершенно стандартна и представляет собой регулярный двумерный массив (матрицу) пикселов, различные типы изображений могут порождаться только оригинальным типом данных, представляющим пиксел.

В Таблице 3 сведены основные варианты структур двумерных растровых данных различного типа.

По типу данных изображения делятся на битовые (булевские, логические), байтовые (со знаком и без знака), целочисленные (со знаком и без знака), действительные (с фиксированной и плавающей точкой), цветные (специальный тип данных) и векторные (пиксел представляет собой массив или список численных значений).

В семантическом плане об этих типах изображений можно вкратце сказать следующее.


  1. $\textit{Бинарные изображения}$ (битовые, булевские, логические). 0 обозначает пиксел "фона", 1 - пиксел "объекта", "символа" (или наоборот - зависит от знака контраста объект/фон). В качестве исходного бинарное изображение формирует только один тип устройств ввода - оптический сканер в режиме сканирования текстовых документов. В качестве промежуточных и окончательных результатов обработки изображения такого типа широко используются в задачах обнаружения объектов, задачах морфометрических измерений, системах автоматического считывания текста и штриховых кодов.
  1. $\textit{Полутоновые изображения стандартного разрешения}$ (байтовые без знака). На сегодня разрешение 8 бит (диапазон значений [$0\ldots 255$] - $256$ градаций серого) - фактический стандарт для систем видеоввода, способных работать в реальном времени - фреймграбберов и цифровых видеокамер для технического зрения и систем видеонаблюдения. Это самый распространенный формат входных полутоновых данных. Соответственно, в том же формате представляются и результаты фильтрации полутоновых изображений. Системный тип данных TBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне.
  2. $\textit{Результаты обработки полутоновых изображений}$, в которых возможны отрицательные значения пикселов (байтовые со знаком). $\textit{Короткое целое}$ со знаком используется для представления промежуточных результатов обработки в целях экономии используемого объема памяти. $\textit{Длинное целое}$ со знаком стандартной и двойной длины используется при реализации всех возможных целочисленных операций над изображениями (например, накопления разнообразных сумм и разностей) в случае, если нет необходимости в специальном ограничении потребных объемов памяти. $\textit{Действительные значения}$ пикселов используются при реализации различных нецелочисленных операций и преобразований над изображениями. В случае, если требуется ограничить объем задействованной памяти или увеличить быстродействие алгоритмов, вместо представлений с $\textit{плавающей точкой}$ используются представления действительных чисел $\textit{с фиксированной точкой}$.

Таблица 3. Изображения с различным типом пиксела

$\textbf{Тип пиксела}$ $\textbf{Емкость (в битах)}$ $\textbf{Яркостное разрешение (диапазон)}$ $\textbf{Семантический смысл}$
$\textbf{Bit (Boolean)}$ $\qquad$ 1 $\qquad$[$0,1$] Бинарное изображение. 0 - "фон", 1 - "объект"
$\textbf{Byte (char, shortint)}$ $\qquad$ $\textbf{8}$ [$0\ldots 255$], [-$128\ldots 127$] Полутоновое изображение

стандартного яркостного разрешения - со знаком и без знака

$\textbf{Integer (word, int)}$ $\qquad$ $10$,

$\qquad$ $12$,

$\qquad$ $\textbf{16}$

[$0\ldots 2^{10}-1$], [-$2^{9}\ldots 2^{9}-1$],

[$0\ldots 2^{12}-1$], [-$2^{11}\ldots 2^{11}-1$],

[$0\ldots 2^{16}-1$], [-$2^{15}\ldots 2^{15}-1$]

Полутоновое изображение

повышенного яркостного разрешения - со знаком и без знака. Меточные изображения

$\textbf{Long (double word, long int)}$ $\qquad$ $\textbf{32}$,

$\qquad$ $64$

[$0\ldots 2^{32}-1$], [-$2^{31}\ldots 2^{31}-1$],

[$0\ldots 2^{64}-1$], [-$2^{63}\ldots 2^{63}-1$]

Полутоновое изображение высокого яркостного разрешения - со знаком и без знака
$\textbf{RGB (TColorRef)}$ $\qquad$ $24$,

$\qquad$ $\textbf{32}$

$[\{0,0,0\}\ldots \{255,255,255\}]$

$[\{0,0,0,0\}\ldots\{255,255,255,255\}]$

Цветное изображение. Разрешение 8 бит на цветовой канал. С выравниванием и без
$\textbf{Real (fixed, float, double)}$ * **(зависит от реализации) Действительнозначное изображение. Результат обработки
$\textbf{Complex}$ * **(зависит от реализации) Комплексное изображение. Результат перехода в частотную область
$\textbf{Vector (array~of...)}$ * **(зависит от реализации) Векторное изображение. Многозональные и гиперспектральные данные. Результаты комплексирования. Результаты вычисления множественных признаков
  1. $\textit{Полутоновые изображения повышенного разрешения (}$целочисленные без знака). Используются в тех случаях, когда диапазон в $256$ градаций серого не позволяет отразить все богатство исходной информации, предоставляемое датчиком в силу его физической природы. Таким образом оцифровываются, в частности, медицинские рентгеновские и томографические изображения, а также астрономические и технические изображения, полученные в результате длительных экспозиций. Многие специализированные медицинские и технические устройства формируют на выходе изображения с яркостным разрешением в $10$ или 12 бит, однако в компьютерных системах обработки такие данные удобно дополнять до "целого слова" в $16$ бит, с которым проще и быстрее оперируют современные $16$-, $32$- и $64$-битные вычислительные архитектуры.
  2. $\textit{Меточные изображения}$ (целочисленные без знака стандартной или двойной длины). Используются при автоматическом выделении связных областей и объектов. Каждый пиксел такого изображения помечен номером области, которой он принадлежит. Байтовые изображения здесь не подходят, так как в них можно закодировать только $255$ различных областей, а на изображениях высокого разрешения их могут оказаться десятки и даже сотни тысяч;
  3. $\textit{Двумерные частотные характеристики}$ - комплексные изображения, состоящие из действительной и мнимой части. Формируются в результате двумерного преобразования Фурье, быстрого преобразования Фурье (БПФ), двумерного косинусного преобразования (ДКП) и т. п. преобразований изображения из пространственной области в частотную. На программном уровне, как правило, реализуются не как двумерный массив комплексных чисел (двухкомпонентных векторов), а как пара двумерных массивов (изображений), один из которых представляет действительную часть образа, а второй - мнимую.
  4. $\textit{Цветные изображения}$ - специальный тип данных, запись формата TColorRef$ = $\{Red, Green, Blue\}. Разрешение по каждому из каналов - 8 бит. С целью выравнивания до "целого слова" $32$-битной архитектуры часто дополняется еще одним 8-битным компонентом: TColorRef32$ = $\{Red, Green, Blue, Reserved\}. Цветное изображение - системный тип данных. Он поддерживается всеми устройствами ввода цветовых изображений. Кроме того, стандартный тип данных TRGBBitmap поддерживается операционной системой Windows как часть графического интерфейса на системном уровне.
  5. $\textit{Многозональные и гиперспектральные изображения}$ - векторные, пиксел представляет собой массив целочисленных значений. Формируются специальными устройствами ввода. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одной зональной или спектральной компоненте.
  6. $\textit{Признаковые изображения}$ - скалярные или векторные, пиксел представляет собой скаляр, массив или список действительных значений. Представляют собой результат признакового анализа изображений. Используются для попиксельной классификации и сегментации изображений. На программном уровне, как правило, реализуются не как двумерный массив векторов, а как набор двумерных изображений, каждое из которых соответствует одному типу признаков.

Полезные ссылки

  1. ☝ К началу
  2. ☜ Растровое изображение
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты