Биометрия

Материал из Техническое зрение
Версия от 04:11, 26 июня 2019; JIoku (обсуждение | вклад)

(разн.) ← Предыдущая | Текущая версия (разн.) | Следующая → (разн.)
Перейти к: навигация, поиск

Биометрия


Область применения: биометрия

В последние годы во всем мире наблюдается все возрастающий интерес к методам распознавания и идентификации личности. Основные пути и способы решения этих задач лежат в области разработки биометрических систем. В биометрических системах для распознавания человека используется совокупность биометрических характеристик, основанных на биологических особенностях человеческого тела. В качестве таких биометрических характеристик могут выступать: голос, почерк, отпечатки пальцев, геометрия кисти руки, рисунок сетчатки или радужной оболочки глаза, лицо и ДНК.}

Биометрическая защита более эффективна в сравнении с такими методами, как использование паролей, PIN-кодов, смарт-карт, жетонов (tokens) или технологии PKI (инфраструктура открытых ключей), поскольку биометрия позволяет идентифицировать именно конкретного человека, а не устройство. Традиционные методы защиты не исключают возможности потери или кражи информации, вследствие чего она становится доступной незаконным пользователям. Уникальный биометрический идентификатор, каковым является, например, отпечаток пальца или изображение лица, служит ключом, который невозможно потерять. Биометрическая система безопасности позволяет отказаться от парольной защиты либо служит для ее усиления.

Одной из основных причин, которые существенно повысили значимость автоматической обработки и анализа биометрической информации, явилось повышение требований к функциональным возможностям автоматических систем безопасности, расположенных в общественных местах (вокзалы, аэропорты, супермаркеты и т. п.), связанные с необходимостью в реальном времени выполнять необходимые действия по установлению личности присутствующих на контролируемой территории людей, причем, зачастую, скрытно, то есть не только бесконтактно (дистанционно), но и без специального сотрудничества (специального предъявления биометрических признаков) со стороны идентифицируемых персон.

В настоящее время существует множество методов биометрической аутентификации, которые делятся на две основные группы - статические и динамические методы.

Статические методы биометрической аутентификации основываются на физиологической (статической) характеристике человека, то есть уникальной характеристике, данной ему от рождения и неотъемлемой от него. К этой группе относятся следующие методы аутентификации.


  1. $\textit{По отпечатку пальца.}$ В основе этого метода лежит уникальность для каждого человека рисунка папиллярных узоров на пальцах. Отпечаток пальца, полученный с помощью специального сканера, преобразуется в цифровой код (свертку) и сравнивается с ранее введенным эталоном. Данная технология является самой распространенной по сравнению с другими методами биометрической аутентификации.
  2. $\textit{По форме ладони.}$ Данный метод построен на геометрии кисти руки. С помощью специального устройства, состоящего из камеры и нескольких подсвечивающих диодов (включаясь по очереди, они дают разные проекции ладони), строится трехмерный образ кисти руки, по которому формируется свертка и распознается человек.
  3. $\textit{По расположению вен на лицевой стороне ладони.}$ С помощь инфракрасной камеры считывается рисунок вен на лицевой стороне ладони или кисти руки, полученная картинка обрабатывается, и по схеме расположения вен формируется цифровая свертка.
  4. $\textit{По сетчатке глаза.}$ Вернее, это способ идентификации по рисунку кровеносных сосудов глазного дна. Для того чтобы этот рисунок стал виден, человеку нужно посмотреть на удаленную световую точку, при этом подсвеченное глазное дно сканируется специальной камерой.
  5. $\textit{По радужной оболочке глаза.}$ Рисунок радужной оболочки глаза также является уникальной характеристикой человека, причем для ее сканирования достаточно портативной камеры со специализированный программным обеспечением, позволяющим захватывать изображение части лица, из которого выделяется изображение глаза, из которого в свою очередь выделяется рисунок радужной оболочки, по которому строится цифровой код для идентификации человека.
  6. $\textit{По изображению или форме лица.}$ В данном методе идентификации строится двумерный или трехмерный образ лица человека. На лице выделяются контуры бровей, глаз, носа, губ и т. д., вычисляется расстояние между ними и строится не просто образ, а еще множество его вариантов на случаи поворота лица, наклона, изменения выражения. Количество образов варьируется в зависимости от целей использования данного способа (для аутентификации, верификации, удаленного поиска на больших территориях и т. д.).
  7. $\textit{По термограмме лица}$. В основе данного способа аутентификации лежит уникальность распределения на лице артерий, снабжающих кровью кожу, которые выделяют тепло. Для получения термограммы используются специальные камеры инфракрасного диапазона. В отличие от предыдущего, этот метод позволяет различать даже близнецов.
  8. $\textit{По ДНК}$. Преимущества данного способы очевидны, однако используемые в настоящее время методы получения и обработки ДНК работают настолько долго, что такие системы используются только для специализированных экспертиз.
  9. $\textit{Другие методы}$. Существуют еще такие уникальные способы - как идентификация по подногтевому слою кожи, по объему указанных для сканирования пальцев, форме уха, запаху тела и т. д.


Как видно, большинство биометрических технологий данной группы связано с анализом изображений и реализуется теми или иными методами компьютерного зрения.

Динамические методы биометрической аутентификации основываются на поведенческой (динамической) характеристике человека, то есть построены на особенностях, характерных для подсознательных движений в процессе воспроизведения какого-либо действия. Методы аутентификации этой группы таковы.


  1. $\textit{По рукописному почерку.}$ Как правило, для этого вида идентификации человека

используется его роспись (иногда написание кодового слова). Цифровой код идентификации формируется в зависимости от необходимой степени защиты и наличия оборудования (графический планшет, экран карманного компьютера Palm и т. д.) двух типов:

- - по самой росписи, то есть для идентификации используется просто степень совпадения двух картинок;

- - по росписи и динамическим характеристикам написания, то есть для идентификации строится свертка, в которую входит информация по непосредственно подписи, временн ым характеристикам нанесения росписи и статистическим характеристикам динамики нажима на поверхность.

  1. $\textit{По клавиатурному почерку.}$ Метод в целом аналогичен вышеописанному,

но вместо росписи используется некое кодовое слово (когда для этого используется личный пароль пользователя, такую аутентификацию называют двухфакторной), и не нужно никакого специального оборудования, кроме стандартной клавиатуры. Основной характеристикой, по которой строится свертка для идентификации, является динамика набора кодового слова.

  1. $\textit{По голосу.}$ Это одна из старейших технологий, в настоящее время ее развитие ускорилось,

так как предполагается ее широкое использование в построении "интеллектуальных зданий". Существует достаточно много способов построения кода идентификации по голосу, как правило, это различные сочетания частотных и статистических характеристик голоса.

  1. Другие методы. Для данной группы методов также описаны только самые распространенные

методы, существуют еще такие уникальные способы, как идентификация по движению губ при воспроизведении кодового слова, по динамике поворота ключа в дверном замке и т. д.


Содержание

Краткий исторический обзор.

Проблематика компьютерной биометрической идентификации активно развивается с 1960-х годов. Можно отметить следующие основные вехи этого процесса.


  1. 1960-e - создано биометрическое подразделение NIST, первые попытки

автоматизации процесса идентификации личности по следующим биометрическим характеристикам: лицо, голос, отпечатки, подпись.

  1. 1970-е годы - первые автоматизированные системы верификации личности,

методы идентификации по форме ладони и динамической подписи.

  1. 1976 - первые мультибиометрические эксперименты.
  2. 1980-е годы - значительно автоматизированные системы и первые методы

полностью автоматической идентификации.


С конца 1980х годов наблюдается всплеск научного и практического интереса к биометрической идентификации, сопровождающийся ростом числа биометрических методов, алгоритмов и технологий, в том числе в СССР и России. Это связано не столько с прикладным интересом к биометрической идентификации, сколько с развитием аппаратных средств, в первую очередь, персональных компьютеров и периферийных устройств для работы с изображениями и аудиосигналами.

В России наиболее важные результаты по биометрической идентификации были получены в работах С. О. Новикова, В. Ю. Гудкова, О. М. Черномордика по распознаванию отпечатков пальцев, Г. А. Кухарева и А. А. Тельных по различным аспектам лицевой биометрии, А. И. Иванова и А. Ю. Малыгина по нейросетевым методам биометрической идентификации, Л. М. Местецкого по распознаванию на основе параметров кисти руки, И. Н. Спиридонова в области стандартизации и биометрической техники, В. И. Дымкова и И. Н. Синицына по автоматизации научных исследований в области биометрической идентификации, С. Л. Бочкарева в области голосовой идентификации личности, О. С. Ушмаева по мультибиометрии.

Сложились научные школы, занимающиеся проблематикой биометрической идентификации. Среди них следует выделить коллективы специалистов, работающих в институтах ИПИ РАН, ГосНИИАС, ИСА РАН, МГУ им. М. В. Ломоносова, МГТУ им. Н. Э. Баумана, ФГУП "ПНИЭИ"; компаниях "Биолинк", "Вокорд Телеком", НПП "Лазерные системы", "Системы Папилон", "Сонда", "СТЭЛ", "Центр речевых технологий".

Среди зарубежных исследований в области биометрической идентификации следует выделить работы таких специалистов, как P. Phillips, P. Grother, А. Jain, N. Ratha, P. Griffin, D. Maio, D. Maltoni, A. Masnfield, J. Wayman, K. Bowyer, M. Turk, A. Pentland, R. Bolle, A. Ross, J. Daugman, D. Zhang, Karr-Ann Toh, O. Tosi, S. Pankanti, C. Soutar, Tieniu Tan, O. Castillo, P. Melin, J. P. Campbell, J. Garofolo, D. Reynolds, L. Flom, J. Kittler, P. Flynn, R. Chellappa, W. Zhao, J.-C. Junqua, J. F. Bonastre, J. Bigun, K. Brady, D. Burr, B. Dorizzi, S. Prabhakar, J. Conell, G. Doddington, J. Ortega-Garcia, A. Bazen, S. Gerez, R. Plamondon, M. Eleccion, M. Fornefett, J. Wegstein, L. Kersta, L. Harmon, A. Fejfar, T. Vetter, A. G. Kersta, L. D. Harmon, B. G. Sherlock, D. M. Monro, M. Kucken.

Существующие биометрические системы.

В настоящее время на рынке предлагается ряд готовых систем и технологий биометрической идентификации и аутентификации личности.

Например, в области распознавания лиц одними из наиболее продвинутых решений являются следующие.

Система ZN-Face компании $\textit{ZN Vision Technologies AG}$ сочетает в себе новейшие компьютерные разработки с системой контроля доступа, основанной на автоматическом распознавании лиц. ZN-камера делает снимок человека, стоящего на рубеже контроля, и проверяет его в считанные доли секунды. Специально разработанный модуль оптического фильтра и функция контроля за живым лицом предотвращает любую попытку обмана путем применения фотографий или масок.

Компьютеризованная база фотоданных ZN-Phantomas может автоматически сравнивать и идентифицировать лица. Для сравнения годится фотография, фоторобот, рисунок или кадр, полученный при видеосъемке. ZN-Phantomas проводит поиск среди сохраненных в памяти изображений, используя систему распознавания лиц, созданную по образу работы человеческого мозга на базе технологии органического видения. Скорость работы системы позволяет просматривать 10 тыс изображений за три минуты. Система может работать со всеми SQL-базами данных, использующими ODBC-протокол (Oracle, Sybase SQL, DB2, Informix).

Система FaceIT компании $\textit{Identix Inc}$ осуществляет распознавание людей при попадании изображения лица в поле зрения видеокамеры высокого разрешения. Разработки фирмы финансируются госдепартаментом США. Данная система проходит апробацию в аэропортах США. В прессе появлялись сообщения, что результаты тестирования нельзя назвать удовлетворительными, однако контракт с фирмой продолжен, и теперь акцент переносится на идентификацию по фотографиям. госдепартамент США собирается обязать гостей США иметь фото установленного образца, дабы облегчить распознавательным программам работу.

Из систем, разработанных в России и СНГ, можно рассмотреть продукцию фирмы $\textit{Asia-Software}$. Фирма предлагает FRS SDK - комплект разработчика, предназначенный для построения информационно-поисковых систем, связанных с распознаванием лиц, и ряд систем идентификации по изображениям лиц. Система базируется на алгоритмах распознавания и сравнения изображений. Основой этих алгоритмов является модифицированный метод анализа принципиальных компонент, заключающийся в вычислении максимально декореллированных коэффициентов, характеризующих входные образы человеческих лиц. На вход системы подается оцифрованное видеоизображение. Специальные алгоритмы определяют наличие изображения лица человека, выделяют его, определяют точное расположение зрачков, производят позиционирование и масштабирование. После этого происходит автоматическое кодирование выделенного изображения лица человека с целью определения основных характерных признаков. Размер полученного массива признаков составляет примерно $300$~байт, что позволяет строить идентификационные системы даже на однокристальных ЭВМ.

Характеристики биометрических систем.

Показателями надежности биометрических систем могут служить вероятности ошибок первого и второго рода. Ошибки первого рода определяют вероятность ложного отказа (FRR, False Rejection Rate) и возникают при отказе в доступе легальному пользователю системы. Ошибки же второго рода показывают вероятность ложного допуска (FAR, False Acceptance Rate) и появляются при предоставлении доступа постороннему лицу. FRR и FAR связаны обратной зависимостью. Современные биометрические системы имеют очень большой разброс этих характеристик.

Биометрическую систему также можно характеризовать уровнем равной вероятности ошибок первого и второго рода (EER, Equal Error Rates) - точкой, в которой вероятность ошибки первого рода равна вероятности ошибки второго рода. На основании EER можно делать выводы об относительных достоинствах и недостатках разных биометрических методов. Чем ниже уровень EER, тем выше качество системы.

Еще один параметр, влияющий на выбор и установку биометрической системы, - пропускная способность. Она характеризует время, которое требуется человеку для взаимодействия с данным биометрическим устройством.

Сортировать и сравнивать описанные выше биометрические методы по показаниям ошибок первого рода очень сложно, так как они сильно разнятся для одних и тех же методов из-за сильной зависимости от оборудования, на котором они реализованы.

По показателям ошибок второго рода общая сортировка методов биометрической аутентификации выглядит так (от лучших к худшим):


  1. ДНК;
  2. радужная оболочка глаза, сетчатка глаза;
  3. отпечаток пальца, термография лица, форма ладони;
  4. форма лица, расположение вен на кисти руки и ладони;
  5. подпись;
  6. клавиатурный почерк;
  7. голос.


Можно сделать вывод, что, с одной стороны, статические методы идентификации существенно лучше динамических, а с другой стороны - существенно дороже.

Текущее состояние технологии и перспективы дальнейших разработок.

В настоящий момент общее состояние биометрических технологий в мире еще нельзя признать удовлетворительным. Скорее можно говорить о биометрии как о быстро развивающейся области исследований и приложений, в которой еще не удалось достичь требуемых показателей. Целый ряд серьезных проверок, проведенных в последнее время, показал недостаточную надежность таких систем.

Например, полицейское управление города Тампа, штат Флорида (США), после двух лет эксплуатации деинсталлировало за бесполезностью программное обеспечение опознания лиц, работавшее совместно с камерами наружного наблюдения. Сеть таких камер позволяла вести надзор за публикой в городском парке развлечений Айбор-сити. Предполагалось, что техника в комплекте с программой для сканирования/опознания лиц, подсоединенной к базе из 30 тысяч известных правонарушителей и сбежавших из дома детей, повысит эффективность работы полиции. Однако за два года система не дала ни единого успешного результата, будь то автоматическое опознание разыскиваемых или арест подозреваемых. Программное обеспечение было предоставлено компанией Identix, одним из ведущих в США поставщиков биометрических технологий опознания по лицу и отпечаткам пальцев.

Известен отчет японского криптографа Цутомо Мацумото, скомпрометировавшего более десятка систем опознания пользователя по отпечатку пальца. Недавно аналогичное обширное исследование было предпринято немецким компьютерным журналом "c't". Выводы экспертов однозначны: биометрические системы для потребительского рынка пока не достигли того уровня, когда их можно рассматривать в качестве реальной альтернативы традиционным паролям. Так, систему опознания лиц FaceVACS-Logon немецкой фирмы $\textit{Cognitec}$ удается ввести в заблуждение, просто предъявив фотографию зарегистрированного пользователя. Для обмана более изощренного ПО, анализирующего характерные признаки живого человека (мимические движения лица) может быть успешно применен экран ноутбука, на котором демонстрируется видеоклип с записью лица. Несколько сложнее обмануть систему Authenticam BM-ET100 фирмы $\textit{Panasonic}$ для опознания радужной оболочки глаза, поскольку здесь инфракрасные датчики реагируют не только на характерный узор изображения радужки, но и на иную глубину расположения зрачка. Однако, если проделать небольшое отверстие на месте зрачка в фотоснимке глаза, куда при опознании заглядывает другой человек, систему удается обмануть. Что же касается систем опознания пользователя по отпечатку пальца с помощью емкостного сенсора на мышке или клавиатуре, то здесь самым распространенным способом обмана является повторное "оживление" уже имеющегося отпечатка, оставленного зарегистрированным пользователем. Для "реанимации" остаточного отпечатка иногда бывает достаточно просто подышать на сенсор, либо приложить к нему тонкий полиэтиленовый пакет, наполненный водой. Подобные трюки, в частности, весьма удачно опробованы на мышках ID Mouse фирмы $\textit{Siemens}$, оснащенных емкостным сенсором FingerTIP производства $\textit{Infineon}$. Наконец, "искусственный палец", отлитый в парафиновой форме из силикона, позволил исследователям одолеть все шесть протестированных дактилоскопических систем.

Однако, несмотря на общую негативную оценку современного состояния биометрических систем идентификации личности, во всем мире наблюдается тенденция к развитию исследований и разработок в области биометрии. При этом одной из основных тенденций последнего времени является постепенный перенос приоритетов с контактных на бесконтактные методы биометрического распознавания. Причиной этого явилось повышение требований к функциональным возможностям автоматических систем безопасности, расположенных в общественных местах (вокзалы, аэропорты, супермаркеты и т. п.), связанные с необходимостью в реальном времени выполнять необходимые действия по установлению личности присутствующих на контролируемой территории людей, причем, зачастую, скрытно, %то есть не только бесконтактно (дистанционно), но %и без специального сотрудничества (специального предъявления биометрических %признаков) со стороны идентифицируемых персон, в сложных условиях, в группе и в толпе. Созданию таких биометрических систем нового поколения препятствуют ряд специфических проблем, пока еще не имеющих адекватного решения.

Первая группа проблем связана с тем, что системы скрытного наблюдения с целью обеспечения безопасности должны работать в условиях естественного поведения человека, не предъявляющего специально свое лицо и не произносящего заранее известных ключевых фраз. В этом случае еще до решения задачи распознавания необходимо решить задачу обнаружения (определения местоположения, выделения человека в группе), да и сама задача распознавания лица и голоса в неконтролируемых условиях становится существенно сложнее. Вторая группа существующих здесь проблем связана с тем, что в случае задачи обеспечения безопасности (в отличие от задачи обеспечения контроля доступа) нет возможности опереться на сотрудничество идентифицируемой персоны даже на этапе обучения. Поэтому для обучения приходится использовать имеющиеся фрагментарные и разнородные аудио- и видеоматериалы самого различного качества и происхождения. Это еще более усложняет задачу обучения биометрической системы. Наконец, третья группа проблем связана с тем, что получаемые (с учетом перечисленных проблем) вероятности правильного распознавания и ложного обнаружения заданной персоны в естественной обстановке только по лицу или только по голосу оказываются существенно ниже показателей, требуемых для удовлетворительного функционирования ответственных систем обеспечения безопасности и контроля доступа. С этим связана необходимость использовать комплексирование результатов биометрического распознавания, полученного от разных источников информации.

Именно с решением указанных проблем могут быть связаны существенные прорывы в области биометрических технологий в ближайшие годы.

Биометрия в широком и узком смысле.

Таким образом, биометрические технологий идентификации представляют собой быстро развивающееся научно-техническое направление, в результатах которого остро нуждаются такие области применения, как системы охраны и контроля доступа, системы паспортного и визового контроля, системы предупреждения преступлений и идентификации преступников, системы контроля доступа, системы учета и сбора статистики посетителей, системы идентификации удаленных пользователей и пользователей интернета, верификации кредитных карточек, криминалистической экспертизы, контроля времени посещения на предприятиях и т. д.

Помимо описанных биометрических технологий аутентификации, область "биометрии в широком смысле" включает также ряд приложений, связанных с выделением и измерением различных биологических характеристик человеческого тела, жестов, движений и т. п., предназначенных не для персональной идентификации, а для использования в спортивных, медицинских, телекоммуникационных, развлекательных и других целях.

Выделение и распознавание лиц

Задача выделения лица человека в естественной или искусственной обстановке и последующей идентификации всегда находилась в ряду самых приоритетных задач для исследователей, работающих в области систем машинного зрения и искусственного интеллекта. Тем не менее, множество исследований, проводящихся в ведущих научных центрах всего мира в течение нескольких десятилетий, так и не привело к созданию реально работающих систем компьютерного зрения, способных обнаруживать и распознавать человека в любых условиях. Несмотря на близость задач и методов, используемых при разработке альтернативных систем биометрической идентификации человека таких, как идентификация по отпечатку пальца или по изображению радужной оболочки, системы идентификации по изображению лица существенно уступают вышеперечисленным системам.

Серьезной проблемой, стоящей перед системами компьютерного зрения, является большая изменчивость визуальных образов, связанная с изменениями освещенности, окраски, масштабов, ракурсов наблюдения. Кроме того, люди имеют привычку ходить по улицам и в помещении одетыми, что приводит к существенной изменчивости изображений одного и того же человека. Однако наиболее сложной задачей компьютерного зрения является проблема устранения неоднозначности, возникающей при проектировании трехмерных объектов реального мира на плоские изображения. Цвет и яркость отдельных пикселов на изображении также зависит от большого количества трудно прогнозируемых факторов. В число этих факторов входят:


  1. число и расположение источников света;
  2. цвет и интенсивность излучения;
  3. тени или отражение от окружающих объектов.


Задача обнаружения объектов на изображении осложняется также огромным объемом данных, содержащихся в изображении. Изображение может содержать тысячи пикселов, каждый из которых может иметь важное значение. Полное использование информации, содержащейся в изображении, требует анализа каждого пиксела на принадлежность его объекту или фону с учетом возможной изменчивости объектов. Такой анализ может потребовать высоких затрат в требуемой памяти и производительности компьютера.

Решение этой проблемы лежит в правильном выборе описания объектов, для обнаружения и распознавания которых создается система. Описание объекта должно его учитывать наиболее характерные особенности и быть достаточно представительным, чтобы отличать данный объект от остальных элементов окружающей сцены. Чтобы избежать субъективности при выборе нужного описания, можно использовать методы автоматического выбора подходящих характеристик объекта, которые реализуются в генетических алгоритмах и при обучении искусственных нейронных сетей. В то же время существует ряд параметров в описании объекта, которые в настоящее время должен выбрать исследователь, разрабатывающий систему обнаружения и распознавания. К такому выбору относятся:


  1. выбор между 2D и 3D-представлением сцены и объекта. Алгоритмы, использующие

2D-представление, обычно более простые, чем 3D-алгоритмы, но в то же время требуют большого числа различных описаний, соответствующих представлению объекта в различных условиях наблюдения;

  1. выбор между описанием объекта как единого целого или как системы, состоящей из некоторого множества взаимосвязанных элементов;
  2. выбор между системой признаков, основывающихся на геометрических или иных описывающих специфику объекта характеристиках.


В самом общем случае алгоритм решения задачи обнаружения и идентификации человека по изображению его лица состоит из следующих очевидных шагов:


  1. обнаружение факта присутствия человека на анализируемой сцене;
  2. выделение фигуры человека;
  3. выделение головы;
  4. определение ракурса наблюдения головы (анфас, профиль);
  5. выделение лица;
  6. сравнение с эталонами и идентификация.


В зависимости от конкретных условий структура и реализация отдельных шагов алгоритма могут различаться. В наиболее сложном случае, при использовании системы обнаружения и идентификации человека по изображению его лица в сильно изменяющейся обстановке, с большим потоком входных данных (работа на городских улицах с интенсивным движением, в метро, аэропортах и т. д.), требуется использование максимально доступной информации для достижения удовлетворительных результатов работы алгоритма. Алгоритм должен уметь эффективно отсекать статические и медленно изменяющиеся элементы сцены, работать в различных условиях освещенности, опознавать фигуру человека под различными ракурсами, отслеживать передвижение множества людей и автоматически выбирать момент, подходящий для выполнения идентификации данного человека (например, когда можно получить фронтальное изображение лица с достаточным разрешением). Для обеспечения таких возможностей алгоритма необходима определенная аппаратурная насыщенность системы, включающая многокамерный обзор и анализ сцены с возможностью выделения 3D-структуры сцены, скоростной ввод видеопотока для фильтрации элементов сцены по параметрам движения, использование цвета для выделения элементов сцены. Кроме того нужны камеры с высоким разрешением и хорошей оптикой для обеспечения возможно большей дальности достоверной идентификации. В более простых случаях, при статичной сцене и ограниченном потоке событий (появлений людей), возможно использование более простой структуры аппаратного обеспечения и алгоритма, например, стереопары или одной камеры и заранее подготовленной модели сцены может быть достаточно для достоверного определения факта нахождения человека в зоне контроля, выделения его фигуры и идентификации. Задача определения факта присутствия человека на сцене, требует от алгоритма определенного уровня интеллекта. Это не должна быть система, реагирующая просто на факт изменения сцены. Алгоритм обнаружения человека не должен давать ложные тревоги при изменениях освещенности, движении теней от статических объектов, появлении в зоне контроля животных и т. д. В случае, когда это необходимо, появляется проблема создания адекватного описания сцены. Это описание может представлять трехмерную модель сцены, вероятностную модель распределения цветов или яркостей элементов сцены или систему признаков, отличающую элементы сцены от объектов распознавания (в нашем случае - человеческих фигур). Отношения между элементами сцены, считающимися фоном, или элементам переднего плана могут изменяться. Та же фигура человека, если ее изображение меньше некоторого порогового значения, определяемого разрешением оптической системы, может быть отнесена к элементам фона, так как ее анализ является непродуктивным для выполнения основной задачи - идентификации человека.

Выбор алгоритма, используемого для идентификации человека по изображению его лица, также зависит от конкретных условий его применения. Например, с задачей распознавания в строго ограниченном коллективе легко справляется многослойная нейронная сеть. В то же время задача обнаружения конкретного человека в толпе (с неопределенным составом) требует применения изощренных методов для снижения уровня ложных тревог. Скорее всего, в этом случае потребуется многоуровневая система, содержащая множество анализаторов, работающих в разных признаковых пространствах, с принятием решения методом голосования. На начальных этапах работы система идентификации должна отсекать заведомо неподходящих кандидатов и использовать оставшееся множество кандидатов для принятия окончательного решения об идентификации.

Ниже представлен обзор по существующим методам обнаружения и идентификации человека по изображению его лица. В обзор включались только те методы, которые, по мнению авторов, наиболее широко используются в современных алгоритмах обнаружения человека и его персональной идентификации по изображениям лица в естественной обстановке.

При всем многообразии различных алгоритмов и методов распознавания изображений, типичный метод распознавания состоит из трех основных компонент:


  1. преобразование исходного изображения в стандартное представление;
  2. выделение ключевых характеристик;
  3. механизм классификации (моделирования): кластерная модель, метрика, нейронная сеть и т. п.


Кроме этого, построение метода распознавания опирается на априорную информацию о предметной области (в данном случае - характеристики лица человека) и корректируется экспериментальной информацией, появляющейся по ходу разработки метода.

Метод главных компонент.

Метод главных компонент (Principal Component Analysis, {PCA}) применяется для сжатия информации без существенных потерь информативности. Он состоит в линейном ортогональном преобразовании входного вектора $\textbf{x}$ размерности $N$ в выходной вектор $\textbf{y}$ размерности $M$, $N>M$. При этом компоненты вектора $\textbf{y}$ являются некоррелированными и, следовательно, общая дисперсия после преобразования остается неизменной. Матрица $\textbf{X}$ состоит из всех примеров изображений обучающего набора. Решив уравнение $\boldsymbol\Lambda = \boldsymbol{\Phi}^T \boldsymbol{\Sigma}\boldsymbol{\Phi} $, получаем матрицу собственных векторов $\boldsymbol{\Phi}$, где $\boldsymbol{\Sigma}$ - ковариационная матрица для $\textbf{x}$, а $\boldsymbol{\Lambda}$ - диагональная матрица собственных чисел. Выбрав из $\boldsymbol{\Phi}$ подматрицу $\boldsymbol{\Phi}_M$, соответствующую $M$ наибольшим собственным числам, получим, что преобразование $\textbf{y} = \boldsymbol{\Psi}_M^T \widetilde{\textbf{x}}$, где $\widetilde{\textbf{x}} = \textbf{x} - \overline{\textbf{x}}$ - нормализованный вектор с нулевым математическим ожиданием, характеризует большую часть общей дисперсии и отражает наиболее существенные изменения $\textbf{x}$. Выбор первых $M$ главных компонент разбивает векторное пространство на главное (собственное) пространство $F = \left\{\boldsymbol{\Phi}_i\right\}_{i=1}^M$, содержащее главные компоненты, и его ортогональное дополнение $F = \left\{\boldsymbol{\Phi}_i\right\}_{i=M+1}^{N}$. В качестве индикаторов принадлежности в методе главных компонент используют:

DIFS - distance in feature space, расстояние от образа анализируемого изображения в собственном пространстве, до эталонного образа;

DFFS - distance from feature space, расстояние от представления анализируемого изображения в пространстве наблюдения до проекции эталона в собственном пространстве.


7-6-1.jpg

Пример изображений собственных векторов (собственные лица)


Применение для задачи распознавания человека по изображению лица имеет следующий вид. Входные векторы представляют собой отцентрированные и приведенные к единому масштабу изображения лиц. Собственные векторы, вычисленные для всего набора изображений лиц, называются собственными лицами (eigenfaces). Метод главных компонент в применении к изображениям лиц также называют методом собственных лиц (рис. 1). С помощью вычисленных ранее матриц входное изображение разлагается на набор линейных коэффициентов, называемых главными компонентами. Сумма $N$ первых главных компонент, умноженных на соответствующие собственные векторы, является аппроксимацией изображения порядка $N$ (рис. 2).

7-6-2.jpg

Нормализованное изображение лица ($\textit{а}$) и его реконструкция по $85$ главным компонентам ($\textit{б}$)


Для каждого изображения лица вычисляются его главные компоненты. Обычно берется от $5$ до $200$ главных компонент. Остальные компоненты кодируют мелкие различия между лицами и шум. Процесс распознавания заключается в сравнении главных компонент неизвестного изображения с компонентами всех остальных изображений. Для этого обычно применяют какую-либо метрику (простейший случай - Евклидово расстояние). Дополнительное повышение надежности достигается за счет дополнительного применения анализа главных компонент к отдельным участкам лица таким, как глаза, нос, рот.

Также метод главных компонент применяется для обнаружения лица на изображении. Для лиц значения компонент в собственном пространстве имеют большие значения, а в дополнении собственного пространства - близки к нулю. По этому факту можно обнаружить, является ли входное изображение лицом. Для этого проверяется величина ошибки реконструкции; чем больше ошибка, тем больше вероятность, что это не лицо. При наличии в наборе изображений лиц вариаций таких, как раса, пол, эмоции, освещение, будут появляться компоненты, величина которых в основном определяется этими факторами. Поэтому по значениям соответствующих главных компонент можно определить, например, расу или пол человека. Основные недостатки PCA таковы. Метод собственных лиц требует для своего применения идеализированных условий таких, как единые параметры освещенности, нейтральное выражение лица, отсутствие помех вроде очков и бород. При несоблюдении этих условий главные компоненты не будут отражать межклассовые вариации. Например, при различных условиях освещенности метод собственных лиц практически неприменим, поскольку первые главные компоненты преимущественно отражают изменения освещения, и сравнение выдает изображения, имеющие похожий уровень освещенности.

Вычисление набора собственных векторов отличается высокой трудоемкостью. Один из способов - это свертка изображений по строкам и столбцам; в такой форме представление изображения имеет на порядок меньший размер, вычисления и распознавание происходит быстрее, но восстановить исходное изображение уже невозможно.

Линейный дискриминантный анализ.

Линейный дискриминантный анализ (линейный дискриминант Фишера Linear Discriminant Analysis, {LDA}) использует такую проекцию пространства изображений на пространство признаков, которая минимизирует внутриклассовое и максимизирует межклассовое расстояние в пространстве признаков. В этих методах предполагается, что классы линейно разделимы.

Матрица $\textbf{W}$ для проецирования пространства изображения на пространство признаков выбирается из следующего условия: $$ \textbf{W}_{\textrm{opt}}= \textrm{arg} \max_\textbf{W} \frac{\textbf{W}^T \textbf{S}_\textbf{B} \textbf{W}}{\textbf{W}^T \textbf{S}_\textbf{W} \textbf{W}}, $$ где $\textbf{S}_{\textbf{B}}$ - матрица межклассовой дисперсии, $\textbf{S}_{\textbf{W}}$ - матрица внутриклассовой дисперсии.

Может существовать до $c-1$ векторов составляющих базис пространства признаков, где $c$ - общее число классов. С помощью этих векторов пространство изображений переводится в пространство признаков.

Поскольку работа непосредственно с матрицей $\textbf{S}_\textbf{W} \in {R}^{n\times n} $ затруднительна из-за ее размерности, используется предварительное уменьшение размерности с помощью метода главных компонент, и затем вычисления производятся в пространстве меньшей размерности: $$ \textbf{W}_\textrm{fld}=\textrm{arg} \max_\textbf{W} \frac{\textbf{W}^T \textbf{W}_{\textrm{pca}}^T \textbf{S}_\textbf{B} \textbf{W}_{\textrm{pca}} \textbf{W}}{\textbf{W}^T \textbf{W}_{\textrm{pca}}^T \textbf{S}_\textbf{W} \textbf{W}_{\textrm{pca}} \textbf{W}}, $$ где $\textbf{W}_{\textrm{pca}}$ - матрица для проецирования в пространство меньшей размерности (пространство главных компонент).

Обычно тренировочный набор содержит изображения лиц при нескольких базовых условиях освещенности, на основе которых при помощи линейных комбинаций можно получить любые другие условия освещенности. Этот метод дает высокую точность распознавания (около 96{\%}) для широкого диапазона условий освещенности, различных выражений лица и наличия или отсутствия очков. Однако остаются невыясненными вопросы, применим ли этот метод для поиска в больших базах данных, может ли метод работать, когда в тренировочной выборке для некоторых лиц имеется изображение только в одних условиях освещенности. Для задачи детектирования лица с помощью LDA-классы лиц и "не лиц" разбивают на подклассы. Вышеописанный метод основывается на предположении о линейной разделимости классов в пространстве изображений. В общем случае такое предположение несправедливо. Инструмент для построения сложных разделяющих поверхностей предлагают нейросетевые методы.


Синтез объектов линейных классов.

Данный метод позволяет синтезировать новые изображения объекта (и в частности, изображения лица) для разных ракурсов. Имеется тренировочный набор изображений лиц и только одно изображение нового объекта в определенном ракурсе. Тренировочный набор состоит из изображений объектов того же класса (класс лиц в данном случае), что и новый объект, и включает в себя изображения различных лиц, причем для каждого лица имеются его изображения в широком диапазоне ракурсов. Для нового объекта, имеющего изображение $X^{A}$ в ракурсе $A$, осуществляется линейное разложение на изображения объектов из тренировочного набора в том же ракурсе, с вычислением коэффициентов $\alpha_i : X^A = \sum_{i=1}^{q}\alpha_i X_i^A , $ где $q$ - количество объектов в тренировочном наборе. Синтез изображения $X^{B}$ в новом ракурсе $B$ для нового объекта осуществляется сложением изображений из тренировочного набора в ракурсе $B$ с теми же коэффициентами: $X^B = \sum_{i=1}^{q}\alpha_i X_i^B $. Таким образом, метод позволяет синтезировать изображения нового объекта в различных ракурсах по изображению в одном ракурсе без привлечения сложных трехмерных моделей. Данный метод является перспективным для синтеза изображений в новых ракурсах без привлечения сложных трехмерных моделей, однако вопрос о качестве и количестве примеров в тренировочном наборе остается открытым.

Гибкие контурные модели лица.

В данных методах распознавание производится на основе сравнения контуров лица. Контуры обычно извлекаются для линий головы, ушей, губ, носа, бровей и глаз. Контуры представлены ключевыми позициями, между которыми положение точек, принадлежащих контуру, вычисляются интерполированием. Для локализации контуров в различных методах используется как априорная информация, так и информация, полученная в результате анализа тренировочного набора. Обычно ключевые точки размещаются вручную на наборе тренировочных изображений. При поиске контуров нового лица используется метод симуляции отжига с целевой функцией из двух составляющих. Для первой из них ищется максимум при соответствии интенсивностей пикселов, извлеченных на перпендикулярной контуру линии, аналогичным пикселам из тренировочной выборки, для второй - при совпадении контура с формой контуров тренировочных примеров. Таким образом, извлекается контур черт лица. Для сравнения изображений используются значения главных компонент, вычисленные на наборе векторов, представляющих собой координаты ключевых точек. Главной задачей при распознавании по контурам является правильное выделение этих контуров. В общем виде эта задача по сложности сравнима непосредственно с распознаванием изображений.

Сравнение эластичных графов.

В этом методе (Elastic Bunch Graph Matching) лицо представляется в виде графа, вершины которого расположены на ключевых точках лица таких, как контуры головы, губ, носы, и их крайних точках. Каждая грань помечена расстояниями между ее вершинами. В каждой такой точке вычисляются коэффициенты разложения по функциям Габора для пяти различных частот и восьми ориентаций. Набор таких коэффициентов $\textbf{J} = \{J_j\}$ называется $\textit{джетом}$ (jet). Джеты характеризуют локальные области изображений и служат для двух целей: во-первых, для нахождения точек соответствия в заданной области на двух различных изображениях; во-вторых - для сравнения двух соответствующих областей различных изображений. Каждый коэффициент $J_j = a_j \exp (i \phi_j)$ для точек из одной области различных изображений характеризуется амплитудой $a_j$, которая медленно меняется с изменением положения точки, и фазой $\phi_j$, которая вращается со скоростью, пропорциональной частоте волнового вектора базисной функции. Поэтому в простейшем случае для поиска на новом изображении точки с аналогичными характеристиками в функции подобия фазу не учитывают: $$ S_a(\textbf{J}, \textbf{J}') = \frac{\sum_j a_ja_j^{\prime}}{\sqrt{\sum_j a_j^2 \sum_j a_j^{\prime 2}}} .$$ Функция подобия с одним джетом в фиксированной позиции и другим с переменной позицией является достаточно гладкой, для того чтобы получить быструю и надежную сходимость при поиске с применением простейших методов таких, как диффузия или градиентный спуск. Более совершенные функции подобия привлекают информацию о фазе. Для различных ракурсов соответствующие ключевые точки отмечаются вручную на тренировочном наборе. Кроме того, чтобы для одного и того же лица представить различные вариации его изображения в одном и том же графе, для каждой точки используются несколько джетов, каждый из которых может соответствовать различным локальным характеристикам данной точки, например, открытому и закрытому глазу. Процесс распознавания неизвестного лица состоит в сравнении графа изображения лица $G^I$ со всеми остальными графами из набора $B$ при помощи функции подобия $$ S_B (G^I , B)= \frac{1}{N} \sum_n \max_m S_{\phi}(J_n^I , J_n^{Bm})- \frac{\lambda}{E}\sum_e \frac{(\Delta \textbf{x}_e^I - \Delta \textbf{x}_e^B)^2}{(\Delta \textbf{x}_e^B)^2}. $$

Левая сумма характеризует подобие джетов, вычисленное с применением фазочувствительной функции, правая - топографическое соответствие, которое пропорционально квадрату разности расстояний между соответствующими вершинами сравниваемых изображений, $N$ - количество вершин, $E$ - количество граней, $\lambda$ - коэффициент относительной важности топографической информации.

В представленном выше виде метод способен достаточно надежно распознавать при изменениях ракурса до $20$° ; при больших углах точность распознавания резко уменьшается, функция подобия оказывается более чувствительной к ракурсу, чем к межклассовым различиям. Дальнейшее развитие метода заключается в извлечении коэффициентов важности на основе анализа обучающей выборки. Для каждого джета симплекс-методом вычисляется коэффициент важности, который затем используется в функции подобия. Коэффициенты важности вычисляются из условия максимизации функции подобия для одного и того же лица и минимизации - для различных лиц. Существуют также более ранние разновидности этого метода, которые не используют изначально определенные ключевые точки и структуры графа. Одни из них используют для сравнения решетки джетов, наложенные на изображение, рис. 3. В неизвестном изображении отыскиваются точки соответствия, и затем по найденным точкам строится искаженная решетка и измеряется мера ее искажения для определения наиболее похожего изображения. В других методах точки извлечения джетов изначально образуют решетку, а затем наименее пригодные для распознавания точки отсеиваются в процессе обучения.

7-6-3.jpg

Наложенная на изображение эластичная решетка и ее искаженная версия


Методы, основанные на геометрических характеристиках лица.

Один из самых первых методов - это анализ геометрических характеристик лица. Изначально он применялся в криминалистике и был там детально разработан. Потом появились компьютерные реализации этого метода. Суть его заключается в выделении набора ключевых точек (или областей) лица и последующем выделении набора признаков. Каждый признак является либо расстоянием между ключевыми точками, либо отношением таких расстояний. В отличие от метода сравнения эластичных графов, здесь расстояния выбираются не как дуги графов. Наборы наиболее информативных признаков выделяются экспериментально.

Ключевыми точками могут быть уголки глаз, губ, кончик носа, центр глаза и т. п. рис. 4. В качестве ключевых областей могут служить прямоугольные области, включающие в себя: глаза, нос, рот.


В процессе распознавания сравниваются признаки неизвестного лица с признаками, хранящимися в базе. Задача нахождения ключевых точек приближается к трудоемкости непосредственно распознавания, и правильное нахождение ключевых точек на изображении во многом определяет успех распознавания. Поэтому изображение лица человека должно быть без помех, мешающих процессу поиска ключевых точек. К таким помехам относят очки, бороды, украшения, элементы прически и макияжа. Освещение желательно равномерное и одинаковое для всех изображений. Кроме того, изображение лица должно иметь фронтальный ракурс, возможно, с небольшими отклонениями. Выражение лица должно быть нейтральным. Это связано с тем, что в большинстве методов нет модели учета таких изменений.

Таким образом, данный метод предъявляет достаточно строгие требования к условиям съемки и нуждается в надежном механизме нахождения ключевых точек для общего случая. Кроме того, требуется применение более совершенных методов классификации или построения модели изменений. В общем случае этот метод не является самым оптимальным, однако для некоторых специфических задач все же перспективен. К таким задачам можно отнести документный контроль, когда требуется сравнить изображение лица, полученного в текущий момент, с фотографией в документе. При этом других изображений этого человека не имеется, и, следовательно, механизмы классификации, основанные на анализе тренировочного набора, недоступны.

7-6-4.jpg

Идентификационные точки и расстояния: $\textit{а}$ - используемые при криминалистической экспертизе; $\textit{б}$ - наиболее часто применяемые при построении автоматизированных систем идентификации


Сравнение шаблонов.

Сравнение шаблонов (Template Matching) заключается в выделении областей лица на изображении рис. 5, и последующем сравнении этих областей для двух различных изображений. Каждая совпавшая область увеличивает меру сходства изображений. Это также один из исторически первых методов распознавания человека по изображению лица. Для сравнения областей используются простейшие алгоритмы вроде попиксельного сравнения.


Недостаток этого метода заключается в том, что он требует много ресурсов как для хранения участков, так и для их сравнения. Ввиду того, что используется простейший алгоритм сравнения, изображения должны быть сняты в строго установленных условиях: не допускается заметных изменений ракурса, освещения, эмоционального выражения и пр.


7-6-5.jpg

Области, входящие в шаблон лица

Скрытые Марковские модели.

Марковские модели являются мощным средством моделирования различных процессов и распознавания образов. По своей природе Марковские модели позволяют учитывать непосредственно пространственно-временные характеристики сигналов, и поэтому получили широкое применение в распознавании речи, а в последнее время - изображений (в частности, изображений лиц). Каждая модель $\lambda = \langle \textbf{A}, \textbf{B}, \boldsymbol\pi \rangle$, представляет собой набор $N$ состояний $S = \{S_1 , S_2 , \ldots , S_N\}$, между которыми возможны переходы. В каждый момент времени система находится в строго определенном состоянии. В наиболее распространенных Марковских моделях $\textit{первого порядка}$ полагается, что следующее состояние зависит только от текущего состояния. При переходе в каждое состояние генерируется наблюдаемый символ, который соответствует физическому сигналу с выхода моделируемой системы. Набор символов для каждого состояния $V = \{v_1 , v_2 , \ldots, v_M \}$, количество символов $M$. Выход, генерируемый моделью, может быть так же непрерывным. Существуют так же модели, в которых набор символов для всех состояний одинаков. Символ в состоянии $q_t = S_j$ в момент времени $t$ генерируется с вероятностью $b_{j k} = P ( v_{k} | q_i = S_j)$. Набор всех таких вероятностей составляет матрицу $\textbf{B}= \{b_{j k}\}$.

Матрица $\textbf{A} = ||a_{ij}||$ определяет вероятность перехода из одного состояния в другое: $a_{ij} = P ( q_{i+1} = S_j | q_i = S_i )$, $1\le i, j \le N$. Считается, что $A$ не зависит от времени. Если из каждого состояния можно достичь любого другого за один переход, то все $a_{ij} > 0$, и модель называется эргодической. Модель имеет вероятность начальных состояний $\boldsymbol\pi = \{ \pi_i \}$, где $\pi_i = P (q_1 = S_i)$. Обычно в реальных процессах последовательность состояний является скрытой от наблюдения и остается неизвестной, а известен только выход системы, последовательность наблюдаемых символов $O = O_1 O_2 \ldots O_T$, где каждое наблюдение $O_t$ - символ из $V$, и $T$ - число наблюдений в последовательности. Поэтому такие модели называют $\textit{скрытыми}$ Марковскими моделями (Hidden Markov Models, $\textit{HMM}$).

Модель $\boldsymbol\lambda = \langle \textbf{A}, \textbf{B} , \boldsymbol\pi \rangle$ с настроенными параметрами может быть использована для генерирования последовательности наблюдений. Для этого случайно, в соответствии с начальными вероятностями $\boldsymbol\pi$ выбирается начальное состояние, затем на каждом шаге вероятность $\textbf{B}$ используется для генерации наблюдаемого символа, а вероятность $\textbf{A}$ - для выбора следующего состояния. Вероятность $P$ генерирования моделью $\lambda$ последовательности состояний $O$: $$ P(O|Q, \lambda ) = \prod_{t-1}^T b_{q_t} (O_t) $$ где $Q = q_1 q_2 \ldots q_T$ - последовательность состояний. Предполагается, что наблюдения статистически независимы.

В распознавании образов скрытые Марковские модели применяются так. Каждому классу $i$ соответствует своя модель $\lambda_i$. Распознаваемый образ (речевой сигнал, изображение и т. д.) представляется в виде последовательности наблюдений $O$. Затем для каждой модели $\lambda_i$ вычисляется вероятность того, что эта последовательность могла быть сгенерирована именно этой моделью. Модель $\lambda_i$, получившая наибольшую вероятность, считается наиболее подходящей, и образ относят к классу $j$.

В связи с этим появляются несколько вопросов, называемых тремя основными задачами скрытых Марковских моделей.


  1. Имея последовательность наблюдений

$O = O_1 O_2 \ldots O_T$ и настроенную модель $\boldsymbol\lambda = \langle\textbf{A}, \textbf{B}, \boldsymbol\pi\rangle$, как оценить вероятность $P(O|\lambda)$ генерации этой моделью данной последовательности наблюдений? Эта задача называется задачей распознавания.

  1. Имея последовательность наблюдений

$O = O_1 O_2 \ldots O_T$ и настроенную модель $\boldsymbol\lambda = \langle\textbf{A}, \textbf{B}, \boldsymbol\pi\rangle$, как подобрать последовательность состояний $Q = q_1 q_2 \ldots q_T$, чтобы она была оптимальной (в соответствии с некоторым критерием, аналитически эта задача неразрешима)? Другими словами, это задача объяснения. Она нужна для последующей коррекции параметров модели.

  1. Каким образом корректировать параметры модели

$\lambda$, для того чтобы максимизировать $P(O|\lambda)$? То есть как сделать так, чтобы модель больше соответствовала своему классу, одним из образов которого является данная последовательность наблюдений (или несколько различных последовательностей)? Это задача обучения.


Первая задача имеет точное аналитическое решение, называемое процедурой прямого-обратного прохода. Последующие две задачи не имеют точного аналитического решения. Для решения второй задачи используется алгоритм Витерби, для третей - алгоритм Баума - Вельча. Оба этих метода являются разновидностями градиентного спуска и решаются оптимизационными методами.

7-6-6.jpg

Линейная Марковская модель


Для того чтобы сократить вычисления, в распознавании речи используются линейные модели рис. 6. В таких моделях каждое состояние имеет только одно последующее, так же переход возможен обратно в то же состояние. Такие модели учитывают временн ые характеристики речевого сигнала: определенный порядок следования участков сигнала, их взаимное расположение, возможность локальных растяжений или сжатий. Это позволяет их применять и в распознавании изображений.



Суть двумерных Марковских моделей заключается в том, что, в отличие от одномерных линейных СММ, они позволяют моделировать искажения изображения и взаимное расположение участков не отдельно по горизонтали или вертикали, а в обоих направлениях одновременно. Для уменьшения вычислительной сложности применяются псевдодвумерные СММ (Pseudo-2D Hidden Markov Models, $\textit{P2D-HMM}$). Такая модель состоит из нескольких линейных вертикальных моделей нижнего уровня и одной линейной горизонтальной модели верхнего уровня, на вход которой поступают выходы моделей нижнего уровня, рис. 7. Каждое



7-6-7.jpg

Псевдодвумерная скрытая Марковская модель

7-6-8.jpg

Извлечение участков-образцов наблюдения

состояние модели верхнего уровня включает в себя последовательность состояний соответствующей модели нижнего уровня. Модели нижнего уровня не связаны между собой. Изначально в модели верхнего уровня были вертикальными. В последующих работах модели верхнего уровня были сделаны горизонтальными (как это и изображено на рисунке), для того чтобы вертикальные модели нижнего уровня могли учесть тот факт, что глаза могут находиться на разной высоте. Таким образом, псевдодвумерная модель позволяет учесть локальные деформации и взаимное расположение участков изображений. Но в отличие от оптических потоков и других методов сопоставления деформациями, псевдодвумерная модель учитывает характер деформаций, а то, какими именно могут быть возможные деформации, псевдодвумерные СММ усваивают в процессе обучения. Другими словами, участок, соответствующий глазу, никогда не будет сопоставлен, например, участку на месте рта.



Пример функционирования СММ. Входом СММ являются квадратные участки изображений (рис. 8). Было обнаружено, что участки, извлекаемые с 75{\%} перекрытием друг с другом, дают наилучшую точность распознавания.


Для СММ важное значение имеет начальная инициализация модели. В качестве начальной инициализации всех моделей используются все изображения из тренировочного набора. Затем модель каждого класса настраивается на свои изображения.

Недостатком СММ является то, что СММ не обладает различающей способностью, т. е. алгоритм обучения только максимизирует отклик каждой модели на свои классы, но не минимизирует отклик на другие классы и не выделяются ключевые признаки, отличающие один класс от другого. Таким образом, похожие классы могут оказаться слабо различимыми и при увеличении объема базы или использования в более широких условиях СММ может оказаться ненадежными.

Многослойные нейронные сети.

Архитектура многослойной нейронной сети (МНС) состоит из последовательно соединенных слоев, где нейрон каждого слоя своими входами связан со всеми нейронами предыдущего слоя, а выходами - следующего. НС с двумя решающими слоями может с любой точностью аппроксимировать любую многомерную функцию. НС с одним решающим слоем способна формировать линейные разделяющие поверхности, что сильно сужает круг задач, ими решаемых, в частности, такая сеть не сможет решить задачу типа "исключающее или". НС с нелинейной функцией активации и двумя решающими слоями позволяет формировать любые выпуклые области в пространстве решений, а с тремя решающими слоями - области любой сложности, в том числе и невыпуклой. При этом МНС не теряет своей обобщающей способности. Обучаются МНС при помощи алгоритма обратного распространения ошибки, являющегося методом градиентного спуска в пространстве весов с целью минимизации суммарной ошибки сети. При этом ошибки (точнее, величины коррекции весов) распространяются в обратном направлении от входов к выходам, сквозь веса, соединяющие нейроны. Простейшее применение однослойной НС (называемой автоассоциативной памятью) заключается в обучении сети восстанавливать подаваемые изображения. Подавая на вход тестовое изображение и вычисляя качество реконструированного изображения, можно оценить, насколько сеть распознала входное изображение. Положительные свойства этого метода заключаются в том, что сеть может восстанавливать искаженные и зашумленные изображения, но для более серьезных целей он не подходит. МНС также используется для непосредственной классификации изображений - на вход подается или само изображение в каком-либо виде, или набор ранее извлеченных ключевых характеристик изображения, на выходе нейрон с максимальной активностью указывает принадлежность к распознанному классу (рис. 9).


Нейрон с максимальной активностью (здесь первый) указывает принадлежность к распознанному классу. Если эта активность ниже некоторого порога, то считается, что поданный образ не относится ни к одному из известных классов. Процесс обучения устанавливает соответствие подаваемых на вход образов с принадлежностью к определенному классу. Это называется "обучением с учителем". В применении к распознаванию человека по изображению лица такой подход хорош для задач контроля доступа небольшой группы лиц. Он обеспечивает непосредственное сравнение сетью самих образов, но с увеличением числа классов время обучения и работы сети возрастает экспоненциально, и поэтому для таких задач, как поиск похожего человека в большой базе данных, требует извлечения компактного набора ключевых характеристик, на основе которых можно производить поиск.


В частности, МНС может использоваться для классификации изображений лиц на основе таких характеристик, как расстояния между некоторыми специфическими частями лица (нос, рот, глаза). Также существуют гибридные системы, например объединение с марковской моделью. В классической МНС межслойные нейронные соединения полносвязны, и изображение представлено в виде одномерного вектора, хотя оно двумерно. Архитектура сверточной НС направлена на преодоление этих недостатков. В ней используются локальные рецепторные поля (обеспечивают локальную двумерную связность нейронов), общие веса (обеспечивают детектирование некоторых черт в любом месте изображения) и иерархическая организация с пространственными подвыборками (spatial subsampling). Сверточная НС (СНС) обеспечивает частичную устойчивость к изменениям масштаба, смещениям, поворотам, искажениям. Архитектура СНС состоит из многих слоев, каждый из которых имеет несколько плоскостей, причем нейроны следующего слоя связаны только с небольшим числом нейронов предыдущего слоя из окрестности локальной области (как в зрительной коре человека). Веса в каждой точке одной плоскости одинаковы (сверточные слоя). За сверточным слоем следует слой, уменьшающий его размерность путем локального усреднения. Затем опять сверточный слой, и так далее. Таким образом, достигается иерархическая организация. Более поздние слои извлекают более общие характеристики, меньше зависящие от искажений изображения. Обучается СНС стандартным методом обратного распространения ошибки. Сравнение МНС и СНС показало существенные преимущества последней как по скорости, так и по надежности классификации. Полезным свойством СНС является и то, что характеристики, формируемые на выходах верхних слоев иерархии, могут быть применимы для классификации по методу ближайшего соседа (например, вычисляя евклидово расстояние), причем СНС может успешно извлекать такие характеристики и для образов, отсутствующих в обучающем наборе. Для СНС характерны высокая скорость обучения и работы. Тестирование СНС на базе данных ORL, содержащей изображения лиц с небольшими изменениями освещения, масштаба, пространственных поворотов, положения и различными эмоциями, показало приблизительно 98{\%} точность распознавания, причем для известных лиц предъявлялись варианты их изображений, отсутствующие в обучающем наборе. Такой результат делает эту архитектуру перспективной для дальнейших разработок в области распознавания изображений пространственных объектов. МНС применяются и для обнаружения объектов определенного типа. Помимо этого, любая обученная МНС в некоторой мере может определять принадлежность образов к "своим" классам, ее можно специально обучить надежному детектированию определенных классов. В этом случае выходными классами будут классы, принадлежащие и не принадлежащие к заданному типу образов.


7-6-9.jpg

Многослойная нейронная сеть для классификации изображений


Сети Габоровых вейвлетов (GWN).

Данный метод предназначен для слежения за лицом в реальном времени с помощью Gabor wavelet template (GWT), представляющего собой дискретную линейную комбинацию Габоровых вэйвлетов. Важно отметить, что точность представления лица регулируется числом Габоровых вэйвлетов в GWN, допуская представления множества лиц одним GWT. Такое представление допускает произвольные аффинные преобразования и быструю оценку аффинных параметров методом градиентного спуска. Тем самым, выполняя слежение за лицом, метод определяет и его ориентацию, однако с ограничением на повороты: допускаются, в основном, повороты в плоскости и незначительные пространственные вокруг вертикальной оси.

Нейронные сети Хопфилда.

НС Хопфилда (НСХ) является однослойной и полносвязной (связи нейронов на самих себя отсутствуют), ее выходы связаны со входами. В отличие от МНС, НСХ является релаксационной - т. е. будучи установленной в некое начальное положение функционирует до тех пор, пока не достигнет стабильного состояния, которое и будет являться ее выходным значением. НСХ применяются в качестве ассоциативной памяти и для решения оптимизационных задач. В первом случае НСХ обучается без учителя (например, по правилу Хебба), во втором случае веса между нейронами изначально кодируют решаемую задачу. НСХ бывают синхронными, когда одновременно пересчитываются все нейроны, и асинхронными, когда пересчитывается случайно выбранный нейрон. Для исследования динамики функционирования НСХ используются методы Ляпунова. Асинхронная НСХ всегда сходится к устойчивым точкам, а аттракторами синхронной НСХ являются устойчивые стационарные точки и предельные циклы длины два. Таким образом, НСХ из начального состояния сходится к ближайшему локальному минимуму энергии сети, состояние нейронов в котором и будет восстановленным образом для задач распознавания, и решением - для оптимизационных задач. Для поиска глобального минимума применительно к оптимизационным задачам используют стохастические модификации НСХ.

Применение НСХ в качестве ассоциативной памяти позволяет точно восстанавливать образы, которым сеть обучена, при подаче на вход искаженного образа. При этом сеть "вспомнит" наиболее близкий (в смысле локального минимума энергии) образ, и распознает его. Такое функционирование также можно представить как последовательное применение автоассоциативной памяти. В отличие от автоассоциативной памяти, НСХ идеально точно восстановит образ.

Хотя разработка систем идентификации по изображениям человеческих лиц ведется уже несколько десятилетий, задача создания эффективного алгоритма идентификации по изображениям человеческих лиц еще далека от завершения.

Для большинства современных систем автоматического распознавания лиц основной задачей является задача сравнения данного изображения лица с набором изображений лиц из базы данных. Характеристики систем автоматического распознавания лиц в этом случае оцениваются путем определения вероятностей ошибочного отказа в распознавании (для изображения лица, присутствующего в базе, принимается решение как о неопознанном лице) и ошибочного распознавания. В дополнение к вероятностям ошибок для оценки системы автоматического распознавания лиц часто используется оценка устойчивости к возмущению изображений, вызываемая комбинацией со сложными фонами, изменчивостью освещения, изменению прически, и т. д.

Выбор алгоритма или группы алгоритмов идентификации лиц для создания практических систем автоматического распознавания лиц должен основываться на системе оценок рабочих характеристик конкретной системы, соответствующей ограничениям, связанным с условиями эксплуатации данной конкретной системы, и определяется непосредственно на этапе проектирования.

Дактилоскопия

Краткий исторический обзор.

Исследования в области биометрии начались более ста лет назад с разработки методов сравнения отпечатков пальцев. В 1891 г. англичанин Френсис~Гальтон предложил систему классификации папиллярных узоров. Статья с его выводами была опубликована в журнале "Природа", но не обратила на себя должного внимания. В $1892$ г. вышла его книга "Отображение пальцев", в которой впервые рассматривалась возможность идентификации человека по оттискам пальцев. В книге были сделаны три основополагающих вывода: узор папиллярных линий остается неизменным на протяжении всей жизни человека, узор неповторим и индивидуален, узор поддается классификации.

Позднее более совершенную систему классификации отпечатков пальцев разработал другой англичанин - Эдуард Ричард Генри, шеф Скотланд-Ярда. В конце 1896 г. он нашел способ приведения в порядок огромной картотеки, в которой хранились отпечатки пальцев. Система классификации Генри обеспечила возможность быстрого поиска нужной карточки. На помощь пришли пять выделенных типов узоров: дуговой, шатровый, радиально-петлевой, ульнарно-петлевой и завитковый.

Результаты исследований Генри были опубликованы в его книге "Классификация и использование отображений пальцев", изданной в Индии. Работа оказалась настолько удачной, что, будучи представленной комиссии ученых, получила положительную оценку, а полиция приобрела мощный метод доказательства. В $1902$ г. английский суд впервые признал факт совпадения отображений пальцев как доказательство. В России дактилоскопия начала использоваться с $1906$ г., когда циркуляром Главного тюремного управления она была введена для регистрации в тюрьмах. В $1908$ г. дактилоскопия начала использоваться в поисковых отделениях больших городов.

В настоящее время разработаны известные математические модели для доказательства индивидуальности узоров отпечатков пальцев. Отпечатки пальцев, а в настоящее время и ладоней, благодаря совершенствованию техники дактилоскопической экспертизы и развитию компьютерных технологий, играют все возрастающую роль в задаче идентификации человека.

Исторически сложилось так, что изучение папиллярных узоров проводилось в рамках нескольких научных направлений.

$\textit{Первое}$ из них можно назвать естественно-научным. Труды значительного числа основоположников этого направления были в наше время обобщены. Э.~Локар дал общую характеристику свойств папиллярных узоров, выделив среди них те, которые имеют значение для идентификации (постоянство, неизменяемость и разнообразие), отражают закономерности наследования, указывают на половые и возрастные различия, свидетельствуют о наследственных заболеваниях. Дальнейшие исследования были направлены на анализ отражения наследственных заболеваний в папиллярном узоре, на изучение связей узора с морфологией человека и закономерностей распределения узоров в различных расах. Исследования в рамках естественно-научного направления показали, что папиллярные узоры есть не что-то внешнее по отношению к организму, а отражают сложные функциональные зависимости в таком системном образовании, как организм человека. Они определили пути специальных научных исследований с целью разработки новых экспертных методик для решения криминалистических задач.

$\textit{Второе}$ направление исследований связано с совершенствованием научных основ дактилоскопической экспертизы. Здесь выделяются работы, связанные с классификацией папиллярных узоров и частных признаков, с оценкой идентификационной значимости частных признаков, с выработкой концепции по обоснованию тождества или непрерывной классификации. Изучению подверглись научные основы пороскопической экспертизы, которая может применяться в тех случаях, когда дактилоскопия не решает вопрос о тождестве.

Это направление привело к разработке новых экспертных методик идентификации человека по следам пальцев рук и ладоней, идентификации родителей по папиллярным узорам детей, идентификации новорожденных по отпечаткам стоп. В это же время была разработана методика вероятностного определения пола по имеющемуся оттиску пальца или руки.

$\textit{Третье}$ направление относится к автоматизации дактилоскопических экспертиз. Это установление личности неопознанных трупов; установление лиц, скрывающих анкетные данные, и лиц, оставивших следы и поставленных на дактилоскопический учет; установление факта, одним лицом или разными лицами оставлены следы рук, изъятые с мест различных преступлений; аутентификация личности в пропускных системах и системах ограниченного доступа; таможенный контроль.

Проблематика автоматической дактилоскопической идентификации активно развивается с середины прошлого века:

в 1960-е годы биометрическое подразделение NIST проводит первые попытки автоматизации процесса идентификации личности по отпечаткам пальцев;

в 1970-е годы разрабатываются первые автоматизированные дактилоскопические системы;

в 1980-е годы разрабатываются первые методы полностью автоматической идентификации.

В настоящее время задача автоматической идентификации по отпечаткам пальцев рук решается при помощи автоматизированных дактилоскопических информационных систем (АДИС). В мире насчитывается более сотни АДИС, наиболее известными из которых являются японская система NEC, французская система SAGEM, канадская система PRINTRAK, американская система COGENT, российская система PAPILLON.

При исследовании реальных объектов зачастую приходится принимать во внимание разнообразные неопределенные факторы, действующие на отпечаток пальцевого узора. Эти факторы могут быть связаны, например, со свойствами следообразующего материала, с деформацией пальца в момент следообразования, с дефектами кожи в виде ожогов, шрамов, складок, грязи и шелушения.

Работа в АДИС начинается с регистрации изображений в устройстве ввода отпечатков пальцев или ладоней. Изображения в электронно-цифровом виде формируются в результате сканирования дактилокарт с помощью планшетного сканера, ввода пальцев и ладоней с "живого сканера", фотографирования цифровым фотоаппаратом следов пальцев и ладоней с фотопленки.

Рассмотрим основные свойства отпечатков пальцев, ладоней и их следов.

Признаки отпечатков и следов.

Узоры на коже пальцев рук образуются кожными гребешками, сформированными двумя рядами сосочков, имеющих разнообразную форму, между которыми на некотором расстоянии друг от друга расположены отверстия потовых канальцев. Гребешки отделяются друг от друга бороздками. Почти параллельные между собой, выпуклые линии гребешков образуют на поверхности кожи узорчатые потоки - $\textit{общие признаки}$ - рисунки в виде петель, дельт, завитков и карманов. Две дельты и один завиток видны на рис. 10. Сочетание общих признаков обычно задает классификацию отпечатка по типам узоров, которых может быть более десятка, как в системе Генри. Однако наиболее популярны дуговой, шатровый, правопетлевой, левопетлевой, завитковый, сложнозавитковый и неопределенный типы узоров.

У человека в процессе роста организма узор из линий возникает и развивается вокруг некоторого центра, формируя петли, завитки, двойные петли... К положению этого центра на пальце разрастаются две другие системы волнистости: одна идет от выпуклости вокруг ногтя, а другая - от углубления между фалангами. В месте встречи трех систем волнистости обычно образуются дельты. Частично сформированные общие признаки называют ложными петлями, ложными дельтами или ложными завитками. Следует отметить сложность критериев отличия общих признаков от их ложных собратьев.

Криминалистическая дактилоскопия имеет дело с отпечатками пальцев. На отпечатках, пригодных для дактилоскопического анализа, видны образованные краской или потожировыми веществами чередующиеся светлые и темные линии. Эти линии, обычно соизмеримой величины, - след от гребней и бороздок кожи пальцев. Их называют папиллярными линиями, или просто $\textit{линиями}$. Светлые линии, наблюдающиеся между следами от гребней кожи, принято называть $\textit{просветами}$.

Сумму ширины темной и светлой линии в некоторой окрестности отпечатка называют $\textit{периодом}$ линий $T$. На него опираются инвариантные метрические отношения признаков отпечатка. Величина периода $T$ непостоянна в различных областях одного и того же отпечатка, варьирует на отпечатках разных пальцев одного человека и разных людей. Обычно его величина лежит в пределах $0{,}25$ - $0{,}85$~мм, в среднем $T=0{,}48$~мм.

Совокупность нескольких почти параллельных папиллярных линий, не образующих общие признаки, называют $\textit{потоком}$. Обычно поток образуется двумя и более линиями. Количество их определяет мощность потока. Количество линий в потоке не постоянно. Линии оканчиваются или начинаются, соединяются или расщепляются. Таким образом, в местах изменения мощности потока образуются $\textit{частные признаки}$: окончания и начала линий, их соединения и расщепления (см. рис. 10). Такое разделение признаков условно, поскольку зависит от направления движения по потоку. Известны работы, в которых выделяется до $13$ частных признаков: окончание линии, расщепление линии, фрагмент, островок, точка, примыкание, мостик, крючок, дельта, пересечение, утроение линии, прерывание линии, другие признаки. Фактически это составные признаки, которые могут быть синтезированы комбинацией расщеплений и окончаний. Поэтому для методов автоматического кодирования изображений существенны два их типа: $\textit{окончание и расщепление линии}$, к которым иногда добавляют $\textit{кросс}$ - пересечение двух линий. Окончание и расщепление могут переходить одно в другое (мутировать) в зависимости от характера следообразования и свойств следообразующего материала. Другие элементы отпечатков и следов (мостики, крючки, глазки, фрагменты линий, межпапиллярные линии, микровключения, микроразрывы линий и др.) не влияют на мощность потока из-за их малых размеров. Количество частных признаков сильно варьируется на различных отпечатках, а те области отпечатка, которые их не содержат, также важны в информативном отношении.

Продольные границы линий содержат микронеровности размером до $0{,}5T$, которые не учитываются при определении периода. Линии, как правило, утолщаются в местах расположения отверстий потовых канальцев. Эти отверстия на качественном отпечатке выглядят контрастно выделяющимися на линиях светлыми пятнами, отстоящими друг от друга на величину не менее $0{,}5T$; их диаметр не превосходит $0{,}3T$.

Иногда на отпечатках между линиями нормальной ширины встречаются сверхтонкие линии шириной до $0{,}3T$ или их короткие обрывки - межпапиллярные линии. Кроме того, на отпечатках хаотично присутствуют микродетали размером до $0{,}25T$, возникающие из-за потового покрытия и шелушения кожи или неоднородности красителя и материала - носителя изображения.

Наконец, на линиях из-за неровностей линий в большом количестве наблюдаются микроразрывы. Их ширина обычно бывает не более $0{,}5T$. На некоторых отпечатках (в источниках указывается до 10{\%}) эти микроразрывы совпадают на нескольких соседних линиях и образуют пересекающие узор тонкие светлые складки. Ширина складок близка к $0{,}5T$, а длина может достигать величины $20T$.


Стандартное разрешение для ДИ отпечатков пальцев, ладоней и следов составляет $500$ точек на дюйм. Если отпечаток пальца принадлежит ребенку, то ДИ стандартного разрешения может утратить читабельность частных признаков и даже папиллярных линий. В последнее время с развитием биометрических технологий интересным становится разрешение $1000$ точек на дюйм. При таком разрешении лучше видны общие и частные признаки ДИ, крючки, глазки, мостики, микродетали, поры, микроразрывы, примыкания и т. д.


7-6-10.jpg

Некоторые частные и общие признаки ДИ


Свойства отпечатков и следов.

При дактилоскопировании происходит неравномерное изменение расстояния между признаками узора. Это вызвано эластичностью кожи, возрастными и профессиональными изменениями размеров пальцев. Величина деформации кожи при ее соприкосновении с материалом неодинакова для различных фрагментов отпечатка: расстояние между признаками может изменяться до 40{\%}, взаимная ориентация признаков - до $30$° , однако и то и другое зависит от загрязненности кожи, направления линий, неровности поверхности. При крайне редких сложных деформациях кожи эти изменения могут возрастать.

При пересъемке отпечатков пальцев появляется еще один вид искажения - масштабный. Такое искажение появляется при пересъемке с криволинейных поверхностей, эластичных и гибких материалов, усыхающих материалов, а также при наклоне и смещении оптической оси фотоаппарата. Такие нарушения масштаба носят как общий, так и локальный характер. Компенсировать их не удается даже с помощью масштабной линейки.

Инструкция по дактилоскопированию пальцев в Российской Федерации предписывает размещать отпечатки на дактилоскопических картах внутри специальных рамок. Однако примерно 5{\%} отпечатков пальцев выходят за рамки, а для 2{\%} отпечатков пальцев наблюдается частичное взаимное наложение на краю рамок. Что касается отпечатков ладоней, то они вообще могут располагаться как угодно. Кроме того, организация работ в разных странах имеет собственную специфику. Например, в Перу принято вертикальное расположение прокатанных пальцев рук вдоль противоположных краев дактилокарты.

При дактилоскопировании продольная ось пальца должна быть установлена перпендикулярно нижнему обрезу дактилоскопической карты. Однако на практике наблюдаются отклонения от нормы, превышающие $30$° . Иногда сами пальцы прокатывают на произвольном расстоянии друг от друга, а пальцы правой руки располагают на неопределенном расстоянии от пальцев левой руки.

На границах отпечатков общая яркость изменяется плавно или скачком. Линия границы отпечатка преимущественно представляет собой выпуклую форму с локальными нарушениями выпуклости размером до $3T$. При повторной прокатке одного и того же пальца границы отпечатков не совпадают, а при повторном следообразовании - тем более.

Известен эффект смазывания отпечатка пальца. Отпечатки получаются смазанными, если пальцы проскальзывали по воспринимающей поверхности. На различных участках отпечатка смазывание почти всегда различно по величине и направлению. При прокатке пальца оно, как правило, не превышает $0,5T$, а линии не заходят друг на друга. При следообразовании этот процесс резко усложняется. На участках следа наблюдаются плавные или скачкообразные изменения величины смазывания с наложением линий друг на друга.


Неоднородности цвета и фактуры материала - носителя отпечатка - создают заметный фон искажений. Фон определяется оптическими свойствами бумаги. Дактилоскопирование в стационарных условиях осуществляется на белую бумагу, коэффициент отражения света которой может меняться до 5{\%}. При этом иногда используются случайно попавшиеся сорта бумаги с плохими световыми и цветовыми характеристиками, которые со временем неравномерно ухудшаются.

В случае следообразования узоры отпечатываются в виде фрагментов случайной формы, на которых явно проявляется текстура материала - носителя следа, а также линейная и нелинейная деформация узора линий. Иногда происходит наложение следов. В этом случае один узор просматривается через общий вид другого узора.

Образование фона на следах происходит в два этапа. Сначала в процессе следообразования на отпечаток узора накладывается видимая структура следообразующего материала. Такое наложение, как правило, вносит сильные искажения. Дополнительные искажения вносит операция съема следов на материал-носитель. В итоге происходит нелинейное совмещение изображений фона и узора, усложняющее реконструкцию изображений.

Широко распространенным типом искажений являются залипания и непропечатки линий. Иногда они занимают участки до половины площади узора. На границах таких участков видимые характеристики линий постепенно меняются, но иногда встречаются контрастные границы. По этой причине примерно 10{\%} отпечатков и 60{\%} следов не содержат информативной структуры линий. Под информативной структурой понимается узор отпечатка или следа пальца или ладони, который однозначно интерпретируется экспертом-криминалистом.

Квазипериодичность структуры линий сохраняется как на отпечатках, так и на следах. Она, как и ориентация потока, угадывается даже на сильно зашумленных и смазанных отпечатках и следах. Действительно, период линий $T$ устойчиво наблюдается при осмотре узора поперек линий.

Направление линий обычно изменяется плавно, иногда скачкообразно в области карманов, петель, дельт, завитков или мест с разрушенной структурой линий. Наряду с потоком вводится $\textit{кривизна}$ как изгиб потока вокруг некоторой области отпечатка. По кривизне определяют линии перегиба кривизны. При наличии деформации кривизна может скачкообразно менять свое направление, а линии перегиба кривизны смещаться.

Самое важное свойство отпечатков и следов пальцев и ладоней заключается в том, что они обладают постоянством и индивидуальностью. Их постоянство обусловлено тем, что папиллярные линии остаются неизменными на протяжении всей жизни человека. После поверхностных травм (царапин, легких ожогов, истертостей) линии восстанавливаются в прежнем виде со всеми своими характерными особенностями. Их индивидуальность основана на многообразии форм и взаимного расположения мелких деталей папиллярных узоров. В мире одинаковых отпечатков пальцев не обнаружено, даже у однояйцовых близнецов. Для установления тождества отпечатков пальцев и их следов в разных странах устанавливается минимально допустимое число частных признаков (от $8$ в Болгарии до $16$ в Италии). Этот минимум определяется оценками надежности идентификации, которые в открытых публикациях, однако, сильно расходятся. В России тождество отпечатков пальцев считается доказанным, если количество частных признаков превышает число~$12$.

Кодификация признаков.

Общие признаки узоров состоят из дельт, петель и завитков, к которым добавляются карманы. Карман - это протяженная область узора шириной до $2T$, в которой сталкиваются по-разному ориентированные потоки, не образующие дельт, петель и завитков. Структура узора внутри петель, дельт и завитков дополнительно описывается характером расположения папиллярных линий. Так формируются понятия: наполнение и плечи петли, рукава дельты, елочка в шатровом узоре и т. п. Проработана методика оценки точного местоположения петель, дельт и завитков по папиллярным линиям. На основе общих признаков строят схемы деления узоров на зоны и определяют гребневый счет, который совместно с комбинацией общих признаков определяет тип узора в соответствии с системой классификации Гальтона, Генри, Вуцетича, ФБР и др.

Таким образом, ключом к правильной классификации типов узоров является уверенное детектирование дельт, петель и завитков на отпечатках и следах пальцев рук. В действительности, однако, такой уверенности нет даже у эксперта, а о компьютерных технологиях и говорить не приходится. Задачу усложняют шрамы, ожоги, ложно-петлевые и ложно-завитковые узоры, редко встречающиеся и аномальные узоры.


Частные признаки определяются деталями строения папиллярных линий. В криминалистической литературе чаще встречается та классификация деталей, в основе которой лежит их конфигурация, имеющая несколько вложенных уровней описания. Для деталей, увеличивающих число линий в потоке, вводят начало и разветвление линии. Для деталей, уменьшающих число линий в потоке, вводят окончание и слияние линии. Другие детали узора, которые не влияют на число линий в потоке, кодируются как точка, обрывок, глазок, крючок, мостик. Начало, разветвление, окончание, слияние и глазок могут быть симметричными или асимметричными; точки - автономными или слитными; обрывки - прямыми или изогнутыми; крючки - восходящими или нисходящими, правыми или левыми; мостики - восходящими или нисходящими. Такое трехуровневое описание частных признаков узора считается исчерпывающим.

Известно несколько кодификаторов деталей узора, однако описание существенно упрощается и формализуется, если ввести кривизну линий в области частного признака и направление отслеживания линии, на которой или рядом с которой располагается деталь. Тогда все детали узора без исключения влияют на мощность потока, и остается определить минимальный размер области, для которой эта мощность измеряется. Это расширяет возможности автоматической интерпретации отпечатка, однако все равно эта интерпретация остается несовершенной: окончание может залипнуть в слияние, крючок и глазок замазаться и т. п. Свойства симметричности и автономности еще более неустойчивы.

Отпечатки имеют некоторое сходство рисунка, которое позволяет разбить их на классы. Внутриклассовое разделение отпечатков основывается на взаимном уникальном расположении общих и частных признаков. Качество автоматического распознавания общих и частных признаков ДИ определяет возможности аутентификации. К сожалению, современные технологии не позволяют сделать это безошибочно и быстро. Действительно, ДИ стандартного разрешения отпечатка обычной ладони занимает до $10 000 000$ байт памяти. При таких объемах данных работа в реальном режиме времени вряд ли возможна. Так называемые оперативные проверки задержанного по отпечаткам пальцев занимают минуты по базе данных в миллион дактилокарт, а по ладони и того больше. Поэтому для ДИ предварительно выполняют классификационный анализ (КА) и формируют систему признаков - шаблон, который затем сравнивают с другими шаблонами из базы данных (БД). Обычно у разработчиков шаблоны различаются, если они не ограничиваются стандартом. Функциональный отрыв на уровне архитектуры системы задачи обработки от задачи сравнения позволяет во много раз уменьшить время реакции системы.

Рассмотрим теперь несколько примеров биометрических приложений, встречающихся на практике.

Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты