Вычислительная реализуемость

Материал из Техническое зрение
(Различия между версиями)
Перейти к: навигация, поиск
 
Строка 1: Строка 1:
  
Несмотря на колоссальный путь, который
+
Несмотря на создание обширной специализированной процессорной базы для обработки
прошла в целом вычислительная техника
+
за последние декады двадцатого и первые годы двадцать первого века, несмотря
+
на создание обширной специализированной процессорной базы для обработки
+
 
изображений, в основной массе приложений, особенно промышленных приложений
 
изображений, в основной массе приложений, особенно промышленных приложений
 
реального времени, характеристики вычислителей и их свойства все еще далеки
 
реального времени, характеристики вычислителей и их свойства все еще далеки
Строка 13: Строка 10:
 
задачах всегда связано с процедурой $\textit{поиска}$ объекта. Именно реализация процедуры
 
задачах всегда связано с процедурой $\textit{поиска}$ объекта. Именно реализация процедуры
 
поиска объекта связана с угрозой лавинообразного роста потребного числа
 
поиска объекта связана с угрозой лавинообразного роста потребного числа
вычислений. Проиллюстрируем это на примере простой задачи поиска объекта на
+
вычислений.
основе сравнения с растровым эталоном или шаблоном (template). Если
+
построить какой-либо функционал соответствия между объектом размером $M
+
\times  M$ и фрагментом $M \times  M$ из изображения $N \times  N$, то
+
простой перебор фрагментов требует количества вычислений не менее чем
+
$M^{2} \times  N^{2}$ операций, что составляет, например, $10$ миллиардов
+
операций при размере объекта $50\times 50$, а изображения -  $2000\times
+
2000$ элементов. Даже принимая во внимание значительное увеличение
+
возможностей современных компьютеров, такие объемы вычислений занимают
+
секунды машинного времени, что далеко выходит за пределы требований систем
+
обнаружения реального времени, предназначенных для таких задач, как навигация
+
и наведение, инспекционный контроль, обработка машиночитаемых документов и
+
т. п.
+
  
 
Более того, реальные задачи обработки визуальной информации изобилуют
 
Более того, реальные задачи обработки визуальной информации изобилуют
Строка 41: Строка 26:
 
видеодатчиков (можно вспомнить, что бытовые цифровые фотоаппараты и даже
 
видеодатчиков (можно вспомнить, что бытовые цифровые фотоаппараты и даже
 
мобильные телефоны давно перешли отметку $2$ мегапиксела в ПЗС-матрице), мы
 
мобильные телефоны давно перешли отметку $2$ мегапиксела в ПЗС-матрице), мы
получим даже для простейших операций характерную оценку количества потребных
+
получим даже для простейших операций обработки изображения характерную оценку количества потребных
 
вычислений порядка нескольких гигафлопов операций на кадр. Причем
 
вычислений порядка нескольких гигафлопов операций на кадр. Причем
 
приложениям реального времени необходимо выполнять эти вычисления в темпе
 
приложениям реального времени необходимо выполнять эти вычисления в темпе
 
кадровой развертки, что приводит к оценке потребного быстродействия около $50$ Gflop/sec.
 
кадровой развертки, что приводит к оценке потребного быстродействия около $50$ Gflop/sec.
Сами по себе эти оценки не являются запредельными для мощных
+
При этом следует учесть, что основные приложения машинного зрения находятся в тех областях, где массогабаритные и стоимостные
современных компьютеров, однако следует учесть, что основные приложения
+
машинного зрения находятся в тех областях, где массогабаритные и стоимостные
+
 
характеристики конструируемых устройств по определению ограничены и должны
 
характеристики конструируемых устройств по определению ограничены и должны
 
быть весьма невелики.
 
быть весьма невелики.

Текущая версия на 16:37, 24 сентября 2020

Несмотря на создание обширной специализированной процессорной базы для обработки изображений, в основной массе приложений, особенно промышленных приложений реального времени, характеристики вычислителей и их свойства все еще далеки от желаемых.

Важное отличие, присущее процедурам обработки и анализа изображений по сравнению с задачами распознавания или интерпретации уже сегментированного образа, заключается в том, что обнаружение и измерение в практических задачах всегда связано с процедурой $\textit{поиска}$ объекта. Именно реализация процедуры поиска объекта связана с угрозой лавинообразного роста потребного числа вычислений.

Более того, реальные задачи обработки визуальной информации изобилуют дополнительными степенями свободы, когда искомая яркостно-геометрическая структура на изображении может иметь не только произвольные положение, угловую ориентацию и масштаб, но и подвергаться разным преобразованиям, не только аффинным или проективным, но и гораздо более сложным, таким как различные "резиновые" модели или "коробление" (warping - искажение, напоминающее смятую бумагу). Все это многократно увеличивает потребное для перебора время расчетов и требует применения качественно новых идей по организации процесса анализа изображения.

Оценивая размер изображения, предназначенного для обработки, например, как $1000$ на $1000$ элементов, что не является чем-то необычным для современных видеодатчиков (можно вспомнить, что бытовые цифровые фотоаппараты и даже мобильные телефоны давно перешли отметку $2$ мегапиксела в ПЗС-матрице), мы получим даже для простейших операций обработки изображения характерную оценку количества потребных вычислений порядка нескольких гигафлопов операций на кадр. Причем приложениям реального времени необходимо выполнять эти вычисления в темпе кадровой развертки, что приводит к оценке потребного быстродействия около $50$ Gflop/sec. При этом следует учесть, что основные приложения машинного зрения находятся в тех областях, где массогабаритные и стоимостные характеристики конструируемых устройств по определению ограничены и должны быть весьма невелики.

Таким образом, вычислительная реализуемость алгоритмов машинного зрения по-прежнему относится к числу наиболее важных факторов, которые необходимо учитывать при их разработке.

[править] Полезные ссылки

  1. ☝ К началу
  2. ☜ Требования к алгоритмам машинного зрения
Личные инструменты
Пространства имён

Варианты
Действия
Навигация
Инструменты