Центр оптико-нейронных технологий
ФГУ ФНЦ НИИСИ РАН |
||||||||||||||||||||||
|
|
Проект направлен на решение двух задач. Первая задача предусматривает разработку информационной технологии быстрого распознавания двумерных геометрических форм с помощью иерархически структурированного словаря эталонов. Вторая - разработку технологии быстрого нахождения в заданном цифровом массиве фрагментов, коррелированных с наблюдаемым изображением. Актуальность этих задач обусловлена растущими требованиями к ускорению процедур принятия решений в автоматических системах различного назначения, реализуемых на базе вычислительной техникии средств передачи информации. Развиваемая технология универсальна и ориентирована на решение указанных задач с показателями эффективности, близкими к теоретически достижимым обменным соотношениям между объемом вычислительных затрат, производимых в ходе принятия решения, и точностью последнего. Принципиальная новизна предлагаемого подхода состоит в применении иерархических схем представления данных, что обеспечивает существенное ускорение процедуры поиска и принятия решения. Универсальность развиваемой информационной технологии предполагает возможность ее использования для различных приложений в системах принятия решений на основе анализа пространственно-временных динамических сцен. Области возможного применения: системы распознавания образов, система машинного зрения, системы идентификации, системы мониторинга и диагностики. В рамках информационной технологии быстрого распознавания двумерных геометрических форм решены две задачи. Первая - это разработка формы инвариантного представления образа, соответствующего двумерной геометрической форме (связная область на плоскости). Вторая - построение базы данных образов в виде иерархически структурированного дерева, на основе которого осуществляется быстрый поиск инвариантного отображения предъявляемого образа. Предлагаемая технология предназначена для распознавания образов и анализа сцен в организованной среде (детали на сборочном конвейере, жесты рук на изображениях с выраженным фоном и т.п.). Технология ориентирована на распознавание двумерных геометрических форм в виде твердых тел, имеющих однотонную окраску и произвольные размеры и ориентацию на изображениях. Возможно обобщение алгоритмов для распознавания образов с полутоновой окраской. Для целей быстрого поиска разработаны модифицированные стэковые алгоритмы, позволяющий по предъявлению искаженного образа находить соответствующий ему эталон с задаваемой пользователем мерой близости. Описанные ниже разработанные программы позволяют осуществлять: поиск подстроки в строке, привязку на местности по данным из окна наблюдения, по временным рядам строить в режиме реального времени древовидную структуру с заданной мерой близости и, тем самым, проводить кластеризацию отрезков временных рядов (или областей, если временные ряды рассматривать как двумерное цифровое поле) и выявление причинно-следственных связей. Эксперименты с описанными стековыми алгоритмами показал, что они эффективны только тогда, когда искажения обрабатываемых образов не превышают 20-25% . При более высоком уровне шумов резко возрастает число необходимых для распознавания операций, т.е. скорость поиска резко уменьшается. В связи с этим обстоятельством был предложен нейросетевой алгоритм быстрого поиска, основанный на разработанных авторами проекта параметрических нейронных сетях. Такие сети позволяют хранить большое число многомерны образов и распознавать их при исключительно больших искажениях. На основе таких нейросетевых парадигм разработан параметрический перцептрон, осуществляющий идентификацию образа со скоростью, превышающей скорость стекового алгоритма. Например, выставленная на сайте демонстрационная версия имеет следующие параметры: может хранить в своей памяти свыше 100000 образов (256 цветов, 300х136 пикселов) и при этом осуществлять быструю идентификацию образа, 90% пикселов которого искажены. |