To the Problem of Formalizing the Operation of Complex Pattern Recognition Systems
- Authors: Glazkova I.A.1, Ivanovsky M.A.1, El Eissawi B.M.1
-
Affiliations:
- Tambov State Technical University
- Issue: Vol 30, No 1 (2024)
- Pages: 42-52
- Section: Automation. Information Technology. Control. Instruments
- URL: https://ogarev-online.ru/0136-5835/article/view/278725
- DOI: https://doi.org/10.17277/vestnik.2024.01.pp.042-052
- ID: 278725
Cite item
Full Text
Abstract
For single-level pattern recognition systems, it is proposed to consider the search for a feature vector as a model of a distributed information system on a thesaurus. For multi-level complex recognition systems, a decomposition method is proposed, which is associated with the inclusion of a data analyst in the recognition process. When formally describing the recognition system at the stage of image synthesis, possible inaccuracies in the values of indicators are taken into account due to the probabilistic nature of the quantities included in the indicators, a linguistic lottery, and additive convolution of indicators with fuzzy initial information were used.
Full Text
Введение
В настоящее время имеется тенденция к созданию универсальных многопрофильных междисциплинарных центров распознавания образов, функционирующих как в экспресс-режиме, так и режиме углубленного анализа, что связано с экономией аппаратных и программных ресурсов, поскольку современные информационные системы и технологии включают в себя большое количество типовых процедур, моделирующих или поддерживающих процесс интеллектуального анализа данных.
К простейшим процедурам такого типа относится любая классификация количественных данных по заданным пользователем критериям. Более сложные обеспечивают анализ сцен, процессов, явлений в целях выделения объектов с заданными характеристиками или свойствами, присутствуют не только в задачах анализа изображений, но и при обработке сигналов в технических системах, медицинской диагностике, биологии, социологии и других областях человеческой деятельности.
Декомпозиция системы распознавания образов
В многоуровневых сложных системах распознавания важен способ декомпозиции, который обычно связан с моментами включения в процесс распознавания специалиста-аналитика данных, то есть с интерактивным режимом обработки из-за неполноты исходной информации или трудностей ее формального описания на этапе синтеза образов [1, 2].
В одноуровневых системах распознавание осуществляется на основе одного словаря признаков одним алгоритмом распознавания, что фактически приводит к поиску на тезаурусе, результатом может служить документ с вектором признаков.
Рассмотрим модель распределенной информационной системы на тезаурусе.
Тезаурус – словарь, отражающий смысловые связи между словами и иными смысловыми элементами и, следовательно, предназначенный для поиска слов по их смыслу. Тезаурусом называется непустое множество V слов υ, отвечающих условиям:
– имеется непустое подмножество V0 ⊂ V, называемое множеством дескрипторов;
– имеется симметричное транзитивное рефлексивное отношение R ⊂ V × V, такое, что:
;
;
– имеется транзитивное и несимметричное отношение K ⊂ V0 × V0, называемое обобщающим отношением.
Отношение R называется синонимическим отношением, слова υ1 и υ2, отвечающие этому отношению, называются синонимическими дескрипторами.
В случае, если два дескриптора υ1 и υ2 удовлетворяют отношению υ1Kυ2, полагается, что дескриптор υ1 более общий, чем дескриптор υ2.
Элементы множества V \ V0 называются множеством аскрипторов.
Информационно-поисковый тезаурус позволяет находить нужные дескрипторы для адекватного выражения информационной потребности.
Дескриптор служит для описания основного содержания документа или формулировки информационного запроса при поиске документов в информационно-поисковой системе. Дескриптор ставится в однозначное соответствие группе ключевых слов естественного языка, отобранных из текста определенной области знания для построения дескрипторного языка [3].
Информационной системой с тезаурусом называется четверка (V, D, M, δ), где V – тезаурус с дескриптовым множеством V0; D – коллекция документов; M – множество вопросов; δ:М → 2D – отображение, сопоставляющее каждому вопросу множество документов.
Пусть описание любого документа d ∈ D может быть представлено в виде υ(d) = {υ1, υ2, ..., υk} и удовлетворяет условию: никакие два дескриптора не встречаются в одном υ(d), если они удовлетворяют отношению K.
Можно также считать, что каждый вопрос m ∈ M представлен в форме, аналогичной описанию документов. Множество описаний вопросов и документов частично упорядочено отношением включения ≤ следующим образом ∇d1, d2 ∈ D:
,
то есть каждый дескриптор из υ(d1) представляет собой обобщение дескриптора из υ(d2) или идентичен дескриптору из υ(d2). Отношение ≤ позволяет сформулировать ответ Q на вопрос m ∈ M в виде Q = d(m) = {d : d ∈ D ∧ m ≤ x(d)}.
Пусть S1, S2, ..., Sn – локальные информационные системы, где Sj = (Vj, Dj, Mj, δj), . Соединим системы S1, S2, ..., Sn в одну систему S, которую будем называть распределенной информационной системой, базирующейся на глобальном тезаурусе .
Пусть имеется распределенная информационная система S = (V, D, M, d) с синонимическим отношением Rn, обобщающим отношение K. Тогда последовательность информационных систем можно определить следующим образом: Sj = (Vj, Dj, Mj, dj), где Vj ⊂ V; Dj ⊂ D; Mj ⊂ M; dj – сужение d на Mj; .
Кроме того, отношения и ; V0j – множество дескрипторов системы Sj; отношение предпочтения j ≤ (Mj × Mj); .
Определим понятие подсистемы, которое позволит формализовать отношение включения одной системы в другую. Пусть S1 = (V1, D1, M1, δ1) и S2 = (V2, D2, M2, δ2) – информационные системы. Система S1 является подсистемой S2, S1 ⊂ S2, если:
Локальные информационные системы – подсистемы распределенной информационной системы.
Ввиду того что множество документов распределенной системы – это объединение множеств документов локальных систем, можно выразить ответ на вопрос к распределенной системе как результат некоторых операций над ответами от локальных систем. Пусть – вопрос, содержащий один дескриптор, – ответ на вопрос m. В подсистеме Si ответ на локальный вопрос описывается в следующей форме
.
В свою очередь, в распределенной системе S глобальный ответ на вопрос будет объединением локальных ответов .
Ответ на произвольный вопрос в распределенной системе выражается формулой .
Распределенная информационная система обладает свойством включения, если множество вопросов частично упорядочено отношением ≤ и выполняется условие
.
Свойства включения позволяют формулировать цепь ответов на цепь вопросов, уточняя ответы более специализированными вопросами. В некоторых случаях при выполнении свойства аддитивности операции над ответами локальных систем могут быть упрощены.
Если множества документов локальных информационных систем не пересекаются, то глобальный ответ распределенной системы представляется как объединение локальных ответов
.
Если все локальные информационные системы заданы на одном тезаурусе Sj = (Vj, Dj, Mj, δj), , а множество документов разнесены, то ответ на глобальный вопрос будет объединением локальных ответов, то есть если – вопрос , тогда .
Введем веса, которые будут описывать распределение информации на каждом слове. Информацию, заложенную в описании документов, будем рассматривать в виде единицы, следовательно, вес wi соответствует объему информации, падаю́щей на дескриптор vi, то есть v(d) = {<v1, w1>, <v2, w2>, …, <vk, wk>} и выполняются условия:
.
Описание документов удовлетворяют свойству включения. Дадим определение понятию подобия вопросов и описаний документов.
Пусть v(d1), v(d2) – описания документов:
;
.
Описание v(d1) подобно описанию v(d2) с точностью r(0 ≤ r ≤ 1), если v(d1) ≤ v(d2) ∧ w1i, r ≤ Σw2j, <v11, w11> ∈ v(d1) j : [v2j ∈ J(v1j)], где J(v1j) = {v2j :v1jKv2j ∧ (1 ≤ j ≤ K2) при 1 ≤ i ≤ K1}.
Если v(d1) и v(d2) удовлетворяют условию, то пишется v(d1)ρv(d2).
Представляет интерес и другая величина, характеризующая коэффициент подобия или меру корреляции пар векторов, удовлетворяющих отношению ≤.
Для векторов
,
где при 1 ≤ i ≤ k1. Мера m, по сути дела, оценивает информацию, заключенную в описании документов v(d1), v(d2).
Информационной системой на тезаурусе с весами называется четверка (V, D, M, δ), где V – тезаурус с дескрипторным множеством V0 ⊂ V; D – корреляция документов; M – множество вопросов; δ – отображение δ : M × [0, 1] → 2D × [0, 1], сопоставляющее каждой паре (вопрос, точность подобия) множество пар (документ мера корреляции).
Ответом системы на вопрос с требуемой точностью ρ = c называется множество
.
В определении ответа отношение подобия осуществляет выбор документов, точность подобия которых не менее с. Мера корреляции показывает, какая часть информации в документе соответствует ответу на вопрос.
Одно из фундаментальных свойств ответа связано с точностью ρ и мерой корреляции m вопроса к описанию документа, включенного в ответ.
Если документ d ∈ D с мерой корреляции α включен в ответ, то есть , то верно неравенство α ≥ с. Обратное утверждение неверно.
Если ρ1 ≥ ρ2, то .
В многоуровневых системах распознавания важной функцией аналитика данных является оценка качества распознавания на текущем этапе и возникающей из-за этого потери информации на следующем.
При разработке алгоритмов формализации в условиях неопределенности по характеристикам объекта аналитик может использовать модели, критерии и показатели R1, …, Ri.
Имеем в виду, что значения показателей получаем на основании алгоритмов оценивания эффективности распознавания. Предположим аддитивность критериев [4, 5]. Учитывая возможные неточности значений показателей из-за вероятностного характера величин, входящих в показатели, наличия значений показателей, представляется целесообразным использование лингвистического подхода. Проранжируем рассматриваемые варианты на основе аддитивной свертки показателей при нечеткой исходной информации [6, 7].
Нечеткие оценки вариантов и коэффициенты важности показателей зададим функциями принадлежности в треугольной форме. Причем коэффициенты важности определяются исходя из предпочтений исследователя на основе аппарата теории одномерной полезности (лингвистического подхода) [8].
Определим методику получения коэффициентов важности показателей оценивания эффективности. Задано множество показателей важности R = {R1, …, Ri}. Каждый из показателей может принимать конкретные значения x1, x2, …, xm, которые наступают с нечеткими (лингвистическим) вероятностями p1, p2, …, pn.
Предпочитаемая величина значений показателей (в дальнейшем полезность) определяется в ходе диалога с исследователем и задается в виде нечеткой функции принадлежности w1, w2, w3, …, wn. Определим нечеткую ожидаемую важность (полезность) каждого из показателей. Смысл диалога с исследователем по определению предпочитаемых значений показателей оценивания заключается в следующем. В ходе такого диалога исследуется поведение в условиях риска. Для этого исследователь:
– в соответствии со своими предпочтениями упорядочивает значения показателей: , где х1 и хn – соответственно наименее и наиболее предпочтительные значения;
– обозначая предпочитаемую величину показателя (полезность) w1 для наихудшего значения, wn для наилучшего, для каждого значения показателя хj (j = 1, 2, …, n) назначают вероятность pj такую, что ему будут безразличны следующие ситуации:
– получить значение хj;
– получить значение xn с вероятностью pj;
– получить значение х1 с вероятностью 1 – рj.
Получаем тройку (xn; pj; x1), то есть лотерею, полезность (важность) которой находится с помощью выражения . Для вычисления нечеткой ожидаемой важности каждого показателя будем использовать a-сечение нечеткого множества R (множество уровня a) [4]: , где Х – базовое множество, a ∈ [0; 1], mk(x) – функция принадлежности, a – сечение нечеткой вероятности и нечеткой важности значения показателя оценивания xj.
Представим в форме треугольных функций принадлежности m(pj) и m(wj) (рис. 1, 2). Если функции принадлежности нечеткой вероятности и нечеткой важности выпуклые и непрерывные, то a-сечение есть замкнутый интервал. Функцию принадлежности каждого показателя будем строить для тех же a, и a-сечения важности каждого показателя есть замкнутый интервал с границами [9, 10]:
при k = k– и wj = aj;
при k = k+ и wj = bj.
Рис. 1. Функция принадлежности
Рис. 2. α-сечение функции принадлежности
Индексы k– и k+ находим из условий:
;
.
Формулы имеют место для данного показателя i и данного уровня a, поэтому индексы i и a в них отсутствуют (для удобства их восприятия). Так как значения показателей x1, x2, …, xn, а также их важности (полезности) необходимо предварительно упорядочить, то необходимо упорядочить и границы aj; bj : ; .
Полученные функции принадлежности нечеткой ожидаемой важности показателей изображены графически на рис. 3. По треугольным функциям определяем значения коэффициентов важности показателей
.
Рис. 3. Правые и левые границы функции принадлежности
Так как функции принадлежности нечетких вероятностей и нечетких важностей значений показателей алгоритмов формализации в условиях неопределенности элементов моделей объектов распознавания известны, то задаваясь различными значениями a, получаем тот материал, обработав который и найдем функции принадлежности важности показателей алгоритмов формализации в условиях неопределенности элементов моделей (рис. 4).
Рис. 4. Выбор наилучшего варианта. Бинарное сравнение
Проведем аддитивную свертку показателей. Варианты S = {S1, S2, …, Sn}, оцениваемые по n = i показателям, имеющим коэффициенты важности W1, W2, ..., Wn, необходимо упорядочить. Через Rij обозначим оценку i-го варианта (Si) по j-у показателю (i = 1, 2, …, m; j = 1, 2, …, n) и через Ri – оценку i-го варианта по всем показателям (взвешенную оценку). Оценки Rij по показателям и коэффициенты относительной важности показателей Wij задаем функциями принадлежности, соответственно mRij(rij) и mWj(wj). Взвешенная оценка i-го варианта вычисляется по формуле при условии, что оценки – нормированы. Будем пользоваться треугольным представлением нечетных оценок и коэффициентов относительной важности показателей. Если функции принадлежности двух нечетких множеств X и Y имеют треугольное представление (см. рис. 1 – 4), то нечетное множество Z = X*Y также определяется функцией принадлежности треугольного вида, а границы и вершина находятся следующим образом: , где x', y', x'', y'', x, y – соответственно левая, правая границы и вершины функций принадлежности нечетких множеств X и Y, * – бинарная операция над функциями принадлежности нечетких множеств X и Y [11].
После того как взвешенные оценки получены, необходимо сравнить варианты на их основе. Для этого вводится нечеткое множество I, заданное на множестве индексов вариантов {1, 2, …, n}, и значение соответствующей функции принадлежности интерпретируется как характеристика того, насколько вариант xi является лучшим. Значение mI(i) вычисляется по формуле [12, 13].
Графически значение mI(i) равно ординате точки пересечения взвешенной оценки i-го варианта и взвешенной оценки наилучшего варианта (то есть того варианта, вершина функции принадлежности которого расположена справа от всех остальных). В простейшем случае для обнаружения контурных и полутоновых объектов на цветных и полутоновых изображениях система может иметь вид, показанный на рис. 5.
Рис. 5. Структура системы выбора алгоритмов распознавания изображений
Заключение
Таким образом, при проектировании и системном анализе процесса функционирования универсальных многопрофильных междисциплинарных центров распознавания образов, функционирующих как в экспресс-режиме, так и в режиме углубленного анализа, возможно рассматривать поиск вектора признаков как модель распределенной информационной системы на тезаурусе, методы лингвистической лотереи для свертки показателей при нечеткой исходной информации.
About the authors
I. A. Glazkova
Tambov State Technical University
Email: ivanovskiy_62@mail.ru
магистрант кафедры «Информационные системы и защита информации»
Russian Federation, TambovM. A. Ivanovsky
Tambov State Technical University
Author for correspondence.
Email: ivanovskiy_62@mail.ru
кандидат технических наук, доцент кафедры «Информационные системы и защита информации»
Russian Federation, TambovBadr Khalil Mahmud El Eissawi
Tambov State Technical University
Email: ivanovskiy_62@mail.ru
аспирант кафедры «Информационные системы и защита информации»
Russian Federation, TambovReferences
- Altunin A.E., Chukleev S.N., Semukhin M.V. [Problems of oil and gas of Tyumen], Trudy ZapsibNIGNI: Problemy nefti i gaza Tyumeni [Proceedings of ZapsibNIGNI], Tyumen, 1983, issue 58, pp. 57-59. (In Russ.)
- Alekseev V.V., Lakomov D.V., Al Maamari G., Moiseeva M.V. An access Control System Based on Multimodal Approach, AIP Conference Proceedings, 2022, vol. 2467, no. 1, pp. 050001. doi: 10.1063/5.0093508
- Alekseev V.V., Karasev P.I., Lakomov D.V. Informatika: problemy, metodologiya, tekhnologii: materialy XVI Mezhdunar. nauch.-metod. konf [Informatics: problems, methodology, technologies: Materials of the XVI International Scientific and Methodological Conference], Voronezh, February 11-12, 2016, Voronezh, 2016, pp. 42-45. (In Russ.)
- Vagin V.V., Alekseev V.V., Emelyanov E.N.; Zatsarinny A.A., Borisov D.N. (Eds.). Informatika: problemy, metody, tekhnologii: materialy XX Mezhdunar. nauch.-metod. konf. [Informatics: problems, methods, technologies: materials of the XX International. scientific method. conf.], (Voronezh, February 13–14, 2020), Voronezh, 2020, pp. 363-367 (In Russ.)
- Gromov Yu.Yu. (Ed.), Ivanovsky M.A., Ivanova O.G., Yakovlev A.V. [Analysis and synthesis of structures of information purposeful systems: monograph], Saarbrücken (Germany): LAP LAMBERT Academic Publishing, 2015, 164 p. (In Russ.)
- Gromov Yu.Yu., Minin Yu.V., Ivanova O.G., Ryzhkov A.P. [Modeling of information systems based on the use of discrete and continuous distribution laws and their approximation], Pribory i sistemy. Upravleniye, kontrol', diagnostika [Devices and systems. Management, control, diagnostics], 2019, no. 3, pp. 26-33. (In Russ., abstract in Eng.)
- Zhivotnikov G.S., Pyt'yev Yu.P. Matematicheskiye metody raspoznavaniya obrazov : dokl. 10-y Vseros. konf. [Mathematical methods of image recognition: reports. 10th All-Russian conf.], Moscow, 2001, pp. 56-57. (In Russ.)
- Kobelev K.S., Minin Yu.V., Kovalev S.V. Novyye tekhnologii v nauchnykh issledovaniyakh, proyektirovanii, upravlenii, proizvodstve: tr. Mezhdunar. nauch.-tekhn. konf. [New technologies in scientific research, design, management, production Proceedings of the International Scientific and Technical Conference], (Voronezh, November 09-10, 2017), Voronezh, 2017, vol. 1, pp. 295-299. (In Russ.)
- Lakomov D.V., Polyakov D.V., Alekseev V.V.; Zatsarinny A.A., Borisov D.N. (Eds.). Informatika: problemy, metody, tekhnologii: materialy XX Mezhdunar. nauch.-metod. konf. [Informatics: problems, methods, technologies. Proceedings of the XX International Scientific and Methodological Conference], (Voronezh, February 13-14, 2020), Voronezh, 2020, pp. 1484-1491. (In Russ.)
- Lakomov D.V., Alekseev V.V., Minin Yu.V., Kulakov Yu.V., Nurutdinov G.N. [An image analysis model based on the fuzzy clustering method], Informatsiya i bezopasnost' [Information and security], 2017, vol. 20, no. 4 (4), pp. 580-583 (In Russ., abstract in Eng.)
- Lakomov D.V., Alekseev V.V. Neyrokomp'yutery i ikh primeneniye: tezisy dokl. XVII Vseros. nauch. konf. [Neurocomputers and their application: abstracts of the XVII All-Russian Scientific Conference], (Moscow, March 19, 2019), Moscow, 2019, pp. 259-261 (In Russ.)
- Luong H.D., Moiseev A.S., Minin Yu.V., Alekseev V.V. [On the issue of identification of the information process in the decision support system], Sovremennyye informatsionnyye tekhnologii [Modern information technologies], 2014, no.19(19), pp. 28-31 (In Russ., abstract in Eng.)
- Perfil'eva I. [Applications of the theory of fuzzy sets], Itogi nauki i tekhniki. Seriya Teoriya veroyatnostey. Matematicheskaya statistika. Teoreticheskaya kibernetika. [Results of Science and Technology. Series Theory of Probability. Math statistics. Theoretical cybernetics], 1990, vol. 29, pp. 83-151. (In Russ., abstract in Eng.)
Supplementary files
