Determination of invariant characteristics for digital image and their calculation in the MatLab system
- Autores: Samarina O.V.1, Samarin V.A.1
-
Afiliações:
- Yugra State University
- Edição: Volume 19, Nº 1 (2023)
- Páginas: 77-82
- Seção: MATHEMATICAL MODELING AND INFORMATION TECHNOLOGIES
- URL: https://ogarev-online.ru/1816-9228/article/view/253704
- DOI: https://doi.org/10.18822/byusu20230177-82
- ID: 253704
Citar
Texto integral
Resumo
Subject of research: single-channel digital image, second-order invariants to movements and stretching.
Purpose of research: to determine a new group of invariants of a single-channel digital image with respect to shifts, rotations and stretching.
Methods and objects of research: the object of research is single-channel images. The developed computational algorithms are based on the complex use of analytical and geometric research methods, the theory of invariants and wavelets.
Main results of research: a computational scheme for determining the group of invariant characteristics with respect to such digital image transformations as shifts, rotations and stretching has been developed.
Palavras-chave
Texto integral
Введение
Инвариантные характеристики изображения являются точным математическим инструментом, позволяющим решать широкий класс задач обработки и анализа одноканальных и многоканальных изображений, таких так распознавание образов, поиск объектов по образцу и другие. Инварианты способны передавать характерные особенности изображения и выступать в роли существенных признаков при преобразованиях первичного изображения, таких как сдвиг, поворот, масштабирование, изменения контрастности и яркости. Также инвариантные характеристики характеризуются способностью к обобщению, что в свою очередь является необходимым качеством для моделей и методов искусственного интеллекта, нейронных сетей.
В настоящее время исследования, направленные на поиск и исследование инвариантных характеристик цифрового изображения, являются достаточно актуальными. Они получают развитие в областях распознавания текста, анализа 3D-изображений [1–3]. Однако на практике реальные цифровые содержат помехи, неточности и шумы. Кроме того, цифровые изображения не являются непрерывными, они определятся значениями пикселей в дискретных координатах. Таким образом перед исследователями встает задача определения методов и моделей обработки цифрового дискретного изображения и определения для данного изображения ряда устойчивых инвариантных характеристик [4].
В данной работе представлены инварианты второго порядка (числовые функции, содержащие производные первого и второго порядков) относительно группы аффинных преобразований, а также яркости, контрастности изображения. Использование в методах обработки и анализа цифровых изображений инвариантов второго порядка позволяет найти достаточно устойчивую относительно помех и шума изображения числовую характеристику и существенно снизить сложность метода, что является ощутимым преимуществом при практической реализации алгоритма.
Результаты и обсуждение
Представим цифровое полутоновое изображение в виде непрерывной функции . Будем считать, что данная функция цифрового изображения дважды непрерывно дифференцируема. Тогда справедливо разложение Тейлора второго порядка с произвольной точкой рассматриваемой области в виде центра. При помощи простых преобразований любую точку области можно перевести в начало координат. Тогда функция цифрового полутонового изображения будет иметь вид:
В данной записи коэффициенты разложения представляют собой значения функции, дифференциалов первого и второго порядка в начале координат:
Представим, что цифровое изображение претерпело некоторые преобразования (такие как сдвиг, масштабирование, поворот). Обозначим эту группу преобразований как G. В таком случае можем записать
В этой записи коэффициент соответствует преобразованию плоскости цифрового изображения, угол – повороту, а множитель – можно описать как коэффициент соответствующий частотному диапазону данного изображения, а также как фактор поглощения среды, действующий в окрестности рассматриваемой точки.
Определение. Числовая функция нетождественно равная константе является инвариантом цифрового изображения порядка , если она сохраняет свое значение под действием преобразований группы .
Замечание. Размерность пространства инвариантов определяется по формуле:
.
Заметим, что группа преобразований действует в пространстве параметров и образует трехмерную коммутативную группу Ли
Для произвольной функции параметров детерминированы инфинитезимальные дифференциальные операторы , ,
Теорема 1. Дифференциальные операторы , , представимы в следующем виде
,
,
.
Доказательство:
Параметр преобразуется по формуле , т.е.
, ,
,
,
,
.
Воспользовавшись данным преобразованием, найдем значения следующих дифференциальных операторов:
,
,
.
Выполнив вычисления с учетом указанных выше начальных условий, получим:
,
,
.
Теорема доказана.
Теорема 2. Данные функции являются инвариантами цифрового изображения второго порядка относительно группы преобразований, включающих в себя движения, растяжения и калибровку цифрового полутонового изображения:
Доказательство.
Проверяется непосредственно.
Замечание. Для представленных инвариантов справедлива следующая оценка:
Для выполнения расчетов данных инвариантов в системе Matlab необходимо дополнительно рассмотреть дискретную модель цифрового полутонового изображения.
В силу технических ограничений память компьютера способна хранить и обрабатывать только дискретные числа. Поэтому при оцифровке непрерывная функция изображения превращается в дискретную – возникает прямоугольная решетка точек изображения. И таким образом при любых операциях с использованием цифровых технических средств, таких как хранение, обработка и анализ, полутоновое изображение представляет собой матрицу определенного размера со значениями пикселей в узлах сетки (рис. 1).
Рисунок 1 – Дискретная сетка цифрового изображения
Система Matlab обладает широкими возможностями обработки и анализа цифровых изображений. При помощи встроенных функций системы была проведена загрузка группы тестовых изображений. Данные группы содержат изображения одной и той же области, но содержащие определенные отличия, такие как уровень яркости, сдвиг по вертикали и горизонтали, угол поворота (рис. 2).
Рисунок 2 – Пример группы изображений
Для каждого из изображений группы были проведены вычисления инвариантных характеристик . Для оценки результативности характеристик рассматривались значения функции распределения разностей между инвариантными характеристиками вычисленных для значения дискретной функции во всех узлах сетки. Проведенные исследования позволяют сделать вывод: для предполагаемого наличия общих областей на изображениях размером достаточно, чтобы у значений сумма попарных разностей по рассмотренным инвариантным характеристикам не превышала величину .
Заключение и выводы
Проведенные теоретические исследования и вычислительные эксперименты позволяют сделать вывод о том, что представленные в данной работе инвариантные характеристики цифрового одноканального изображения относительно группы аффинных преобразований, а также яркости, контрастности изображения можно эффективно использовать при решении различных задач анализа и обработки цифрового изображений, таких как сортировка изображений, поиск снимков по образцу, распознавание изображений и другие.
Sobre autores
Olga Samarina
Yugra State University
Autor responsável pela correspondência
Email: O_Samarina@ugrasu.ru
Candidate of Physical and Mathematical Sciences, Associate Professor, Head of Engineering school of Digital Technologies
Rússia, Khanty-MansiyskValery Samarin
Yugra State University
Email: V_Samarin@ugrasu.ru
Candidate of Technical Sciences, Associate Professor, Associate Professor school of Digital Engineering
Rússia, Khanty-MansiyskBibliografia
- Абрамов, Н. С. Обзор методов распознавания образов на основе инвариантов к яркостным и геометрическим преобразованиям / Абрамов Н. С., Фраленко В. П., Хачумов М. В. – Текст : непосредственный // Современные наукоемкие технологии. – 2020. – № 6-1. – С. 110–117.
- Нгуен, З. Т. Инварианты в задачах распознавания графических образов / Нгуен З. Т. – Текст : непосредственный // Вестник РУДН. Серия Математика. Информатика. Физика. – 2016. – № 1. – С. 76–85.
- Самарина, О. В. Применение интегральных топографических характеристик в решении задач обработки данных дистанционного зондирования / Самарина О. В., Славский В. В., Семенов С. П. – Текст : непосредственный // Математические заметки СВФУ. – Январь-март 2020. – Т. 27, № 1. – С. 41–50.
- Сергиенко, А. Б. Цифровая обработка сигналов / А. Б. Сергиенко. – СПб. : Питер, 2003. – 608 с. – Текст : непосредственный.
Arquivos suplementares
