Интерактивная обработка изображений для робастного распознавания геометрических примитивов

Обложка

Цитировать

Полный текст

Аннотация

Распознавание геометрических примитивов используется при обработке изображений для решения задач, связанных с машинным обучением, сокращением области анализа и уменьшением вычислительной сложности. Одной из проблем распознавания примитивов является зависимость результатов обработки от таких внешних факторов как: широкий диапазон изменения яркости, контрастности, наличие помех, посторонних объектов или загрязнения. Отдельной задачей является определение геометрического положения примитива на изображении, которое определяется смещением, поворотом и масштабом или параметрами более сложной математической модели трансформации. Интерактивный способ обработки позволяет обеспечить робастность к пространственно-яркостным искажениям и различным помехам.Целью настоящей статьи является повышение качества распознавания геометрических примитивов на изображениях за счет интерактивной обработки.Сущность предлагаемого решения заключается в проведении двух этапов: этап предварительной обработки в интерактивном режиме и этап оценки геометрических параметров примитива с автоматическим удалением импульсных помех. На первом этапе выбирается порог для детектирования контура примитива и ограничение области анализа (выбор фрагмента) на изображении. Определение этих параметров проводится с помощью графического интерфейса в интерактивном режиме (например, изменение порога детектирования практически мгновенно отображает распознанные контуры на изображении). На втором этапе в соответствии с формой примитива выделяется область интереса, что убирает импульсные помехи (контурные точки, не принадлежащие примитиву), а по точкам в области интереса оцениваются параметры примитива методом наименьших квадратов. Разработанный алгоритм имеет реализацию в виде программы с графическим интерфейсом. Эксперименты для проверки разработанного алгоритма показали удовлетворительное распознавание геометрического примитива «окружность» на различных типах изображений, содержащих дорожный знак, частицу полимерного геля, феррулу оптического адаптера. Научная новизна решения состоит в возможности распознавания примитивов, которое робастно к пространственно-яркостным преобразованиям (масштабу, смещениям, неравномерности яркости и т. д.) и другим помехам.Теоретическая значимость состоит в расширении возможностей методов распознавания за счет интерактивного выбора параметров на этапе предобработки.Практическая значимость заключается в упрощении алгоритмов обработки изображений, которые используются при решении прикладных задач (подготовки данных машинного обучения, обработка методами оптической микрометрии), не требующих распознавания в режиме реального времени.

Об авторах

А. А. Диязитдинова

Поволжский государственный университет телекоммуникаций и информатики

Email: a.diyazitdinova@psuti.ru

Список литературы

  1. Шульга Т.Э., Солопекин Д.А. Распознавание дорожных знаков российского образца с использованием нейронных сетей // Вестник Астраханского государственного технического университета. Серия: Управление, вычислительная техника и информатика. 2024. № 2. С. 85–94. doi: 10.24143/2072-9502-2024-2-85-94. EDN:LTLMXA
  2. Rajesh R., Rajeev K., Suchithra K., Lekhesh V.P., Gopakumar V., Ragesh N.K. Coherence vector of Oriented Gradients for traffic sign recognition using Neural Networks // Proceedings of the International Joint Conference on Neural Networks (San Jose, USA, 31 July ‒ 05 August 2011). IEEE, 2011. PP. 907–910. doi: 10.1109/IJCNN.2011.6033318. EDN:PKQGGB
  3. Атавуллаева Ш.Ш., Ферапонтов Н.Б., Тробов Х.Т., Турсунова Г.Х., Джураева Р.А. Определение состава растворов смесей электролитов методом оптической микрометрии // Universum: химия и биология. 2024. № 11-2(125). С. 46‒51. doi: 10.32743/UniChem.2024.125.11.18355. EDN:HYSJJG
  4. Токмачев М.Г. Методика оценки объема гранулы полимерного геля в оптической микрометрии // Компьютерная оптика. 2023. Т. 47. № 6. С. 968–971. doi: 10.18287/2412-6179-CO-1271. EDN:OJTKGA
  5. Bourdine A.V., Pashin S.S., Zaitseva E.S., Vasilets A.A., Antonov S.A. Fast and simple method for estimation of the in-sertion loss at the connection of singlemode optical fibers with contaminated ferrule end faces // Proceedings of the XVIIth International Scientific and Technical Conference "Optical Technologies for Telecommunications" (Kazan, Russian Federation, 19–21 November 2019). SPIE, 2020. Vol. 11516. P. 115161O. doi: 10.1117/12.2566456. EDN:GGNEOJ
  6. Пашин С.С. Исследование потенциальных возможностей оценивания коэффициента передачи основной моды на основе анализа перекрытия радиального распределения полей в дискретном представлении // Инфокоммуникационные технологии. 2021. Т. 19. № 2. С. 172–178. doi: 10.18469/ikt.2021.19.2.05. EDN:QIKRUK
  7. Canny J. A Computational Approach to Edge Detection // IEEE Transactions on Pattern Analysis and Machine Intelligence. 1986. Vol. PAMI-8. Iss. 6. PP. 679–698. doi: 10.1109/TPAMI.1986.4767851
  8. Chochia P.A. Image segmentation via contour tracking in application to the analysis of the photographs of electronic microcircuits // Journal of Communications Technology and Electronics. 2010. Vol. 55. Iss. 12. PP. 1466–1473. doi: 10.1134/S1064226910120193
  9. Boykov Y., Jolly M.-P. Interactive Organ Segmentation Using Graph Cuts // Proceedings of the 3rd International Conference on Medical Image Computing and Computer-Assisted Intervention (MICCAI 2000, Pittsburgh, USA, 11‒14 October 2000). Lecture Notes in Computer Science. Berlin, Heidelberg: Springer, 2000. Vol. 1935. PP. 276–286. doi: 10.1007/978-3-540-40899-4_28
  10. Пашин С.С. Разработка методов контроля параметров передачи разъемных соединений оптических волокон кабелей связи. Дис. … канд. техн. наук. Самара: Поволжский государственный университет телекоммуникаций и информатики, 2022. 221 с. EDN:KBOFZL
  11. Konushin A., Shakhuro V. Traffic sign recognition // Graphics and Media Lab. UTL: https://graphics.cs.msu.ru/projects/traffic-sign-recognition.html (дата обращения 05.01.2025)
  12. Каретин А.Н. МНК для апроксимации данных окружностью. 2010. URL: https://mykaralw.narod.ru/articles/mnk_circle.pdf (дата обращения 05.01.2025)

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».