Детектирование надрывов страниц документа путем анализа изображений в ИК-диапазоне

Обложка

Цитировать

Полный текст

Открытый доступ Открытый доступ
Доступ закрыт Доступ предоставлен
Доступ закрыт Только для подписчиков

Аннотация

В данной работе рассматривается задача детектирования надрывов страниц защищенных документов. Предлагается подход, основанный на анализе изображения документа в инфракрасном (ИК) диапазоне. Предполагается, что в таком случае можно отделить повреждение от защитных элементов, наносимых ИК-прозрачными красками, и свести задачу поиска надрывов к поиску тонких линий определенной длины, примыкающих к границе страницы документа. Для поиска надрывов разработан алгоритм, основанный на поиске линий типа «хребет» с последующей проверкой соответствия найденных линий заданным характеристикам. Для тестирования предложенного алгоритма был создан и опубликован набор данных VIUB, содержащий изображения билетов банка России. Полнота алгоритма на нем составила 0.87, точность – 0.94.

Об авторах

Ольга Александровна Падас

ООО «Смарт Энджинс Сервис»

Автор, ответственный за переписку.
Email: o.padas@smartengines.com

Бакалавр, программист

Россия, Москва

Ирина Андреевна Кунина

Институт проблем передачи информации А. А. Харкевича РАН

Email: i.kunina@smartengines.com

Исследователь, Кандидат технических наук

Россия, Москва

Список литературы

  1. Ahmad Montaser Awal и др. «Complex document classification and localization application on identity document images». В: 2017 14th IAPR International Conference on Document Analysis and Recognition (ICDAR). Т. 1. IEEE. 2017, с. 426—431.
  2. Filippo Attivissimo и др. «An automatic reader of identity documents». В: 2019 IEEE International Conference on Systems, Man and Cybernetics (SMC). IEEE. 2019, с. 3525— 3530.
  3. VL Arlazarov и др. «Mobile ID Document Recognition– Coarse-to-Fine Approach». В: Pattern Recognition and Image Analysis 32.1 (2022), с. 89—108.
  4. Yulia S. Chernyshova и др. «Optical Font Recognition in Smartphone-Captured Images, and its Applicability for ID Forgery Detection». В: ICMV 2018. Т. 11041. doi: 10.1117/12.2522955. Bellingham, Washington 98227- 0010 USA: Society of Photo-Optical Instrumentation Engineers (SPIE), март 2019, 110411J1—110411J7.
  5. Oumayma Kada и др. «Hologram Detection for Identity Document Authentication». В: International Conference on Pattern Recognition and Artificial Intelligence. Springer. 2022, с. 346—357.
  6. LI Koliaskina и др. «MIDV-Holo: A Dataset for ID Docu- ment Hologram Detection in a Video Stream». В: Interna- tional Conference on Document Analysis and Recognition. Springer. 2023, с. 486—503.
  7. Д. В. Полевой, Е. И. Панфилова и Д. П. Николаев. «Ба- ланс белого для детектирования голограмм на цветных изображениях черно-белых фотографий». В: ИТиВС 3 (2021). Под ред. Попков Юрий Соломонович. doi: 10.14357/20718632210308, с. 82—95
  8. М. А. Валов, Д. П. Маталов и С. А. Усилин. «Использование центрально-симметричных признаков Хаара для локализации печати на паспорте гражданина РФ». В: Труды ИСА РАН 73.3 (2023). Под ред. Попков Юрий Соломонович и др. doi: 10.14357/20790279230304, с. 31—39.
  9. Считыватель документов ПС4-02 ПШНК.468469.009: [Электронный ресурс]. URL: http://ex- pertprospb.ru/2019/05/31/schityvatel-dokumentov-ps4-02- pshnk-468469-009/. [Дата обращения: 13.10.2023].
  10. Passport Scanner With RFID OCR4000: [Электронный ресурс].URL:http://www.tenkoto.com/en/Products/pos/2019/0827/Reader/Passport.html. [Дата обращения: 13.10.2023].
  11. Kunina и др. «A method of fluorescent fibers detection on identity documents under ultraviolet light». В: ICMV 2019. Под ред. Wolfgang Osten, Dmitry Nikolaev и Jianhong Zhou. Т. 11433. doi: 10.1117/12.2558080. Bellingham,
  12. Washington 98227-0010 USA: Society of Photo-Optical Instrumentation Engineers (SPIE), янв. 2020, с. 114330D1—114330D8.
  13. Amreen Kaur и др. «Inpainting of irregular holes in a man- uscript using unet and partial convolution». В: 2020 Second International Conference on Inventive Research in Compu- ting Applications (ICIRCA). IEEE. 2020, с. 778—784.
  14. Rachid Hedjam и Mohamed Cheriet. «Historical document image restoration using multispectral imaging system». В: Pattern Recognition 46.8 (2013), с. 2297—2312.
  15. Alysson de S´a Soares, Ricardo Batista das Neves Junior и Byron Leite Dantas Bezerra. «BID Dataset: a challenge dataset for document processing tasks». В: Anais Estendidos do XXXIII Conference on Graphics, Patterns and Images. SBC. 2020, с. 143—146.
  16. KB Bulatov и др. «MIDV-2020: a comprehensive bench- mark dataset for identity document analysis». В: Computer Optics 46.2 (2022), с. 252—270.
  17. Dmitry V. Polevoy и др. «Document Liveness Challenge dataset (DLC-2021)». В: J. Imaging 8.7 (2022). doi: 10.3390/jimaging8070181, с. 181-1—181-12.
  18. Д. В. Тропин и др. «О локализации плоских объектов на изображениях со сложной структурой проективных искажений». В: Информационные процессы 19.2 (2019). Под ред. академик РАН Кузнецов Николай Александрович, с. 208—229.
  19. Сканер документов СД-03 ПШНК.468469.016: [Элек- тронный ресурс]. URL: http: //expertprospb.ru/2021/09/07/skaner-dokumentov-sd-03- pshnk-468469-016/. [Дата обращения: 13.10.2023].

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».