Algorithms for extracting information from problem-oriented texts on the example of government contracts

Abstract

The research is aimed at solving the problem of the execution of government contracts, the importance of using unstructured information and possible methods of analysis to improve the control and management of this process. The execution of government contracts has a direct impact on the security of the country, its interests, economy and political stability. Proper execution of these contracts contributes to the protection of national interests and ensures the security of the country in every sense. The object of research is algorithms used to extract information from texts. These algorithms include machine learning technologies and natural language processing. They are able to automatically find and structure various entities and data from government contracts. The scientific novelty of this study is the accounting of unstructured information in the analysis of the execution of government contracts. The authors drew attention to the problem-oriented texts in the contract documentation and suggested analyzing them with numerical indicators to assess the current state of the contract. Thus, a contribution was made to the development of methods for analyzing government contracts by taking into account unstructured information. The proposed methods for analyzing problem-oriented texts using machine learning. This approach can significantly improve the evaluation and management of the execution of government contracts. The results of the interpretation of problem-oriented texts can be used to optimize the risk assessment model for the execution of a government contract, as well as to increase its accuracy and efficiency.

References

  1. Елисеев Д. А., Романов Д. А. Машинное обучение: прогнозирование рисков госзакупок // Открытые системы. СУБД. 2018. № 2. С. 42-44.
  2. Узких Г. Ю. Применение глубокого обучения в задачах обработки естественного языка // Вестник науки. 2023. Т. 4. №. 8 (65). С. 310-312.
  3. Сердюк Ю. П., Власова Н. А., Момот С. Р. Система извлечения упоминаний симптомов из текстов на естественном языке с помощью нейронных сетей // Программные системы: теория и приложения. 2023. Т. 14. №. 1 (56). С. 95-123.
  4. Курейчик В. В., Родзин С. И., Бова В. В. Методы глубокого обучения для обработки текстов на естественном языке // Известия Южного федерального университета. Технические науки. 2022. № 2 (226). С. 189-199.
  5. Ежков А. А. Анализ исследований в области обработки неструктурированных текстов в медицине // Научное обозрение: актуальные вопросы теории и практики. 2022. С. 23-26.
  6. Прошина М. В. Современные методы обработки естественного языка: нейронные сети // Экономика строительства. 2022. №. 5. С. 27-42.
  7. Тарабрин М. А. Использование инструментов natasha api при разработке алгоритма по обезличиванию текстовых данных // Актуальные вопросы эксплуатации систем охраны и защищенных телекоммуникационных систем. 2022. С. 61-64.
  8. Petr Nikitin at all. Evaluation of the execution of government contracts in the field of energy by means of artificial intelligence // E3S Web of Conf. 402 03041 (2023). doi: 10.1051/e3sconf/202340203041

Supplementary files

Supplementary Files
Action
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).