Формализация регулятивных текстов

Обложка

Цитировать

Полный текст

Аннотация

Современные информационные технологии с высокой эффективностью обеспечивают процессы манипулирования текстами. В первую очередь это хранение, редактирование и форматирование текстов и их составляющих. Добившись значительных успехов в разработке средств бессодержательной компьютерной обработки текстов, исследователи столкнулись с проблемами их содержательной обработки. Поэтому дальнейшие шаги в этом направлении связаны с созданием, в том числе, методов автоматизированного целенаправленного манипулирования текстами с учетом заложенного в них содержания. Проведен анализ работ, посвященных исследованию проблем формального представления текстов и их последующего использования. Несмотря на ряд успешных проектов, задачи по разрешению проблемы соотношений между содержанием текста и его смыслом остаются актуальными. По-видимому, формализация текста общего назначения при сохранении его семантики на данном этапе развития науки не осуществима. Вместе с тем существуют типы текстов, для которых формализация с сохранением существенной части их семантики представляется возможной. Одним из них является регулятивный тип текста, который по существу представляет собой словесно выраженный алгоритм последовательности целенаправленных действий. Его отличают логичность и точность (отсутствие иносказаний), связность и цельность, ясность, понятность (за счет отсутствия эмоциональной окраски и образных средств), доступность (за счет использования специфической терминологии). Иначе говоря, при разработке регулятивных текстов обычно стараются как можно понятнее отображать механизмы описываемых действий. Цель: разработка метода формализации регулятивного текста с сохранением его семантики. Методы: структурная лингвистика, представление объектов в виде онтологии, конструктивные алгоритмы. Использование данного метода демонстрируется на примере описания решения системы алгебраических уравнений. Результаты: метод построения математической модели регулятивного текста. Практическая значимость: применение разработанного метода обеспечивает возможность разработки программных комплексов для построения библиотек отдельных предметных областей, разработки средств оценки регулятивных текстов на предмет их определенности, полноты, связности и других характеристик, а также тренажеров и средств самообучения.

Об авторах

В. И Пименов

Санкт-Петербургский государственный университет промышленных технологий и дизайна

Email: v_pim@mail.ru
Вознесенский пр. 46

М. В Воронов

Московский государственный психолого-педагогический университет

Email: mivoronov@yandex.ru
Открытое шоссе 24-27

Список литературы

  1. Пешкова Н.П. Семантика и смысл текста: >, <, =, #? (экспериментальный подход к теоретическим проблемам // Вестник Челябинского государственного университета. 2015. № 15 (370). Филология. Искусствоведение. Вып. 96. С. 69–77.
  2. Арапова Г.У. Концепт, понятие и значение слова // Международный журнал прикладных и фундаментальных исследований. 2016. № 1. С. 591–593.
  3. Орехов В.Д. Прогностика: от прошлого к будущему человечества // М., Сканбук, E-Books. 2016. 210 с.
  4. Баринова И.А. К вопросу о соотношении смысла и содержания текста при переводе // Вестник Вятского государственного университета. 2015. № 10. С. 69–72.
  5. Lochter Johannes V., Pires Pedro R., Bossolani Carlos, Yamakami Akebo, Almeida Tiago A. Evaluating the impact of corpora used to train distributed text representation models for noisy and short texts // International Joint Conference on Neural Networks (IJCNN). 2018. pp. 315–322.
  6. Двойникова А.А., Карпов А.А. Аналитический обзор подходов к распознаванию тональности русскоязычных текстовых данных // Информационно-управляющие системы. 2020. № 4(107). С. 20–30.
  7. Ali Ismael, Al Madi Naser, Melton Austin. Using Text Comprehension Model for Learning Concepts, Context, and Topic of Web Content // IEEE 11th International Conference on Semantic Computing (ICSC). 2017. pp. 101–104.
  8. Li Jie, Chen Siming, Chen Wei, Andrienko Gennady, Andrienko Natalia. Semantics-Space-Time Cube: A Conceptual Framework for Systematic Analysis of Texts in Space and Time // IEEE Transactions on Visualization and Computer Graphics. 2020. vol. 26. iss. 4. pp. 1789–1806.
  9. Sheridan Tom. Models of Human-System Interaction [Book Review] // IEEE Systems, Man, and Cybernetics Magazine. 2017. vol. 3. iss. 2. pp. 56–С3.
  10. Митрофанова О.И., Романенко О.Н. Работа с научным текстом на занятиях по русскому языку с иностранными военнослужащими // Научный альманах. 2016. № 8–1(22). С. 473–478.
  11. Levinkov Evgeny, Uhrig Jonas, Tang Siyu, Omran Mohamed, Insafutdinov Eldar, Kirillov Alexander etc. Joint Graph Decomposition & Node Labeling: Problem, Algorithms, Applications // IEEE Conference on Computer Vision and Pattern Recognition (CVPR). 2017. pp. 1904–1912.
  12. Xu LiHong, Sun ShuTao, Wang Qi. Text similarity algorithm based on semantic vector space model // IEEE/ACIS 15th International Conference on Computer and Information Science (ICIS). 2016. рр. 1193–1196.
  13. Бондарчук Д.В. Алгоритмы интеллектуального поиска на основе метода категориальных векторов: дис. … к-та физ.-мат. наук. Екатеринбург: УрГУПС. 2016. 141 с.
  14. Gaspers Judith, Cimiano Philipp, Rohlfing Katharina, Wrede Britta. Constructing a Language from Scratch: Combining Bottom–Up and Top–Down Learning Processes in a Computational Model of Language Acquisition // IEEE Transactions on Cognitive and Developmental Systems. 2017. vol. 9. iss. 2. pp. 183–196.
  15. Когнитивные аспекты лексикографии. Список публикаций В. З. Демьянкова. Статьи и монографии. URL: www.infolex.ru/Dem_Publ.html (дата обращения: 25.07.2020).
  16. Демьянков В.З. Трансфер знания и перевод // Язык. Культура. Перевод. Коммуникация: сб. научн. тр. М.: КДУ, Университетская книга. 2018. Вып. 2. С. 18–21.
  17. Pavlovskiy I.S. The semantic models of large terminological texts // Tenth International Conference Management of Large-Scale System Development (MLSD). 2017. pp. 1–5.
  18. Kang Sungku, Patil Lalit, Rangarajan Arvind, Moitra Abha, Jia Tao, Robinson Dean, Ameri Farhad, Dutta Debasish. Extraction of Formal Manufacturing Rules from Unstructured English Text // Computer-Aided Design. 2021. vol. 130: 102990.
  19. Fernández–Duque David, Nepomuceno–Fernández Ángel, Sarrión–Morrillo Enrique, Soler–Toscan Fernando, Velázquez–Quesada Fernando R. Forgetting complex propositions // Logic Journal of the IGPL. 2015. vol. 23. iss. 6. pp. 942–965.
  20. Sauerland Uli, Yatsushiro Kazuko. Remind-Me Presuppositions and Speech-Act Decomposition: Evidence from Particles in Questions // Linguistic Inquiry. 2017. vol. 48. iss. 4. pp. 651–678.
  21. Кулешов С. В., Зайцева А.А., Марков В.С. Ассоциативно-онтологический подход к обработке текстов на естественном языке // Интеллектуальные технологии на транспорте. 2015. № 4. С. 40–45.
  22. Зацман И.М. Семиотическая модель взаимосвязей концептов, информационных объектов и компьютерных кодов // Информатика и ее применение. 2009. Том 3. №2. С. 65–81.
  23. Мареев С.Н. Диалектика содержания и формы и проблемы формализации // Научные ведомости Белгородского государственного университета. Серия «Философия. Социологи. Право». 2017. № 42 (24). С. 15–26.
  24. Walter Benedikt, Hammes Jakob, Piechotta Marco, Rudolph Stephan. A Formalization Method to Process Structured Natural Language to Logic Expressions to Detect Redundant Specification and Test Statements // IEEE 25th International Requirements Engineering Conference (RE). 2017. pp. 263–272.
  25. Болотнова Н.С. О типологии регулятивных структур в тексте как форме коммуникации // Вестник Томского государственного педагогического университета. 2011. Вып. 3 (105). С. 34–40.
  26. Болотнова Н.С., Бабенко И.И., Бакланова Е.А. и др. Коммуникативная стилистика текста: лексическая регулятивность в текстовой деятельности / Под ред. Н.С. Болотновой // Томск: ТГПУ. 2011. 492 с.
  27. Троцук И.В. Анализ текстовых данных в социологии: основания систематизации концептуальных моделей, методологических принципов и методических решений: дис. д-ра социол. наук. Москва: РУДН. 2014. 338 с.
  28. Мясникова О.В., Фроловская М.Н. Педагогические условия понимания текстов в процессе обучения // Известия АлтГУ. 2014. Вып. 2 (82). Том 2. С. 43–48.
  29. Дьякова А.А. Регулятивность текстов законов, адаптированных к условиям медийного дискурса // Грани познания. 2015. №1. С. 95–100.
  30. Кармин А.С. Культурология. Краткий курс // СПб.: Питер. 2009. 240 с.
  31. Krupp Lars, Gruenerbl Agnes, Bahle Gernot, Lukowicz Paul. Towards Automatic Semantic Models by Extraction of Relevant Information from Online Text // IEEE International Conference on Smart Computing (SMARTCOMP). 2019. рр. 481–483.
  32. Zimmer Melanie, Al-Yacoub Ali, Ferreira Pedro, Lohse Niels. Understanding Human Decision-making during Production Ramp-up using Natural Language Processing // IEEE 17th International Conference on Industrial Informatics (INDIN). 2017. pp. 337–342.
  33. Zakharov Victor, Krassovitskiy Alexander, Meirambekkyzy Zhazirakhanym, Ualiyeva Irina, Khoroshilov Aleksander, Khoroshilov Alexey. Automatic Creation Technologies of Declarative Tools for Clustering Media Documents // International Conference on Engineering Technologies and Computer Science (EnT). 2019. pp. 39–42.
  34. Рослякова Т.А. Школа шитья // Ростов-на-Дону: Феникс. 2000. 445 с.
  35. Sithole Vusi, Marshal Linda. Building Concept Hierarchies for the Internet of Things Patterns Using Domain-specific Dependency Knowledge // Open Innovations (OI). 2019. pp. 1–7.
  36. Воронов М.В. Модель технологического действия // Вестник Санкт-Петербургского государственного университета технологии и дизайна. Серия 1. Естественные и технические науки. 2016. № 1. С. 47–52.
  37. Богатырев М.Ю., Коржук Н.Л. Исследование семантической инвариантности концептуальных моделей текстовых данных // Известия ТулГУ. Технические науки. 2019. Вып. 12. С. 499–503.
  38. Антонов И.В., Воронов М.В. Методы анализа данных в задачах автоматизации построения онтологии предметной области // Дистанционное и виртуальное обучение. 2011. № 8 (50). С. 19–35.
  39. Воронов М.В. Система активной поддержки самоподготовки студентов // Образовательные технологии. 2018. № 3. С. 107–117.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».