Построение этиопатогенетического образа концептов метатезауруса UMLS с использованием графовых метрик

Обложка

Цитировать

Полный текст

Аннотация

Разработка средств информационной поддержки принятия клинических решений (ППКР) является актуальной задачей медицинской информатики. Довольно часто в системах ППКР используются информационно-поисковые алгоритмы, важным этапом проектирования которых служит создание средств автоматического распознавания этиопатогенетического образа заболеваний при работе с неструктурированным текстом. В настоящей статье произведены обзор и сравнительная характеристика аналитических метрик, применимых для построения образа концептов метатезауруса Unified Medical Language System (UMLS), представленного в виде графовой информационной модели. Предложен собственный вариант графовой метрики, показавший наибольшую эффективность при решении данной задачи.

Об авторах

Павел Андреевич Астанин

Российский национальный исследовательский медицинский университет им. Н. И. Пирогова

Автор, ответственный за переписку.
Email: med_cyber@mail.ru
ORCID iD: 0000-0002-1854-8686
аспирант кафедры медицинской кибернетики и информатики имени С. А. Гаспаряна, аналитик (лаборатория семантического анализа медицинской информации РНИМУ им. Н. И. Пирогова). Область интересов: обработка естественного языка (NLP), теория графов, базы данных, нечёткая логика, информационная поддержка принятия решений. Автор более 50 научных работ

Светлана Евгеньевна Раузина

Российский национальный исследовательский медицинский университет им. Н. И. Пирогова

Email: rauzina@mail.ru
ORCID iD: 0000-0002-9535-2847
к. м. н., доцент, зав. лаб. семантического анализа медицинской информации (РНИМУ им. Н. И. Пирогова). Область интересов: медицинская информатика, проектирование МИС, разработка систем поддержки принятия решений. Автор более 50 научных работ, в том числе 1 учебник, 2 главы в монографиях, 4 сертификата и свидетельства на программные средства, 3 методических пособия

Татьяна Васильевна Зарубина

Российский национальный исследовательский медицинский университет им. Н. И. Пирогова

Email: t_zarubina@mail.ru
ORCID iD: 0000-0002-4403-8049
д. м. н., профессор, член-корр. РАН, главный внештатный специалист Минздрава России по информационным системам в здравоохранении. Автор более 270 научных работ, в том числе 2 учебника, 5 монографий, 10 сертификатов и свидетельств на программные средства, патенты, методические пособия, сборники под редакцией

Список литературы

  1. Астанин П. А., Ронжин Л. В., Раузина С. Е., Зарубина Т. В.. «Алгоритмы семантического анализа данных и возможности их применения в разработке медицинских информационных систем», Цифровая статистика. Новые задачи и траектория движения — 2022, Материалы IV Съезда медицинских статистиков Москвы (21–23 сентября 2022 года), 2022, с. 6–9.
  2. Кукарцев В. В., Колмакова З. А., Мельникова О. Л.. «Системный анализ возможностей по извлечению именованных сущностей с применением технологии Text Mining», Перспективы науки, 120:9 (2019), с. 18–20.
  3. Berlingerio M., Coscia M., Giannotti F., Monreale A., Pedreschi D.. “Multidimensional networks: foundations of structural analysis”, World Wide Web, 16 (2013), pp. 567–593.
  4. Клабукова Д. Л., Давыдовская М. В.. «Внедрение международной терминологической базы MedDRA в практику фармаконадзора в Российской Федерации», Московская медицина, 35:1 (2020), с. 64–69.
  5. Кузьмин А. Г., Умаров М. Ф.. «Интеграция современных медицинских информационных технологий», Вестник Вологодского государственного университета. Серия: Технические науки, 12:2 (2021), с. 32–35.
  6. Зацман И. М., Золотарев О. В., Хакимова А. Х., Дунсяо Гу. «Модель и технология извлечения новых терминов из медицинских текстов», Информ. и её примен., 16:4 (2022), с. 80–86.
  7. Mougin F., Grabar N.. “Auditing the multiply-related concepts within the UMLS”, Journal of the American Medical Informatics Association, 21:e2 (2014), pp. e185–e193.
  8. Астанин П. А.. «Применение автоматизированного анализа семантической сети UMLS для решения задачи поиска релевантных знаний о ревматических заболеваниях», Математическое моделирование систем и процессов, Сборник материалов Международной научно-практической конференции (г. Псков, 9-11 ноября 2022 г.), Псковский государственный университет, Псков, 2022, ISBN 978-5-00200-102-6, с. 6–12.
  9. Ямашкин С. А., Скворцов М. А., Большакова М. В., Ямашкин А. А.. «Сравнительный анализ подходов к управлению базами данных для организации хранилища репозитория нейросетевых моделей», Современные наукоемкие технологии, 2021, №6-1, с. 108–113.
  10. Елисеева Е.А., Горячкин Б.С., Виноградова М.В., Черненький М.В.. «Оценка времени выполнения поисковых запросов в NoSQL и объектно-реляционной базах данных», Динамика сложных систем — XXI век, 23:2 (2022), с. 44–51.
  11. Еремеев А. П., Мунтян Е. Р.. «Разработка онтологии на основе графов с множественными и разнотипными связями», Искусственный интеллект и принятие решений, 2021, №3, с. 3–18.
  12. Nicosia V., Latora V.. “Measuring and modeling correlations in multiplex networks”, Physical Review E, 92 (2015), 032805.
  13. Battiston F., Nicosia V., Latora V.. “Structural measures for multiplex networks”, Physical review E, 89 (2014), 032804.
  14. Szárnyas G., Kővári Z., Salánki A., Varro D.. “Towards the characterization of realistic models: evaluation of multidisciplinary graph metrics”, Proceedings of the ACM/IEEE 19th International Conference on Model Driven Engineering Languages and Systems (Saint-malo, France, October 2–7, 2016), ACM, New York, 2016, ISBN 978-1-4503-4321-3, pp. 87–94.
  15. Nascimento M. C. V., Carvalho A. C. P. L. F.. “A graph clustering algorithm based on a clustering coefficient for weighted graphs”, Journal of the Brazilian Computer Society, 17 (2011), pp. 19–29.
  16. Пулькин И. С., Татаринцев А. В.. «Достаточная статистика для параметра распределения Парето», Russian Technological Journal, 9:3 (2021), с. 88–97.
  17. Синицын В. Ю., Кашпарова В. С.. «Частотные свойства лексики научных текстов и законы Ципфа высших порядков», Вестник РГТУ. Серия: Информатика. Информационная безопасность. Математика, 2022, №4, с. 75–91.
  18. Ghaderpour E., Morris D.. “Cayley graphs on nilpotent groups with cyclic commutator subgroup are hamiltonian”, Ars Mathematica Contemporanea, 7:1, Special Issue Bled'11 (2011), pp. 55–72.
  19. Каратеев А. Е.. «Хроническая боль в спине как проявление остеоартрита позвоночника: обоснование и практика применения симптоматических средств замедленного действия», Современная ревматология, 16:4 (2022), с. 88–97.
  20. Higuchi H., Harada T., Hiroshige J.. “Evaluation of the usefulness of costovertebral angle tenderness in patients with suspected ureteral stone”, J. Gen. Fam. Med., 24:1 (2023), pp. 56–58.
  21. Се Л., Ду Ч., Ин Ч., Вэй Я.. «Острое расслоение аорты с правосторонней болью в грудной клетке и спине, сопровождающейся левосторонней дискинезией конечности», Кардиология, 62:6 (2022), с. 74–76.
  22. Дуга С. В., Труфанов А. И.. «Сеть знаний как концепция систем поддержки принятия решения в предварительном следствии», Безопасность информационных технологий, 27:3 (2020), с. 54–65.
  23. Мосалов О. П.. «Векторные представления рёбер графа онтологии как инструмент для анализа и генерации новых данных», Информационно-технологический вестник, 27:1 (2021), с. 93–101.
  24. Ананьева Е. А.. «Levels of presentation of passenger transport route networks in the form of graph models», Colloquium-Journal, 35:11-1 (2019), с. 63–68 (in Russian).
  25. Близнякова Е. А., Куликов А. А., Куликов А. В.. «Comparative analysis of methods for finding the shortest distance in a graph», Архитектура, строительство, транспорт, 2022, №1, с. 80–87 (in Russian).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML


Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».