Development of a prognostic and diagnostic model of duodenal ulcer using computer data analysis

Cover Page

Cite item

Full Text

Abstract

Duodenal ulcer among diseases of the digestive system continues to be one of the most common reasons for people seeking medical help. The problem of predicting the possibility of the occurrence and characteristics of the course of a disease has always been and remains the most important section in the work of doctors and the subject of intensive activity of scientists in finding a solution to the problem. The article presented the stages and results of developing a prognostic model of duodenal ulcer using computer data analysis.

Full Text

Введение. Искусственный интеллект – это область информатики, занимающаяся разработкой систем, которые способны выполнять манипуляции, традиционно связанные с человеческим ресурсом. Сегодня все чаще ведутся дискуссии о преимуществах и недостатках использования искусственного интеллекта в различных профессиональных сферах, в том числе и в медицине [1].

Умение мыслить и действовать нестандартно в сложных ситуациях играет главную роль в правильной постановке диагноза. Это зачастую связано с тем, что знания и опыт врача имеют в значительной степени нестатистический характер, который является результатом взаимодействия теоретических, практических знаний и собственных клинических наблюдений. Именно таким особенностям современной медицины полностью отвечают интеллектуальные системы (ИС), которые основаны на анализе данных и знаниях высоко профессиональных специалистов-экспертов, а не на информации о пациентах (отсюда их первое название – экспертные системы) [2].

Язвенная болезнь (ЯБ) двенадцатиперстной кишки (ДПК), в современном обществе, остается одной из частых причин обращаемости людей за медицинской помощью несмотря на постоянное усовершенствование различных методов обследования и лечения больных с данной патологией [3]. Неоднократно доказано, что большое количество язв ДПК имеет хроническое и рецидивирующее течение, поэтому прогнозирование течения ЯБ приобретает первостепенное значение в определении лечебной тактики и предупреждении осложнений (перфорация, кровотечение, рубцовые стенозы привратника, грубая деформация выходного отдела желудка и ДПК) [4].

Много остается неясного в различных механизмах рецидивов и увеличения риска и частоты осложнений заболевания после, казалось бы, успешной терапии. Кроме того, если говорить о впервые выявленных случаях ЯБ, то прогноз их течения является наиболее актуальным на данном этапе [5]. Исходя из этого, существует большая необходимость модернизации и более полного и активного использования различных компьютерных диагностических технологий, которые необходимо направить на прогнозирование течения ЯБ [6].

Известно, что ранее уже разрабатывались специализированные информационные комплексы, которые позволяют оценить факторы риска с использованием традиционных биостатистических методов, но в полной мере решить проблему разработки персонализированной профилактической стратегии они не могут в силу свойственных им фундаментальных математических ограничений. В то же время ИС продемонстрировали большие возможности в анализе сложных данных [7], однако их потенциал в рассматриваемой области медицины только предстоит изучить.

Цель работы: разработать прогностическую модель язвенной болезни двенадцатиперстной кишки с применением компьютерного анализа данных.

Материалы и методы. Анализировали данные пациентов с язвенной болезнью и данные здоровых лиц, собранных ранее в рамках диссертационного исследования канд. мед. наук И. Е. Трохиной.

Диагноз определялся экспертно на основании анамнестических, клинических данных, результатов лабораторных и инструментальных методов исследования – эзофагогастродуоденоскопии (ЭФГДС), исследования на инфицированность Нelicobacter pylori. ЭФГДС проводили на основе общепринятой методики эндоскопами Olimpus, Exera (CIF160) в утренние часы, натощак. Анализировались данные лабораторных методов исследования (общего и биохимического анализов крови) при поступлении, на 7-е, 14-е, 30-е сутки течения заболевания. Кровь для исследования брали при первичном обращении до начала лечения и в течение времени при проведении терапии при получении информированного добровольного согласия обследуемых лиц. Использовались данные 27 здорового добровольца (группа 1), 28 больных с ЯБ ДПК (группа 2) и 28 больных с ЯБ ДПК, страдающих хронической ишемией головного мозга (группа 3).

Собранные обезличенные данные анализировались в среде JupyterLab с установленным ядром-интерпретатором языка Python версии 3.8 на компьютере (рабочей станции) с операционной системой Linux Ubuntu 22.04.3 LTS, применялись стандартные библиотеки для анализа данных.

Проводили сначала анализ объединенных данных групп 1 и 2 (то есть, здоровых лиц и больных ЯБ без хронической ишемии мозга), а затем объединенных данных групп 2 и 3 (то есть, только по отношению к данных больных ЯБ, но опционально дополнительно страдающих хронической ишемией головного мозга).

Результаты. Для построения прогностической модели данные были полуавтоматически (для исключения ошибок ручного редактирования) предобработаны: были удалены столбцы, по которым данные были однородны по двум группам (например, столбец с результатами теста на Helicobacter pylori, который у всех пациентов в выборке был положительный), проводился контроль пропусков значений (пропущенных значений не было выявлено). Собственно, исследовательский анализ данных после предобработки включал проверку характера данных, корреляционный анализ и применение метода главных компонент.

Проверка характера данных заключалась в оценке характера распределения записанных показателей исследуемых лиц и вычислении классических статистических показателей: среднего значения – mean, стандартного отклонения – std, минимального и максимального значений – min и max, значений, соответствующих 25, 50, 75 перцентилю распределения – 25‰, 50‰, 75‰ (рис. 1).

 

Рис. 1. Пример таблицы, полученной при проверке характера данных.

 

Интересная находка была обнаружена при визуализации данных и заключалась в том, что пациенты на основании двухпиковости распределения размеров язвы при поступлении и распределения интенсивности уменьшения язвы к окончанию второй недели лечения могут быть четко разделены на непересекающиеся фенотипы по следующим критериям: с язвой на момент поступления до 10 мм и более 10 мм, а также с уменьшением размеров язвы на 14 сутки лечения до 1 мм включительно и более 1 мм.

 

Далее представлены примеры визуализации распределений данных (рис. 2).

 

Рис. 2. Примеры гистограмм проверки характера данных.

Примечания: в столбцы сверху вниз распределены по 3 гистограммы

(1-я – распределение без выбросов; 2-я – данные без обработки; 3-я – данные с лог-трансформацией), по оси ординат – частота встречаемости конкретного значения (ось абсцисс).

 

Следующим     шагом     исследовательского     анализа    данных     стало проведение корреляционного анализа данных пациентов. Были удалены данные по показателям, коррелирующим с большим числом других показателей (в этом исследовании убирали показатели, имеющие более 3 коррелирующих с ними). Далее приведем примеры таких корреляций в визуальном представлении (рис. 3).

 

Рис. 3. Примеры визуального представления корреляции между исследованными признаками.

 

После чистки корреляций, обнаруженных с помощью стандартизации значений факторов и собственно поиска корреляций стандартными методами, проводили анализ с применением метода главных компонент. С помощью этого метода было выяснено, что практически всю вариабельность данных пациентов с ЯБ из выборки нашего исследования возможно соотнести с вариабельностью следующих признаков: длительностью анамнеза курения, а также различиями в показателях роста, массы тела, показателях анализов крови: гемоглобин, билирубин, щелочной фосфатазы (ЩФ) и диацилглицерола (ДАГ).

Заключение. Согласно нашим исследованиям, именно такие признаки как длительность анамнеза курения, рост, масса тела, гемоглобин, билирубин, ЩФ, ДАГ – вероятно, наиболее целесообразно использовать на следующих этапах исследований для построения прогностических моделей машинного обучения (искусственного интеллекта), нацеленных на формирование скрининговых заключений относительно ЯБ ДПК, а также построения моделей для выделения фенотипов пациентов.

×

About the authors

Pavel S. Zamyshlyaev

National Research Mordovia State University

Email: zamyshlyaev@mrsu.ru

Заместитель директора по цифровизации Медицинского института, руководитель лаборатории информационных технологий в медицине

Russian Federation, 68 Bolshevistskaya St., Saransk 430005

Anastasia A. Morozkina

National Research Mordovia State University

Email: morozkina_nastasya@mail.ru

Студентка шестого курса Медицинского института

Russian Federation, 68 Bolshevistskaya St., Saransk 430005

Irina E. Trokhina

National Research Mordovia State University

Email: trohina-07@yandex.ru

Кандидат медицинских наук, доцент кафедры госпитальной терапии

Russian Federation, 68 Bolshevistskaya St., Saransk 430005

Artyom A. Fedin

National Research Mordovia State University

Email: afa8042001@mail.ru

Студент четвертого курса Медицинского института

Russian Federation, 68 Bolshevistskaya St., Saransk 430005

Veronika V. Yamashkina

National Research Mordovia State University

Author for correspondence.
Email: nicka.yamashkina@mail.ru

Студентка шестого курса Медицинского института

Russian Federation, 68 Bolshevistskaya St., Saransk 430005

References

  1. Лазаренко В.А., Антонов А.Е., Markapuram V.K., Awad K. Опыт нейросетевой диагностики и прогнозирования язвенной болезни по результатам анализа факторов риска // Бюллетень сибирской медицины. – 2018. – № 17 (3). – С. 88–95.
  2. Кобринский Б.А. Искусственный интеллект и медицина: Возможности и перспективы систем, основанных на знаниях // Новости искусственного интеллекта. – 2019. – № 4. – С. 44–51.
  3. Кобринский Б.А., Хавкин А.И., Волынец Г.В. Перспективы применения систем искусственного интеллекта в гастроэнтерологии // Экспериментальная и клиническая гастроэнтерология. – 2020. – № 179 (7). – С. 109–117.
  4. Миненок В.А. Использование искусственного интеллекта в медицине // М.: Сборник тезисов конференции CBAI «Вычислительная биология и искусственный интеллект для персонализированной медицины». – С. 75–76.
  5. Маев И.В., Андреев Д.Н., Самсонов А.А., Черёмушкина А.С. Язвенная болезнь: современное состояние проблемы // Медицинский совет. – 2022. – № 16 (6). – С. 100– 108.
  6. Blaser M.J., Atherton J.C. Helicobacter pylori persistence: biology and disease // J. Clin. Invest. – 2020. – Vol. 113, No. 3. – P. 321–333.
  7. Грибова В.В., Петряева М.В., Шалфеева Е.А. Облачный сервис поддержки принятия диагностических решений в гастроэнтерологии // Врач и информационные технологии. – 2019. – № 3. – С. 65–71.

Supplementary files

Supplementary Files
Action
1. JATS XML
2. Fig. 1. An example of a table obtained by checking the nature of the data.

Download (47KB)
3. Fig. 2. Examples of histograms for checking the nature of data.

Download (85KB)
4. Fig. 3. Examples of visual representation of correlation between the studied features.

Download (17KB)

Мы используем файлы cookies, сервис веб-аналитики Яндекс.Метрика для улучшения работы сайта и удобства его использования. Продолжая пользоваться сайтом, вы подтверждаете, что были об этом проинформированы и согласны с нашими правилами обработки персональных данных.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».