Технологии расчета и визуализации статистики распространенности и заболеваемости на примере сведений о полипозном риносинусите в Самарской области

Обложка

Цитировать

Полный текст

Аннотация

Цель – определить в статистическом смысле особенности распределения хронических заболеваний в хронологии наблюдений; показать специфику приемов проверок гипотез в количественном и вероятностном прогнозе распространяемости полипозного риносинусита.

Материалы и методы. Использованы данные случаев амбулаторно-поликлинической помощи за 2017–2021 годы и количественные сведения о зарегистрированных основных или сопутствующих фактах заболеваний полипозным риносинуситом в медицинских организациях в 25 районах Самарской области.

Результаты. Синтез статистик исходных данных, которые составили объем числового расширения первичных показателей в следующем соотношении: категории 15,8%, счетные данные 26,3%; количественные значения 21,1%; 26,7% – это относительные данные заболеваемости и распространенности. Оставшийся объем – это описательная статистика и показатели в виде таблиц коэффициентов корреляций. Для синтезированных расширений данных произведены оценки распределений и проверки гипотез с использованием статистических критериев.

Выводы. Счет числа заболеваний хронического характера аппроксимируются плотностями атипичных распределений. Приблизительно 58% выборок по диагнозам не подтверждаются, подчиняясь закону распределения. В подобной ситуации при подготовке прогноза для перехода к временному ряду необходимо решать проблему получения последовательностей со стационарными характеристиками. При машинном обучении данные в расчетах предсказания должны пройти проверку на вероятностное подтверждение совпадения распределений параметров связанных выборок. Результаты прогноза следует воспринимать как вероятностный вывод на уровне неотвергаемой гипотезы.

Об авторах

С. А. Палевская

ФГБОУ ВО «Самарский государственный медицинский университет» Минздрава России

Email: s.a.palevskaya@samsmu.ru
ORCID iD: 0000-0001-9263-9407

д-р мед. наук, MBA, профессор МВА, директор ИПО

Россия, Самара

Андрей Викторович Гущин

ФГБОУ ВО «Самарский государственный медицинский университет» Минздрава России

Автор, ответственный за переписку.
Email: a.v.guschin@samsmu.ru
ORCID iD: 0000-0002-6128-2334

канд. техн. наук, доцент кафедры менеджмента ИПО

Россия, Самара

М. К. Блашенцев

ФГБОУ ВО «Самарский государственный медицинский университет» Минздрава России

Email: mblashentsev@gmail.com
ORCID iD: 0000-0002-9820-4292

аспирант кафедры оториноларингологии им. академика РАН И.Б. Солдатова, ассистент ФАЦ

Россия, Самара

Список литературы

  1. You J, Tulpan D, Malpass MC, et al. Using machine learning regression models to predict the pellet quality of pelleted feeds. Animal Feed Science and Technology. 2022;293:115443. doi: 10.1016/j.anifeedsci.2022.115443
  2. Hu Y, Xia X, Fang J, et al. A Multivariate Regression Load Forecasting Algorithm Based on Variable Accuracy Feedback. Energy Procedia. 2018;152:1152-1157. doi: 10.1016/j.egypro.2018.09.147
  3. Kumari Kh, Yadav S. Linear regression analysis study. Curriculum in cardiology – statistics. 2018;4(1):33-36. doi: 10.4103/jpcs.jpcs_8_18
  4. Almalik O. Combining dependent p-values resulting from multiple effect size homogeneity tests in meta-analysis for binary outcomes. Journal of Medical Statistics and Informatics. 2021;1. doi: 10.7243/2053-7662-10-1
  5. Hart J. Comparison of p-value results between one versus two sample t testing: A case study. Journal of Medical Statistics and Informatics. 2021;10. doi: 10.7243/2053-7662-9-1
  6. Iftikhar S. Modification in inter-rater agreement statistics-a new approach. Journal of Medical Statistics and Informatics. 2020;8(1):2. doi: 10.7243/2053-7662-8-2
  7. Basu A. Does a country’s scientific ‘productivity’ depend critically on the number of country journals indexed? Scientometrics. 2010;3. doi: 10.1007/slll92-010-0186-8
  8. Almalki A. Regression Analysis for COVID-19 Infections and Deaths Based on Food Access and Health Issues. Healthcare. 2022;10(2):324. doi: 10.3390/healthcare10020324
  9. Silhavy R, Silhavy P, Prokopova Z. Analysis and selection of a regression model for the Use Case Points method using a stepwise approach. Journal of Systems and Software. 2017;125:1-14. doi: 10.1016/j.jss.2016.11.029
  10. Trubiani C, Ghabi A, Egyed A. Exploiting traceability uncertainty between software architectural models and extra-functional results. Journal of Systems and Software. 2017;125:15-34. doi: 10.1016/j.jss.2016.11.032
  11. García-Floriano A, López-Martín C, Yáñez-Márquez C, et al. Support vector regression for predicting software enhancement effort. Information and Software Technology. 2018;97:99-109. doi: 10.1016/j.infsof.2018.01.003
  12. Bach P, Wallisch Ch, Klein N, et al. Systematic review of education and practical guidance on regression modeling for medical researchers who lack a strong statistical background: Study protocol. National Library of Medicine, 2020;21;15(12). doi: 10.1371/journal.pone.0241427
  13. Rambotti S, Breiger RL. Extreme and Inconsistent: A Case-Oriented Regression Analysis of Health, Inequality, and Poverty. Sage. 2020;18. doi: 10.1177/2378023120906064
  14. Crabtree BF, Ray SC, Schmidt PM, et al. The individual over time: Time series applications in health care research. Journal of Clinical Epidemiology. 1990;43(3):241-260. doi: 10.1016/0895-4356(90)90005-A
  15. Festag S, Denzler J, Spreckelsen C. Generative adversarial networks for biomedical time series forecasting and imputation. Journal of Biomedical Informatics. 2022;129:104058. doi: 10.1016/j.jbi.2022.104058
  16. Morid MA, Sheng Ol, et al. Time Series Prediction Using Deep Learning Methods in Healthcare. Transactions on Management Information Systems. 2023;14(1):1-29. doi: 10.1145/3531326

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рисунок 1. Оценка плотности распределений заболеваний по диагнозу J33.0 по районам за период 2017–2021 гг.: a – ядерная оценка плотности положительных значений; b – межквартильный размах (коробка, 50% реализаций случайной величины с наибольшей плотностью), медиана (вертикальная линия, разделяющая коробку), разброс (ограниченные отрезки справа и слева от коробки) и отдельные выбросы (точки за линией отрезков), которые можно воспринимать как атипичные значения для данного характера распределения.

Скачать (765KB)
3. Рисунок 2. Линейные графики парного сравнения количества заболеваний мужчин и женщин по годам, ‖∙‖ – относительное расстояние между парами нормированных линий: a – диагноз J33.0, ‖∙‖=0.00036; b – диагноз J33.1, ‖∙‖=0.1118; c – диагноз J33.8, ‖∙‖=0.0104; d – диагноз J33.9, ‖∙‖=0.0090.

Скачать (954KB)
4. Рисунок 3. Оценка плотности распределений J33.0 по районам за период 2017–2021 гг. (визуальная оценка для знака аргумента > 0); вертикальная сплошная линия – медиана распределения; вертикальная пунктирная линия – оценка среднего: Mx – среднее, max – максимальное учитываемое количество при аппроксимации плотности: a – заболеваемость; b – распространенность.

Скачать (816KB)
5. Рисунок 4. Регрессия и прогноз распространенности заболевания, диагноз J33.0.

Скачать (830KB)
6. Рисунок 5. Регрессия и прогноз первичной распространенности заболевания, диагноз J33.0.

Скачать (822KB)

© Палевская С.А., Гущин А.В., Блашенцев М.К., 2023

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».