Рандомизированное машинное обучение и прогнозирование нелинейных динамических моделей c применением к эпидемиологической модели SIR

Обложка

Цитировать

Полный текст

Аннотация

В работе предлагается подход к оцениванию параметров нелинейных динамических моделей с помощью концепции Рандомизированного машинного обучения (РМО), основанной на переходе от детерминированных моделей к случайным (со случайными параметрами) с последующим оцениванием вероятностных распределений параметров и шумов по реальным данным. Главной особенностью данного метода является его эффективность в условиях малого количества реальных данных. В работе рассматриваются модели, сформулированные в терминах обыкновенных дифференциальных уравнений, которые преобразуются к дискретному виду для постановки и решения задачи энтропийной оптимизации. Применение предлагаемого подхода демонстрируется на задаче прогнозирования общего количества инфицированных COVID-19 с помощью динамическойэпидемиологической модели SIR. Для этого в работе строится рандомизированная модель SIR (R-SIR) с одним параметром, энтропийно-оптимальная оценка которого реализуется его функцией плотности распределения вероятностей, а также функциями плотности распределения вероятностей измерительных шумов в точках, в которых производится обучения. Далее применяется техника рандомизированного прогнозирования с фильтрацией шумов, основанная на генерации соответствующих распределений и построении ансамбля прогнозных траекторий с вычислением средней по ансамблю траектории. В работе реализуется вычислительный эксперимент с использованием реальных оперативных данных о заболеваемости в виде сравнительного исследования с известным методом оценивания параметров модели, основанным на методе наименьших квадратов. Полученные в эксперименте результаты демонстрируют существенное снижение средне-абсолютной процентной ошибки (MAPE) при по отношению к реальным наблюдениям на интервале прогноза, что показывают работоспособность предложенного метода и его эффективность в задачах рассматриваемого в работе типа.

Об авторах

А. Ю Попков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Email: apopkov@isa.ru
улица Вавилова 44-2

Ю. А Дубнов

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Email: yury.dubnov@phystech.edu
улица Вавилова 44-2

Ю. С Попков

Федеральный исследовательский центр «Информатика и управление» Российской академии наук

Email: popkov@isa.ru
улица Вавилова 44-2

Список литературы

  1. Попков Ю.С., Дубнов Ю.А., Попков А.Ю. Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода // Информатика и автоматизация, 2021, Т. 20, №5, c. 1010-1033, https://doi.org/10.15622/ia.20.5.1.
  2. van den Driessche P. Mathematical Epidemiology / ed. by Brauer F., van den Driessche P., Wu J. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. Vol. 1945 of Lecture Notes in Mathematics. P. 147–157. https://doi.org/10.1007/978-3-540-78911-6.
  3. Айвазян С.А., Мхитарян В.С. Прикладная статистика и основы эконометрики.— М.:Юнити, 1998.
  4. Лагутин М.Б. Наглядная математическая статистика. — Бином. Лаб. знаний, 2013.
  5. Боровков А.А. Математическая статистика. — М.:Наука, 1984.
  6. Bishop C. Pattern Recognition and Machine Learning (Information Science and Statistics), 2006. Springer, New York, 2006.
  7. Hastie T., Tibshirani R., Friedman J. The Elements of Statistical Learning: Data mining, Inference, and Prediction. Springer New York, 2009.
  8. Мерков А.Б. Распознавание образов. Введение в методы статистического обучения. М. : URSS, 2010.
  9. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Рандомизированное машинное обучение при ограниченных наборах данных: от эмпирической вероятности к энтропийной рандомизации. — М.: ЛЕНАНД, 2019. ISBN: 978-5-9710-5908-0.
  10. Попков Ю.С., Дубнов Ю.А. Энтропийно-робастное рандомизированное прогнозирование при малых объемах ретроспективных данных // Автоматика и телемеханика. 2016. № 5. С. 109–127.
  11. Попков А.Ю. Рандомизированное машинное обучение нелинейных моделей с применением к прогнозированию развития эпидемического процесса // Автоматика и телемеханика. 2021. № 6. С. 149–168. https://doi.org/10.31857/S0005231021060064.
  12. Popkov Y.S., Dubnov Y.A., Popkov A.Y. Introduction to the Theory of Randomized Machine Learning // Learning Systems: From Theory to Practice / ed. by Sgurev V., Piuri V., Jotsov V. Cham: Springer International Publishing, 2018. P. 199–220. ISBN: 978-3-319-75181-8. https://doi.org/10.1007/978-3-319-75181-8_10.
  13. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Элементы рандомизированного прогнозирования и его применение для предсказания суточной электрической нагрузки энергетической системы // Автоматика и телемеханика. 2020. С. 148–172. https://doi.org/10.1134/S0005231019070107.
  14. Kermack W.O., McKendrick A.G. Contributions to the Mathematical Theory of Epidemics // Proceedings of the Royal Society. 1927. Vol. 115A. P. 700–721.
  15. Muller G.R. Zeitschrift f¨ur allgemeine Mikrobiologie / In: The Population Dynamics of Infectious Diseases: Theory and Applications. 368 S., 135 Abb., 104 Tab. London-New York, Chapman and Hall, 1984, Vol. 24, no. 2. pp. 76–76. https://doi.org/10.1002/jobm.19840240203.
  16. Hethcote H.W. Three Basic Epidemiological Models // Applied Mathematical Ecology. Springer Berlin Heidelberg, 1989. pp. 119–144. https://doi.org/10.1007/978-3-642-61317-3_5.
  17. Peng L., Yang W., Zhang D., Zhuge C., Hong L. Epidemic analysis of COVID-19 in China by dynamical modeling // arXiv, 2020. 10.48550/ARXIV.2002.06563.
  18. Yang W., Zhang D., Peng L., Zhuge C., Hong L. Rational evaluation of various epidemic models based on the COVID-19 data of China // Epidemics, 2021. Vol. 37. p. 100501. https://doi.org/10.1016/j.epidem.2021.100501.
  19. Cheng C., Zhang D., Dang D., Geng J., Zhu P., Yuan M., Liang R., Yang H., Jin Y., Xie J., Chen S., Duan G. The incubation period of COVID-19: a global meta-analysis of 53 studies and a Chinese observation study of 11 545 patients // Infectious Diseases of Poverty, 2021. Vol. 10, no. 1. https://doi.org/10.1186/s40249-021-00901-9.
  20. Huang S., Li J., Dai C., Tie Z., Xu J., Xiong X., Hao X., Wang Z., Lu C. Incubation period of coronavirus disease 2019: New implications for intervention and control // International Journal of Environmental Health Research, 2021. P. 1–9. https://doi.org/10. 1080/09603123.2021.1905781.
  21. Li Q. et al. Early Transmission Dynamics in Wuhan, China, of Novel Coronavirus — Infected Pneumonia // New England Journal of Medicine, 2020. Vol. 382, no. 13. P. 1199–1207. https://doi.org/10.1056/nejmoa2001316.
  22. Nie X. et al. Epidemiological Characteristics and Incubation Period of 7015 Confirmed Cases With Coronavirus Disease 2019 Outside Hubei Province in China // The Journal of Infectious Diseases, 2020. Vol. 222, no. 1. pp. 26–33. https://doi.org/10.1093/infdis/jiaa211.
  23. Guidotti E., Ardia D. COVID-19 Data Hub // Journal of Open Source Software. 2020. Vol. 5, no. 51. P. 2376. https://doi.org/10.21105/joss.02376.
  24. COVID-19 Data Hub. https://www.covid19datahub.io. 2021. Accessed: 2022-06-20.
  25. Флах П. Наука и искусство построения алгоритмов, которые извлекают знания из данных. ДМК Пресс, 2015.
  26. Rubinstein R.Y., Kroese D.P. Simulation and the Monte Carlo method. John Wiley & Sons, 2007. Vol. 707.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).