Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода

Обложка

Цитировать

Полный текст

Аннотация

Работа посвящена прогнозированию развития эпидемии COVID-19 с помощью нового метода рандомизированного машинного обучения. Основу метода составляет идея оценивания распределений вероятностей параметров модели по реальным данным вместе с распределением вероятностей измерительных шумов. Энтропийно-оптимальные распределения соответствуют состоянию максимальной неопределенности, что позволяет использовать получаемые в итоге прогнозы, как прогнозы наиболее ``негативного'' сценария исследуемого процесса. Полученные оценки параметров и шумов, которые представляют собой распределения вероятностей, необходимо генерировать, получая таким образом ансамбль траекторий, который требуется анализировать статистическими методами. Для целей такого анализа проводится вычисление средней и медианной по ансамблю траектории, а также траектории, соответствующей средним по распределению значениям параметров модели. Предлагаемый подход используется для прогнозирования общего количества инфицированных с помощью трехпараметрической логистической модели роста. Проведенный эксперимент основан на реальных данных о распространении COVID-19 в нескольких странах Европейского союза. Основной целью эксперимента является демонстрация энтропийно-рандомизированного подхода для прогнозирования эпидемического процесса на основе реальных данных вблизи пика. Существенная неопределенность, содержащаяся в доступных реальных данных моделируется аддитивным шумом в пределах 30%, который используется как на этапе обучения модели, так и при прогнозировании. Для настройки гиперпараметров модели используется схема их настройки по тестовой выборке с последующим переобучением. Показано, что при одинаковых наборах данных, предлагаемый подход позволяет более эффективно прогнозировать развитие эпидемии по сравнению со стандартным подходом, основанным на методе наименьших квадратов.

Об авторах

Ю. С Попков

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: popkov@isa.ru
ул. Вавилова 44/2

Ю. А Дубнов

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: yury.dubnov@phystech.edu
ул. Вавилова 44/2

А. Ю Попков

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: apopkov@isa.ru
ул. Вавилова 44/2

Список литературы

  1. van den Driessche P. Mathematical Epidemiology / ed. by Brauer F., van den Driessche P., Wu J. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. vol. 1945. Lecture Notes in Mathematics. pp. 147–157.
  2. Kumar J., Hembram K.P.S.S. Epidemiological study of novel coronavirus (COVID-19). ArXiv. 2020. URL: http://arxiv.org/abs/2003.11376 (accessed 02.09.2021).
  3. Yang W., Zhang D., Peng L., Zhuge C., and Hong L. Rational evaluation of various epidemic models based on the COVID-19 data of China. ArXiv. 2020. URL: http://arxiv.org/abs/2003.05666 (accessed 02.09.2021).
  4. Tátrai D., Várallyay Z. COVID-19 epidemic outcome predictions based on logistic fitting and estimation of its reliability. ArXiv. 2020. URL: http://arxiv.org/abs/2003.14160 (accessed 02.09.2021).
  5. Morais A.F. Logistic approximations used to describe new outbreaks in the 2020 COVID-19 pandemic. ArXiv. 2020. URL: http://arxiv.org/abs/2003.11149 (accessed 02.09.2021).
  6. Shen C.Y. Logistic growth modelling of COVID-19 proliferation in China and its international implications. International Journal of Infectious Diseases. 2020. vol. 96. pp. 582–589. URL: https://doi.org/10.1016/j.ijid.2020.04.085 (accessed 02.09.2021).
  7. Wang P., Zheng X., Li J., Zhu B. Prediction of epidemic trends in COVID-19 with logistic model and machine learning technics. Chaos, Solitons & Fractals. 2020. vol. 139. pp. 110058. URL: https://doi.org/10.1016/j.chaos.2020.110058 (accessed 02.09.2021).
  8. Chen D.-G., Chen X., Chen J.K. Reconstructing and forecasting the COVID-19 epidemic in the United States using a 5-parameter logistic growth model. Global Health Research and Policy. 2020. vol. 5. no. 1. 25 p.
  9. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Рандомизированное машинное обучение при ограниченных наборах данных: от эмпирической вероятности к энтропийной рандомизации. М.: ЛЕНАНД, 2019.
  10. Больцман Л. О связи между вторым началом механической теории теплоты и теорией вероятностей в теоремахо тепловом равновесии. Больцман Л.Э. Избранные труды. Под ред. Шлак Л.С. М.: Наука, 1984.
  11. Jaynes E.T. Information theory and statistical mechanics. Physical review. 1957. vol. 106. no. 4. pp. 620–630.
  12. Jaynes E.T. Probability theory: the logic of science. Cambridge university press. 2003.
  13. Shannon C.E. Communication theory of secrecy systems. Bell Labs Technical Journal. 1949. vol. 28. no. 4. pp. 656–715.
  14. Verhulst P.-F. Notice sur la loi que la population suit dans son accroissement. Corresp. Math. Phys. 1838. vol. 10. pp. 113–126.
  15. Singer H.M. The COVID-19 pandemic: growth patterns, power law scaling, and saturation. Physical Biology. 2020. vol. 17. no. 5. pp. 055001.
  16. Popkov Yu.S., Dubnov Yu.A., Popkov A.Yu. Randomized machine learning: Statement, solution, applications. Intelligent Systems (IS), 2016 IEEE 8th International Conference on IEEE. 2016. pp. 27–39.
  17. Popkov Y.S., Dubnov Y.A., Popkov A.Y. Introduction to the Theory of Randomized Machine Learning. Learning Systems: From Theory to Practice / ed. by Sgurev V., Piuri V., Jotsov V. Cham: Springer International Publishing, 2018. pp. 199–220.
  18. Popkov Y.S., Dubnov Y.A., Popkov A.Y. New method of randomized forecasting using entropy-robust estimation: Application to the World population prediction. Mathematics. 2016. vol. 4. no. 1. pp. 1–16.
  19. Popkov Y.S., Volkovich Z., Dubnov Y.A., Avros R., Ravve E. Entropy 2-Soft Classification of Objects. Entropy. 2017. vol. 19. no. 4. P. 178.
  20. Dubnov Y.A. Entropy-Based Estimation in Classification Problems. Automation and Remote Control. 2019. vol. 80, pp. 502–512.
  21. Popkov Y.S., Popkov A.Y., Dubnov Y.A., Solomatine D. Entropy-Randomized Forecasting of Stochastic Dynamic Regression Models. Mathematics. 2020. No. 8. pp. 1119.
  22. Popkov A.Y. Randomized machine learning of nonlinear models with application to the prediction of the development of epidemic process. Automation and Remote Control. 2021.
  23. Dong E., Du H., Gardner L. An interactive web-based dashboard to track COVID-19 in real time. The Lancet infectious diseases. 2020. vol. 20. no. 5. pp. 533–534.
  24. COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (accessed 02.09.2021).
  25. Golan A., Judge G., Miller D. Maximum Entropy Econometrics: Robust Estimation with Limited Data. New York : John Wiley & Sons. 1996.
  26. Golan A. Information and entropy econometrics. A review and synthesis. Foundations and trends in Econometrics. 2008. vol. 2. no. 1-2. pp. 1–145.
  27. Nocedal J., Wright S. Numerical optimization. Springer Science & Business Media. 2006.
  28. Nash S.G. Newton-type minimization via the Lanczos method. SIAM Journal on Numerical Analysis. 1984. vol.21. no. 4. pp. 770–788.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).