Прогнозирование развития эпидемии COVID-19 в странах Европейского союза с использованием энтропийно-рандомизированного подхода

Обложка

Цитировать

Полный текст

Аннотация

Работа посвящена прогнозированию развития эпидемии COVID-19 с помощью нового метода рандомизированного машинного обучения. Основу метода составляет идея оценивания распределений вероятностей параметров модели по реальным данным вместе с распределением вероятностей измерительных шумов. Энтропийно-оптимальные распределения соответствуют состоянию максимальной неопределенности, что позволяет использовать получаемые в итоге прогнозы, как прогнозы наиболее ``негативного'' сценария исследуемого процесса. Полученные оценки параметров и шумов, которые представляют собой распределения вероятностей, необходимо генерировать, получая таким образом ансамбль траекторий, который требуется анализировать статистическими методами. Для целей такого анализа проводится вычисление средней и медианной по ансамблю траектории, а также траектории, соответствующей средним по распределению значениям параметров модели. Предлагаемый подход используется для прогнозирования общего количества инфицированных с помощью трехпараметрической логистической модели роста. Проведенный эксперимент основан на реальных данных о распространении COVID-19 в нескольких странах Европейского союза. Основной целью эксперимента является демонстрация энтропийно-рандомизированного подхода для прогнозирования эпидемического процесса на основе реальных данных вблизи пика. Существенная неопределенность, содержащаяся в доступных реальных данных моделируется аддитивным шумом в пределах 30%, который используется как на этапе обучения модели, так и при прогнозировании. Для настройки гиперпараметров модели используется схема их настройки по тестовой выборке с последующим переобучением. Показано, что при одинаковых наборах данных, предлагаемый подход позволяет более эффективно прогнозировать развитие эпидемии по сравнению со стандартным подходом, основанным на методе наименьших квадратов.

Об авторах

Ю. С Попков

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: popkov@isa.ru
ул. Вавилова 44/2

Ю. А Дубнов

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: yury.dubnov@phystech.edu
ул. Вавилова 44/2

А. Ю Попков

Федеральный исследовательский центр "Информатика и управление" Российской академии наук

Email: apopkov@isa.ru
ул. Вавилова 44/2

Список литературы

  1. van den Driessche P. Mathematical Epidemiology / ed. by Brauer F., van den Driessche P., Wu J. Berlin, Heidelberg: Springer Berlin Heidelberg, 2008. vol. 1945. Lecture Notes in Mathematics. pp. 147–157.
  2. Kumar J., Hembram K.P.S.S. Epidemiological study of novel coronavirus (COVID-19). ArXiv. 2020. URL: http://arxiv.org/abs/2003.11376 (accessed 02.09.2021).
  3. Yang W., Zhang D., Peng L., Zhuge C., and Hong L. Rational evaluation of various epidemic models based on the COVID-19 data of China. ArXiv. 2020. URL: http://arxiv.org/abs/2003.05666 (accessed 02.09.2021).
  4. Tátrai D., Várallyay Z. COVID-19 epidemic outcome predictions based on logistic fitting and estimation of its reliability. ArXiv. 2020. URL: http://arxiv.org/abs/2003.14160 (accessed 02.09.2021).
  5. Morais A.F. Logistic approximations used to describe new outbreaks in the 2020 COVID-19 pandemic. ArXiv. 2020. URL: http://arxiv.org/abs/2003.11149 (accessed 02.09.2021).
  6. Shen C.Y. Logistic growth modelling of COVID-19 proliferation in China and its international implications. International Journal of Infectious Diseases. 2020. vol. 96. pp. 582–589. URL: https://doi.org/10.1016/j.ijid.2020.04.085 (accessed 02.09.2021).
  7. Wang P., Zheng X., Li J., Zhu B. Prediction of epidemic trends in COVID-19 with logistic model and machine learning technics. Chaos, Solitons & Fractals. 2020. vol. 139. pp. 110058. URL: https://doi.org/10.1016/j.chaos.2020.110058 (accessed 02.09.2021).
  8. Chen D.-G., Chen X., Chen J.K. Reconstructing and forecasting the COVID-19 epidemic in the United States using a 5-parameter logistic growth model. Global Health Research and Policy. 2020. vol. 5. no. 1. 25 p.
  9. Попков Ю.С., Попков А.Ю., Дубнов Ю.А. Рандомизированное машинное обучение при ограниченных наборах данных: от эмпирической вероятности к энтропийной рандомизации. М.: ЛЕНАНД, 2019.
  10. Больцман Л. О связи между вторым началом механической теории теплоты и теорией вероятностей в теоремахо тепловом равновесии. Больцман Л.Э. Избранные труды. Под ред. Шлак Л.С. М.: Наука, 1984.
  11. Jaynes E.T. Information theory and statistical mechanics. Physical review. 1957. vol. 106. no. 4. pp. 620–630.
  12. Jaynes E.T. Probability theory: the logic of science. Cambridge university press. 2003.
  13. Shannon C.E. Communication theory of secrecy systems. Bell Labs Technical Journal. 1949. vol. 28. no. 4. pp. 656–715.
  14. Verhulst P.-F. Notice sur la loi que la population suit dans son accroissement. Corresp. Math. Phys. 1838. vol. 10. pp. 113–126.
  15. Singer H.M. The COVID-19 pandemic: growth patterns, power law scaling, and saturation. Physical Biology. 2020. vol. 17. no. 5. pp. 055001.
  16. Popkov Yu.S., Dubnov Yu.A., Popkov A.Yu. Randomized machine learning: Statement, solution, applications. Intelligent Systems (IS), 2016 IEEE 8th International Conference on IEEE. 2016. pp. 27–39.
  17. Popkov Y.S., Dubnov Y.A., Popkov A.Y. Introduction to the Theory of Randomized Machine Learning. Learning Systems: From Theory to Practice / ed. by Sgurev V., Piuri V., Jotsov V. Cham: Springer International Publishing, 2018. pp. 199–220.
  18. Popkov Y.S., Dubnov Y.A., Popkov A.Y. New method of randomized forecasting using entropy-robust estimation: Application to the World population prediction. Mathematics. 2016. vol. 4. no. 1. pp. 1–16.
  19. Popkov Y.S., Volkovich Z., Dubnov Y.A., Avros R., Ravve E. Entropy 2-Soft Classification of Objects. Entropy. 2017. vol. 19. no. 4. P. 178.
  20. Dubnov Y.A. Entropy-Based Estimation in Classification Problems. Automation and Remote Control. 2019. vol. 80, pp. 502–512.
  21. Popkov Y.S., Popkov A.Y., Dubnov Y.A., Solomatine D. Entropy-Randomized Forecasting of Stochastic Dynamic Regression Models. Mathematics. 2020. No. 8. pp. 1119.
  22. Popkov A.Y. Randomized machine learning of nonlinear models with application to the prediction of the development of epidemic process. Automation and Remote Control. 2021.
  23. Dong E., Du H., Gardner L. An interactive web-based dashboard to track COVID-19 in real time. The Lancet infectious diseases. 2020. vol. 20. no. 5. pp. 533–534.
  24. COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. URL: https://github.com/CSSEGISandData/COVID-19 (accessed 02.09.2021).
  25. Golan A., Judge G., Miller D. Maximum Entropy Econometrics: Robust Estimation with Limited Data. New York : John Wiley & Sons. 1996.
  26. Golan A. Information and entropy econometrics. A review and synthesis. Foundations and trends in Econometrics. 2008. vol. 2. no. 1-2. pp. 1–145.
  27. Nocedal J., Wright S. Numerical optimization. Springer Science & Business Media. 2006.
  28. Nash S.G. Newton-type minimization via the Lanczos method. SIAM Journal on Numerical Analysis. 1984. vol.21. no. 4. pp. 770–788.

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».