Прогнозирование уровня летальности при COVID-19: оценка эффективности некоторых гибридных моделей

Обложка

Цитировать

Полный текст

Аннотация

История вопроса. Основная цель этой статьи заключается в углублении понимания роли важнейшего эпидемиологического показателя — коэффициента летальности при заражении на фоне продолжающейся пандемии COVID-19. Важность понимания этого показателя состоит в том, что он позволяет ежедневно оценивать выраженность вирусного инфицирования и ее воздействие. Материалы и методы. Для достижения этой всеобъемлющей цели мы применяем комплексный подход, используя различные гибридные модели, объединяющие машинное обучение и статистические методы. Углубленное понимание значимости указанного параметра достигается с использованием передовых алгоритмов машинного обучения, включая машину опорных векторов и случайные деревья решений. Эти методы позволяют обнаруживать сложные закономерности и взаимосвязи в данных, способствуя более детальному анализу уровня смертности от инфекций. Применение моделей машинного обучения в эпидемиологических исследованиях приобрело известность благодаря их способности адаптироваться к сложным и развивающимся закономерностям, присущим динамике инфекционных заболеваний. Дополняя доступный арсенал машинного обучения, мы совмещаем традиционные статистические модели, такие как ARIMA (авторегрессионное интегрированное скользящее среднее), дробное ARIMA и BATS (байесовский структурный временной ряд). Эти модели обеспечивают проверенную временем и строгую статистическую основу для проводимого анализа, позволяя выявить временные зависимости и тенденции коэффициента летальности при заражении. Синергия машинного обучения и статистических моделей дает нашему исследованию целостную перспективу, обеспечивая надежное и всестороннее исследование эпидемиологической ситуации. Результаты. Для оценки эффективности этих моделей мы используем ключевые показатели оценки, включая среднеквадратическую ошибку (RMSE), среднеквадратическую ошибку (MSE) и среднюю абсолютную ошибку (MAE). Эти показатели служат важнейшими ориентирами, позволяя нам количественно оценить точность и надежность наших моделей при прогнозировании ежедневного коэффициент летальности при заражении. Тщательная оценка эффективности модели имеет решающее значение для обеспечения достоверности наших выводов. Согласно этим измерениям, гибридные модели показали хорошие результаты, особенно модель ARIMA-RF RMSE: 0.29, MSE: 0.084, MAE: 0.215 для горизонта 60 и для горизонта 120 ARIMA-RF по-прежнему демонстрировали лучшую производительность, RMSE: 0.268, MSE: 0.071, MAE: 0.183 позволили получить такие результаты благодаря способности этого подхода обрабатывать сложные шаблоны в отличие от моделей ARIMA, BATS, RF и SVM. Заключение. В данной работе применялся подход для построения модели по прогнозированию уровня коэффициента летальности при заражении, нацеленный на предоставление детального понимания факторов, влияющих на тяжесть вирусного инфицирования. В конечном итоге это будет способствовать продолжающемуся обсуждению эффективных мер общественного здравоохранения и стратегий нивелирования последствий.

Об авторах

Д. Себа

Высшая школа информатики; Университет Беджаи

Автор, ответственный за переписку.
Email: d.seba@esi-sba.dz

д.мат.н., доцент, лаборатория прикладной математики, факультет математики

Алжир, г. Сиди-Бель-Аббес; г. Беджая

К. Белаиде

Высшая школа информатики; Университет Беджаи

Email: d.seba@esi-sba.dz

д.мат.н., профессор, лаборатория прикладной математики, факультет математики

Алжир, г. Сиди-Бель-Аббес; г. Беджая

Список литературы

  1. Acosta-González E., Andrada-Félix J., Fernández-Rodríguez F. On the evolution of the COVID-19 epidemiological parameters using only the series of deceased. A study of the Spanish outbreak using Genetic Algorithms. Math. Comput. Simul., 2022, vol. 197, pp. 91–104. doi: 10.1016/j.matcom.2022.02.007
  2. Ahmar A.S., Boj E. Application of neural network time series (Nnar) andarima to forecast infection fatality rate (ifr) of COVID-19 in Brazil. International Journal on Informatics Visualization, 2021, vol. 5, no. 1, pp. 8–10. doi: 10.30630/joiv.5.1.372
  3. Alazab M., Awajan A., Mesleh A., Abraham A., Jatana V., Alhyari S. COVID-19 prediction and detection using deep learning. International Journal of Computer Information Systems and Industrial Management Applications, 2020, no. 12, pp. 168–181.
  4. Alzahrani S.I., Aljamaan I.A., Al-Fakih E.A. Forecasting the spread of the COVID-19 pandemic in Saudi Arabia using ARIMA prediction model under current public health interventions. J. Infect. Public Health, 2020, vol. 13, no. 7, pp. 914–919. doi: 10.1016/j.jiph.2020.06.001
  5. ArunKumar K.E., Kalaga D.V., Kumar C.M.S., Kawaji M., Brenza T.M. Comparative analysis of Gated Recurrent Units (GRU), long Short-Term memory (LSTM) cells, autoregressive Integrated moving average (ARIMA), seasonal autoregressive Integrated moving average (SARIMA) for forecasting COVID-19 trends. Alexandria Engineering Journal, 2022, vol. 61, no. 10, pp. 7585–7603. doi: 10.1016/j.aej.2022.01.011
  6. Beran J. Statistics for long- memory processes. CRC press, 1994. Vol. 61. doi: 10.1201/9780203738481
  7. Box G.E., Jenkins G.M., Reinsel G.C., Ljung G.M. Time series analysis: forecasting and control; 5th ed. John Wiley and Sons, 2015. doi: 10.1002/9781118619193
  8. Dehesh T., Mardani-Fard H.A., Dehesh P. Forecasting of COVID-19 confirmed cases in different countries with ARIMA models. MedRxiv, 2020.03.13.20035345. doi: 10.1101/2020.03.13.20035345
  9. Chen J.M. Novel statistics predict the COVID-19 pandemic could terminate in 2022. J. Med. Virol., 2022, vol. 94, no. 6, pp. 2845–2848. doi: 10.1002/jmv.27661
  10. Deif M.A., Solyman A.A., Hammam R.E. ARIMA model estimation based on genetic algorithm for COVID-19 mortality rates. International Journal of Information Technology and Decision Making, 2021, vol. 20, no. 6,pp. 1775–1798. doi: 10.1142/S0219622021500528
  11. De Livera A.M., Hyndman R.J., Snyder R.D. Forecasting time series with complex seasonal patterns using exponential smoothing. Journal of the American statistical association, 2011, vol. 106, no. 496, pp. 1513–1527. doi: 10.1198/jasa.2011.tm09771
  12. Kapoor A., Ben X., Liu L., Perozzi B., Barnes M., Blais M., O’Banion S. Examining COVID-19 forecasting using spatio-temporal graph neural networks. arXiv, 2020: 2007.03113 [Preprint]. doi: doi: 10.48550/arXiv.2007.03113
  13. Lukman A.F., Rauf R.I., Abiodun O., Oludoun O., Ayinde K., Ogundokun R.O. COVID-19 prevalence estimation: Four most affected African countries. Infect. Dis. Model., 2020, vol. 5, pp. 827–838. doi: 10.1016/j.idm.2020.10.002
  14. Namasudra S., Dhamodharavadhani S., Rathipriya R. Nonlinear Neural Network Based Forecasting Model for Predicting COVID-19 Cases. Neural. Process. Lett., 2023, vol. 55, no. 1, pp. 171–191. doi: 10.1007/s11063-021-10495-w
  15. Rath S., Tripathy A., Tripathy A.R. Prediction of new active cases of coronavirus disease (COVID-19) pandemic using multiple linear regression model. Diabetes Metab. Syndr., 2020, vol. 14, no. 5, pp. 1467–1474. doi: 10.1016/j.dsx.2020.07.045
  16. Roy S., Bhunia G.S., Shit P.K. Spatial prediction of COVID-19 epidemic using ARIMA techniques in India. Model. Earth Syst. Environ., 2021, vol. 7, no. 2, pp. 1385–1391. doi: 10.1007/s40808-020-00890-y
  17. Salgotra R., Gandomi M., Gandomi A.H. Time Series Analysis and Forecast of the COVID-19 Pandemic in India using Genetic Programming. Chaos Solitons Fractals, 2020, no. 138: 109945. doi: 10.1016/j.chaos.2020.109945
  18. Singh A., Bajpai M.K. SEIHCRD Model for COVID-19 spread scenarios, disease predictions and estimates the basic reproduction number, case fatality rate, hospital, and ICU beds requirement. ComputerModeling in Engineering & Sciences, 2020, vol. 125, no. 3, pp. 991–1031. doi: 10.32604/cmes.2020.012503
  19. Tamang S.K., Singh P.D., Datta B. Forecasting of COVID-19 cases basedon prediction using artificial neural network curve fitting technique. Global Journal of Environmental Science and Management, 2020, vol. 6, special iss. (COVID-19), pp. 53–64. doi: 10.22034/GJESM.2019.06.SI.06
  20. Tipping M. The relevance vector machine. Advances in Neural Information Processing Systems 12. 1999, pp. 652–658.
  21. Vapnik V. The Nature of Statistical Learning Theory. Springer, New York, 1995.
  22. Vattay G. Forecasting the outcome and estimating the epidemic model parameters from the fatality time series in COVID-19 outbreaks. Phys. Biol., 2020, vol. 17, no. 6: 065002. doi: 10.1088/1478-3975/abac69
  23. Yousaf M., Zahir S., Riaz M., Hussain S.M., Shah K. Statistical analysis of forecasting COVID-19 for upcoming month in Pakistan. Chaos Solitons Fractals, 2020, no. 138: 109926. doi: 10.1016/j.chaos.2020.109926
  24. Zeroual A., Harrou F., Dairi A., Sun Y. Deep learning methods for forecasting COVID-19 time-Series data: A Comparative study. Chaos Solitons Fractals, 2020, no. 140: 110121. doi: 10.1016/j.chaos.2020.110121

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML
2. Рисунок 1. Ежедневная ИФР COVID-19 с 3 января 2020 г. по 16 марта 2023 г.

Скачать (32KB)
3. Рисунок 2. ACF и PACF для ежедневного IFR

Скачать (95KB)
4. Рисунок 3. Ежедневное прогнозирование IFR с горизонтом h = 60

Скачать (141KB)
5. Рисунок 4. Ежедневное прогнозирование IFR с горизонтом h = 120

Скачать (258KB)

© Себа Д., Белаиде К., 2024

Creative Commons License
Эта статья доступна по лицензии Creative Commons Attribution 4.0 International License.

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».