Определение характеристик поздней диагностики ВИЧ с использованием оптимизированного алгоритма машинного обучения
- Авторы: Фархадян М.1, Мослехи С.1, Мирзаи М.2
-
Учреждения:
- Университет медицинских наук Хамадана
- Центр по контролю и профилактике заболеваний
- Выпуск: Том 15, № 5 (2025)
- Страницы: 906-914
- Раздел: ОРИГИНАЛЬНЫЕ СТАТЬИ
- URL: https://journals.rcsi.science/2220-7619/article/view/380210
- DOI: https://doi.org/10.15789/2220-7619-ITC-17896
- ID: 380210
Цитировать
Полный текст
Аннотация
Введение. Раннее выявление ВИЧ-инфекции имеет важное значение для клинической диагностики, предотвращения трансмиссии и обеспечения безопасности продуктов крови. Лица с поздним диагностированием ВИЧ могут неосознанно передавать вирус, и после постановки диагноза у них могут возникнуть более неблагоприятные последствия для здоровья. Поэтому настоящее исследование направлено на выявление характеристик, связанных с поздней диагностикой ВИЧ-пациентов. Материалы и методы. В настоящем ретроспективном когортном исследовании была собрана информация о 236 пациентах с ВИЧ-инфекцией в Хамадане (запад Ирана) путем оценки количества CD4 Т клеток периферической крови в период с 2011 по 2022 гг. Поздняя диагностика ВИЧ считалась при уровне CD4 Т клеток ≤ 350/мм3. Первоначально алгоритмы Extreme Gradient Boosting (XGBoost) и Random Forest (RF) выявили основные переменные. Впоследствии были разработаны такие модели, как Logistic Model Tree (LMT), Classification and Regression Tree (CART), Deep Neural Network (DNN) и Support Vector Machine (SVM) с использованием 70/30 разделения набора данных для обучения/тестирования для клинических и демографических переменных. Наконец, оптимальная модель была выбрана на основе точности и F1-оценки с использованием программного обеспечения Python (версия 3.10). Результаты. Показано, что возраст, логарифм вирусной нагрузки (LVL), содержание лейкоцитов (WBC), эритроцитов (RBC), лимфоцитов (Lym), гематокрит (Hct), уровень тромбоцитов (PLT), гемоглобина (Hb) и параметры клинической стадии имели относительную важность выше уровня в 6%. Среди разработанных моделей для переменных важности CART со значениями F1-оценки и точности 0.887 и 0.801 и 0.897 и 0.822 для обучающих данных соответственно. Значение AUC, полученное для CART, было равно 0.918. Выводы. Поздняя диагностика ВИЧ-инфекции является существенной проблемой, особенно при разработке алгоритма, который может точно и интерпретируемо определять характеристики заболевания, такие как CART, что может быть важно для выявления характеристик, влияющих на позднюю диагностику ВИЧ и клинические и терапевтические решения.
Ключевые слова
Об авторах
М. Фархадян
Университет медицинских наук Хамадана
Email: maryam_farhadian80@yahoo.com
ORCID iD: 0000-0002-6054-9850
PhD, доцент кафедры биостатистики Школы общественного здравоохранения
Иран, г. ХамаданСамад Мослехи
Университет медицинских наук Хамадана
Автор, ответственный за переписку.
Email: samadmoslehi999@gmail.com
ORCID iD: 0000-0003-1597-7327
PhD, доцент кафедры биостатистики, кафедра биостатистики, Школа общественного здравоохранения, Исследовательский центр моделирования неинфекционных заболеваний
Иран, г. ХамаданМ. Мирзаи
Центр по контролю и профилактике заболеваний
Email: mirzaei3589@gmail.com
ORCID iD: 0000-0001-9428-059X
магистр наук, эксперт по контролю заболеваний
Иран, г. ХамаданСписок литературы
- Adler A., Mounier-Jack S., Coker R. Late diagnosis of HIV in Europe: definitional and public health challenges. AIDS Care, 2009, vol. 21, no. 3, pp. 284–293. doi: 10.1080/09540120802183537
- Bath R.E., Emmett L., Verlander N.Q., Reacher M. Risk factors for late HIV diagnosis in the East of England: evidence from national surveillance data and policy implications. Int. J. STD AIDS, 2019, vol. 30, no. 1, pp. 37–44. doi: 10.1177/0956462418793327
- Bendera A., Baryomuntebe D.M., Kevin N.U., Nanyingi M., Kinengyere P.B., Mujeeb S., Sulle E.J. Determinants of late HIV diagnosis and advanced HIV disease among people living with HIV in Tanzania. HIV AIDS-Res. Palliat. Care, 2024, vol. 26, no. 16, pp. 313–323. doi: 10.2147/HIV.S473291
- Bisaso K.R., Anguzu G.T., Karungi S.A., Kiragga A., Castelnuovo B. A survey of machine learning applications in HIV clinical research and care. Comput. Biol. Med., 2017, vol. 91, pp. 366–371. doi: 10.1016/j.compbiomed.2017.11.001
- Buetikofer S. Prevalence and risk factors of late presentation for HIV diagnosis and care in a tertiary referral center in Switzerland. Swiss Med. Wkly., 2014, vol. 144, pp. 1–8. doi: 10.4414/smw.2014.13913
- Camoni L., Raimondo M., Regine V., Salfa M.C., Suligoi B. Late presenters among persons with a new HIV diagnosis in Italy, 2010–2011. BMC Public Health, 2013, vol. 13, no. 1, pp. 1–6. doi: 10.1186/1471-2458-13-281
- Croxford S., Stengaard A.R., Brännström J., Combs L., Dedes N., Girardi E., Grabar S., Kirk O., Kuchukhidze G., Lazarus J.V., Noori T. Late diagnosis of HIV: an updated consensus definition. HIV Med., 2022, vol. 23, no. 11, pp. 1202–1208. doi: 10.1111/hiv.13425
- Gallo R.C. A reflection on HIV/AIDS research after 25 years. Retrovirology, 2006, vol. 3, no. 1, pp. 1–7. doi: 10.1186/1742-4690-3-72
- Gelaw Y.A., Senbete G.H., Adane A.A., Alene K.A. Determinants of late presentation to HIV/AIDS care in Southern Tigray Zone, Northern Ethiopia: an institution-based case-control study. AIDS Res. Ther., 2015, vol. 12, no. 1, pp. 1–8. doi: 10.1186/s12981-015-0074-4
- Gesesew H.A., Ward P., Woldemichael K., Mwanri L. Late presentation for HIV care in Southwest Ethiopia in 2003–2015: prevalence, trend, outcomes and risk factors. BMC Infect. Dis., 2018, vol. 18, pp. 1–11. doi: 10.1186/s12879-018-2987-7
- Holzinger A. Data mining with decision trees: theory and applications. Online Inf. Rev., 2015, vol. 39, no. 3, pp. 437–448
- Landwehr N., Hall M., Frank E. Logistic model trees. Mach. Learn., 2005, vol. 59, pp. 161–205. doi: 10.1007/s10994-005-0466-3
- Lee C.-Y., Lin Y.-P., Wang S.-F., Lu P.-L. Late CART initiation consistently driven by late HIV presentation: A multicenter retrospective cohort study in Taiwan from 2009 to 2019. Infect. Dis. Ther., 2022, vol. 11, no. 3, pp. 1033–1056. doi: 10.1007/s40121-022-00604-y
- Likatavicius G., Van de Laar M. HIV and AIDS in the European Union, 2011. Euro Surveill., 2012, vol. 17, no. 48, pp. 1–17.
- Madakkatel I., Zhou A., McDonnell M.D., Hyppönen E. Combining machine learning and conventional statistical approaches for risk factor discovery in a large cohort study. Sci. Rep., 2021, vol. 11, no. 1, pp. 22997:1-13. doi: 10.1038/s41598-021-02362-3
- Mi J.X., Li A.D., Zhou L.F. Review study of interpretation methods for future interpretable machine learning. IEEE Access, 2020, vol. 8, pp. 191969–191985. doi: 10.1109/ACCESS.2020.3032494.
- Mohammadi Y., Mirzaei M., Shirmohammadi-Khorram N., Farhadian M. Identifying risk factors for late HIV diagnosis and survival analysis of people living with HIV/AIDS in Iran (1987–2016). BMC Infect. Dis., 2021, vol. 21, no. 1, pp. 1–9. doi: 10.1186/s12879-021-06034-5
- Morales-Sánchez R., Montalvo S., Riaño A., Martínez R., Velasco M. Early diagnosis of HIV cases by means of text mining and machine learning models on clinical notes. Comput. Biol. Med., 2024, vol. 179, pp. 108830:1-9. doi: 10.1016/j.compbiomed.2024.108830
- Moslehi S., Rabiei N., Soltanian A.R., Mamani M. Application of machine learning models based on decision trees in classifying the factors affecting mortality of COVID-19 patients in Hamadan, Iran. BMC Med. Inform. Decis. Mak., 2022, vol. 22, no. 1, pp. 192:1-10. doi: 10.1186/s12911-022-01945-5
- Najafi-Vosough R., Faradmal J., Hosseini S.K., Moghimbeigi A., Mahjub H. Predicting hospital readmission in heart failure patients in Iran: a comparison of various machine learning methods. Healthc. Inform. Res., 2021, vol. 27, no. 4, pp. 307–314. doi: 10.4258/hir.2021.27.4.307
- Najafi-Vosough R., Faradmal J., Tapak L., Alafchi B., Najafi-Ghobadi K., Mohammadi T. Prediction the survival of patients with breast cancer using random survival forests for competing risks. J. Prev. Med. Hyg., 2022, vol. 63, no. 2, pp. 298–303. doi: 10.15167/2421-4248/jpmh2022.63.2.2089
- Nyika H., Mugurungi O., Shambira G., Gombe N.T., Bangure D., Mungati M., Tshimanga M. Factors associated with late presentation for HIV/AIDS care in Harare City, Zimbabwe, 2015. BMC Public Health., 2016, vol. 16, no. 369, pp. 1–7. doi: 10.1186/s12889-016-3070-8
- Osman A.I.A., Ahmed A.N., Chow M.F., Huang Y.F., El-Shafie A. Extreme gradient boosting (Xgboost) model to predict the groundwater levels in Selangor Malaysia. Ain Shams Eng. J., 2021, vol. 12, no. 2, pp. 1545–1556. doi: 10.1016/j.asej.2020.11.011
- Reyad M., Sarhan A.M., Arafa M. A modified Adam algorithm for deep neural network optimization. Neural Comput. Appl., 2023, vol. 35, no. 23, pp. 17095–17112. doi: 10.1007/s00521-023-08568-z
- Romero-Rodríguez D.P., Ramírez C., Imaz-Rosshandler I., Ormsby C.E., Peralta-Prado A., Olvera-García G., Cervantes F., Würsch-Molina D., Romero-Rodríguez J., Jiang W., Reyes-Terán G. Machine learning-selected variables associated with CD4 T cell recovery under antiretroviral therapy in very advanced HIV infection. Transl. Med. Commun., 2020, vol. 5, pp. 1–10. doi: 10.1186/s41231-020-00058-x
- Rotily M., Bentz L., Pradier C., Obadia Y., Cavailler P. Factors related to delayed diagnosis of HIV infection in southeastern France. Int. J. STD AIDS, 2000, vol. 11, no. 8, pp. 531–535. doi: 10.1258/0956462001916193
- Roustaei N. Application and interpretation of linear-regression analysis. Med. Hypothesis Discov. Innov. Ophthalmol., 2024, vol. 13, no. 3, pp. 151–159. doi: 10.51329/mehdiopt2024.309546
- Valkenborg D., Rousseau A.J., Geubbelmans M., Burzykowski T. Support vector machines. Am. J. Orthod. Dentofacial Orthop., 2023, vol. 164, no. 5, pp. 754–757. doi: 10.1016/j.ajodo.2023.06.011
- Wang D., Larder B., Revell A., Montaner J., Harrigan R., De Wolf F., Lange J., Wegner S., Ruiz L., Pérez-Elías M.J., Emery S. A comparison of three computational modelling methods for the prediction of virological response to combination HIV therapy. Artif. Intell. Med., 2009, vol. 47, no. 1, pp. 63–74. doi: 10.1016/j.artmed.2009.06.001
- Weissman S., Yang X., Zhang J., Chen S., Olatosi B., Li X. Using a machine learning approach to explore predictors of health care visits as missed opportunities for HIV diagnosis. AIDS, 2021, vol. 35, no. 1, pp. S7-S18. doi: 10.1097/QAD.0000000000002724
- World Health Statistics 2023: monitoring health for the SDGs, sustainable development goals. World Health Organization, 2023.
- Xiang Y., Du J., Fujimoto K., Li F., Schneider J., Tao C. Application of artificial intelligence and machine learning for HIV prevention interventions. Lancet HIV., 2022, vol. 9, no. 1, pp. 54–62. doi: 10.1016/S2352-3018(21)00289-7
- Zhao J., Gao M., Zhao D., Tian W. Prevalence of late HIV diagnosis and its impact on mortality: a comprehensive systematic review and meta-analysis. HIV Med., 2025, vol. 26, no. 4. doi: 10.1111/hiv.13530
Дополнительные файлы

