Machine Learning Methods for Predicting Cardiovascular Diseases: A Comparative Analysis


如何引用文章

全文:

详细

The study aims to accurately predict the presence of heart disease using machine learning models. The research evaluates and compares the performance of five algorithms - Logistic Regression, Support Vector Machine (SVM), Decision Tree, Random Forest, and Gradient Boosting - on a dataset containing clinical features of patients. The primary research question is to identify which algorithm demonstrates the best predictive performance for heart disease diagnosis. The study used a dataset of 270 patients with 13 clinical features. The data was preprocessed, and target variables were converted into binary values for classification. The dataset was split into training and test sets in a 70-30 ratio. Five machine learning models were trained and evaluated using metrics such as accuracy, precision, recall, F1-score, and ROC-AUC. Confusion matrices were analyzed to gain additional insights into model performance. Logistic Regression and Random Forest showed the best results among all models, with an accuracy of 86.4 and 80.2%, respectively. The Logistic Regression showed a ROC-AUC score of 0.844, while the Random Forest showed a score of 0.88. The confusion matrices revealed the strengths and weaknesses of each model in terms of forecasting. Logistic Regression and Random Forest were identified as the most reliable models for predicting heart disease in this dataset. Future work will explore hyperparameter tuning and ensemble methods to further enhance model performance, providing valuable insights for early diagnosis and treatment of cardiovascular diseases.

作者简介

Aiym Temirbayeva

Astana IT University

编辑信件的主要联系方式.
Email: aiymtemirbaeva@gmail.com
ORCID iD: 0009-0003-6131-2884

MS student in Applied Data Analytics

55/11 Mangilik El avenue, Business center EXPO, block C1, Astana, 010000, Kazakhstan

Arshyn Altybay

Astana IT University

Email: arshyn.altybay@gmail.com
ORCID iD: 0000-0003-4939-8876

PhD of Philosophy, Senior Researcher of the Department of Differential Equations

28 Shevchenko St, 050010, Almaty, Republic of Kazakhstan

参考

  1. Mendis S, Graham I, Narula J. Addressing the global burden of cardiovascular diseases; need for scalable and sustainable frameworks. Global Heart. 2022;17(1):46. https://doi.org/10.5334/gh.1139 EDN: ALVXJY
  2. Mukasheva G, Abenova M, Shaltynov A, Tsigen-gage O, Mussabekova Z, Bulegenov T, Shalgumbaeva G, Semenova Yu. Incidence and mortality of cardiovascular disease in the Republic of Kazakhstan: 2004-2017. Iranian Journal of Public Health. 2022;51(4):821-830. https://doi.org/10.18502/ijph.v51i4.9243 EDN: DHJPUR
  3. Abbas S, Ojo S, Hejaili AA, Sampedro GA, Almadhor A, Zaidi M, Kryvinska N. Artificial intelli-gence framework for heart disease classification from audio signals. Scientific Reports. 2024;14(1)3123. https://doi.org/10.1038/s41598-024-53778-7 EDN: UPLLIK
  4. Hossain MI, Maruf MH, Khan MAR, Prity FS, Fatema S, Ejaz MS, Khan M. Heart disease prediction using distinct artificial intelligence techniques: performance analysis and comparison. Iran Journal of Computer Science. 2023;6(4):397-417. https://doi.org/10.1007/s42044-023-00148-7 EDN: IKJGNI
  5. Zhang H, Zhang P, Wang Z, Chao L, Chen Y, Li Q. Multi-Feature decision fusion network for heart sound abnormality detection and classification. IEEE Journal of Biomedical and Health Informatics. 2024;28(3):1386-1397. https://doi.org/10.1109/jbhi.2023.3307870 EDN: SSTBYM
  6. Liu Z, Jiang H, Zhang F, Ouyang W, Li X, Pan X. Heart sound classification based on bispectrum features and Vision Transformer mode. Alexandria Engineering Journal. 2023;85:49-59. https://doi.org/10.1016/j.aej.2023.11.035 EDN: EKYJWK
  7. Mahajan RA, Balkhande B, Wanjale K, Chitre A, Jadhav TA, Hundekari SN. Enhancing Heart Disease Risk Prediction Accuracy through Ensemble Classification Techniques. International Journal of Intelligent Systems and Applications in Engineering. 2023;11(10s):701-713. Available from: https://ijisae.org/index.php/IJISAE/article/view/3325 (accessed: 12.09.2024).
  8. Rakhimov M, Akhmadjonov R, Javliev S. Artificial intelligence in Medicine for Chronic disease classification using Machine learning. 2022 IEEE 16th International Conference on Application of Information and Communication Technologies (AICT). 2022:1-6 https://doi.org/10.1109/aict55583.2022.10013587
  9. Hossain I, Maruf M, Khan MAR, Prity FS, Fatema S, Ejaz MS, Khan M. Heart disease prediction using distinct artificial intelligence techniques: performance analysis and comparison. Iran Journal of Computer Science. 2023;6(4):397-417. https://doi.org/10.1007/s42044-023-00148-7 EDN: IKJGNI
  10. Erdem K, Yildiz MB, Yasin ET, Koklu M.A detailed analysis of detecting heart diseases using artificial intelligence methods. Intelligent Methods in Engineering Sciences. 2023;2(4):115-124 https://doi.org/10.58190/imiens.2023.71 EDN: DYZTFY
  11. Salman HA, Kalakech A, Steiti A. Random Forest algorithm Overview. Babylonian journal of machine learning. 2024;2024:69-79. https://doi.org/10.58496/bjml/2024/007 EDN: HWNARA
  12. Wang Q. Support Vector machine algorithm in machine learning. 2022 IEEE International Conference on Artificial Intelligence and Computer Applications (ICAICA). 2022:750-756. https://doi.org/10.1109/icaica54878.2022.9844516
  13. Berrendero JR, Bueno-Larraz B, Cuevas A. On functional logistic regression: some conceptual issues. Test. 2022;32(1):321-349. https://doi.org/10.1007/s11749-022-00836-9 EDN: XCAHRR
  14. Bentéjac C, Csörgő A, Martínez-Muñoz G. A com-parative analysis of gradient boosting algorithms. Artificial Intelligence Review. 2020;54(3):1937-1967. https://doi.org/10.1007/s10462-020-09896-5
  15. Levy JJ, O’Malley AJ. Don’t dismiss logistic re-gression: the case for sensible extraction of interactions in the era of machine learning. BMC Medical Research Methodology. 2020;20(1):171. https://doi.org/10.1186/s12874-020-01046-3
  16. Liew BXW, Kovacs FM, Rugamer D, Royuela A. Machine learning versus logistic regression for prognostic modelling in individuals with non-specific neck pain. European Spine Journal. 2022;31(8):2082-2091. https://doi.org/10.1007/s00586-022-07188-w EDN: YWKGZQ
  17. Becker T, Rousseau A, Geubbelmans M, Burzykowski T, Valkenborg D. Decision trees and random forests. American Journal of Orthodontics and Dentofacial Ortho-pedics. 2023;164(6):894-897. https://doi.org/10.1016/j.ajodo.2023.09.011 EDN: QKTJHR
  18. Mahajan RA, Balkhande B, Kirti Wanjale K, Chitre A, Jadhav TA, Hundekar SN. Enhancing Heart Disease Risk Prediction Accuracy through Ensemble Classification Techniques. International Journal of Intelligent Systems and Applications in Engineering. 2023;11(10s):701-713. Available from: https://ijisae.org/index.php/IJISAE/article/view/3325/1911 (accessed: 12.09.2024).

补充文件

附件文件
动作
1. JATS XML

Согласие на обработку персональных данных с помощью сервиса «Яндекс.Метрика»

1. Я (далее – «Пользователь» или «Субъект персональных данных»), осуществляя использование сайта https://journals.rcsi.science/ (далее – «Сайт»), подтверждая свою полную дееспособность даю согласие на обработку персональных данных с использованием средств автоматизации Оператору - федеральному государственному бюджетному учреждению «Российский центр научной информации» (РЦНИ), далее – «Оператор», расположенному по адресу: 119991, г. Москва, Ленинский просп., д.32А, со следующими условиями.

2. Категории обрабатываемых данных: файлы «cookies» (куки-файлы). Файлы «cookie» – это небольшой текстовый файл, который веб-сервер может хранить в браузере Пользователя. Данные файлы веб-сервер загружает на устройство Пользователя при посещении им Сайта. При каждом следующем посещении Пользователем Сайта «cookie» файлы отправляются на Сайт Оператора. Данные файлы позволяют Сайту распознавать устройство Пользователя. Содержимое такого файла может как относиться, так и не относиться к персональным данным, в зависимости от того, содержит ли такой файл персональные данные или содержит обезличенные технические данные.

3. Цель обработки персональных данных: анализ пользовательской активности с помощью сервиса «Яндекс.Метрика».

4. Категории субъектов персональных данных: все Пользователи Сайта, которые дали согласие на обработку файлов «cookie».

5. Способы обработки: сбор, запись, систематизация, накопление, хранение, уточнение (обновление, изменение), извлечение, использование, передача (доступ, предоставление), блокирование, удаление, уничтожение персональных данных.

6. Срок обработки и хранения: до получения от Субъекта персональных данных требования о прекращении обработки/отзыва согласия.

7. Способ отзыва: заявление об отзыве в письменном виде путём его направления на адрес электронной почты Оператора: info@rcsi.science или путем письменного обращения по юридическому адресу: 119991, г. Москва, Ленинский просп., д.32А

8. Субъект персональных данных вправе запретить своему оборудованию прием этих данных или ограничить прием этих данных. При отказе от получения таких данных или при ограничении приема данных некоторые функции Сайта могут работать некорректно. Субъект персональных данных обязуется сам настроить свое оборудование таким способом, чтобы оно обеспечивало адекватный его желаниям режим работы и уровень защиты данных файлов «cookie», Оператор не предоставляет технологических и правовых консультаций на темы подобного характера.

9. Порядок уничтожения персональных данных при достижении цели их обработки или при наступлении иных законных оснований определяется Оператором в соответствии с законодательством Российской Федерации.

10. Я согласен/согласна квалифицировать в качестве своей простой электронной подписи под настоящим Согласием и под Политикой обработки персональных данных выполнение мною следующего действия на сайте: https://journals.rcsi.science/ нажатие мною на интерфейсе с текстом: «Сайт использует сервис «Яндекс.Метрика» (который использует файлы «cookie») на элемент с текстом «Принять и продолжить».