Методы машинного обучения для прогнозирования сердечно-сосудистых заболеваний: сравнительный анализ


Цитировать

Полный текст

Аннотация

Цель исследования - точное предсказание наличия сердечно-сосудистых заболеваний с помощью моделей машинного обучения. Оценивалась и сравнивалась эффективность пяти алгоритмов: логистической регрессии, машины опорных векторов, дерева решений, случайного леса и градиентного бустинга на наборе данных, содержащем клинические характеристики пациентов. Определялось, какой из алгоритмов демонстрирует наилучшие прогностические характеристики для диагностики заболеваний сердца. Использован набор данных 270 пациентов с 13 клиническими признаками. Данные были предварительно обработаны, а целевые переменные преобразованы в бинарные значения для классификации. Набор данных был разделен на обучающий и тестовый в соотношении 70-30. Пять моделей машинного обучения были обучены и оценены с помощью таких метрик, как точность, recall, precision, F1-score и ROC-AUC. Для получения дополнительной информации о производительности моделей были проанализированы матрицы ошибок. В результате логистическая регрессия и случайный лес показали наилучшие результаты среди всех моделей с точностью 86,4 и 80,2 %, соответственно. Логистическая регрессия продемонстрировала ROC-AUC на уровне 0,844, а случайный лес - 0,88. С помощью матриц путаницы выявлены прогностические достоинства и недостатки каждой модели. Авторами сделаны следующие выводы: логистическая регрессия и случайный лес были определены как наиболее надежные модели для прогнозирования сердечно-сосудистых заболеваний в этом наборе данных. В дальнейшем планируется изучение методов настройки гиперпараметров и ансамбля для повышения эффективности моделей, что позволит получать ценные сведения для ранней диагностики и лечения сердечно-сосудистых заболеваний.

Об авторах

Айым Болатовна Темирбаева

Астанинский IT-университет

Автор, ответственный за переписку.
Email: aiymtemirbaeva@gmail.com
ORCID iD: 0009-0003-6131-2884

магистрант департамента по прикладной аналитике данных

Казахстан, 010000, г. Астана, пр-т Мангилик Ел, 55/11, Бизнес-центр EXPO, блок C1

Аршын Алтыбай

Астанинский IT-университет

Email: arshyn.altybay@gmail.com
ORCID iD: 0000-0003-4939-8876

доктор философии, старший научный сотрудник департамента дифференциальных уравнений, Институт математики и математического моделирования

Республика Казахстан, 050010, г. Алматы, ул. Шевченко, 125

Список литературы

  1. Mendis S, Graham I, Narula J. Addressing the global burden of cardiovascular diseases; need for scalable and sustainable frameworks. Global Heart. 2022;17(1):46. https://doi.org/10.5334/gh.1139 EDN: ALVXJY
  2. Mukasheva G, Abenova M, Shaltynov A, Tsigen-gage O, Mussabekova Z, Bulegenov T, Shalgumbaeva G, Semenova Yu. Incidence and mortality of cardiovascular disease in the Republic of Kazakhstan: 2004-2017. Iranian Journal of Public Health. 2022;51(4):821-830. https://doi.org/10.18502/ijph.v51i4.9243 EDN: DHJPUR
  3. Abbas S, Ojo S, Hejaili AA, Sampedro GA, Almadhor A, Zaidi M, Kryvinska N. Artificial intelli-gence framework for heart disease classification from audio signals. Scientific Reports. 2024;14(1)3123. https://doi.org/10.1038/s41598-024-53778-7 EDN: UPLLIK
  4. Hossain MI, Maruf MH, Khan MAR, Prity FS, Fatema S, Ejaz MS, Khan M. Heart disease prediction using distinct artificial intelligence techniques: performance analysis and comparison. Iran Journal of Computer Science. 2023;6(4):397-417. https://doi.org/10.1007/s42044-023-00148-7 EDN: IKJGNI
  5. Zhang H, Zhang P, Wang Z, Chao L, Chen Y, Li Q. Multi-Feature decision fusion network for heart sound abnormality detection and classification. IEEE Journal of Biomedical and Health Informatics. 2024;28(3):1386-1397. https://doi.org/10.1109/jbhi.2023.3307870 EDN: SSTBYM
  6. Liu Z, Jiang H, Zhang F, Ouyang W, Li X, Pan X. Heart sound classification based on bispectrum features and Vision Transformer mode. Alexandria Engineering Journal. 2023;85:49-59. https://doi.org/10.1016/j.aej.2023.11.035 EDN: EKYJWK
  7. Mahajan RA, Balkhande B, Wanjale K, Chitre A, Jadhav TA, Hundekari SN. Enhancing Heart Disease Risk Prediction Accuracy through Ensemble Classification Techniques. International Journal of Intelligent Systems and Applications in Engineering. 2023;11(10s):701-713. Available from: https://ijisae.org/index.php/IJISAE/article/view/3325 (accessed: 12.09.2024).
  8. Rakhimov M, Akhmadjonov R, Javliev S. Artificial intelligence in Medicine for Chronic disease classification using Machine learning. 2022 IEEE 16th International Conference on Application of Information and Communication Technologies (AICT). 2022:1-6 https://doi.org/10.1109/aict55583.2022.10013587
  9. Hossain I, Maruf M, Khan MAR, Prity FS, Fatema S, Ejaz MS, Khan M. Heart disease prediction using distinct artificial intelligence techniques: performance analysis and comparison. Iran Journal of Computer Science. 2023;6(4):397-417. https://doi.org/10.1007/s42044-023-00148-7 EDN: IKJGNI
  10. Erdem K, Yildiz MB, Yasin ET, Koklu M.A detailed analysis of detecting heart diseases using artificial intelligence methods. Intelligent Methods in Engineering Sciences. 2023;2(4):115-124 https://doi.org/10.58190/imiens.2023.71 EDN: DYZTFY
  11. Salman HA, Kalakech A, Steiti A. Random Forest algorithm Overview. Babylonian journal of machine learning. 2024;2024:69-79. https://doi.org/10.58496/bjml/2024/007 EDN: HWNARA
  12. Wang Q. Support Vector machine algorithm in machine learning. 2022 IEEE International Conference on Artificial Intelligence and Computer Applications (ICAICA). 2022:750-756. https://doi.org/10.1109/icaica54878.2022.9844516
  13. Berrendero JR, Bueno-Larraz B, Cuevas A. On functional logistic regression: some conceptual issues. Test. 2022;32(1):321-349. https://doi.org/10.1007/s11749-022-00836-9 EDN: XCAHRR
  14. Bentéjac C, Csörgő A, Martínez-Muñoz G. A com-parative analysis of gradient boosting algorithms. Artificial Intelligence Review. 2020;54(3):1937-1967. https://doi.org/10.1007/s10462-020-09896-5
  15. Levy JJ, O’Malley AJ. Don’t dismiss logistic re-gression: the case for sensible extraction of interactions in the era of machine learning. BMC Medical Research Methodology. 2020;20(1):171. https://doi.org/10.1186/s12874-020-01046-3
  16. Liew BXW, Kovacs FM, Rugamer D, Royuela A. Machine learning versus logistic regression for prognostic modelling in individuals with non-specific neck pain. European Spine Journal. 2022;31(8):2082-2091. https://doi.org/10.1007/s00586-022-07188-w EDN: YWKGZQ
  17. Becker T, Rousseau A, Geubbelmans M, Burzykowski T, Valkenborg D. Decision trees and random forests. American Journal of Orthodontics and Dentofacial Ortho-pedics. 2023;164(6):894-897. https://doi.org/10.1016/j.ajodo.2023.09.011 EDN: QKTJHR
  18. Mahajan RA, Balkhande B, Kirti Wanjale K, Chitre A, Jadhav TA, Hundekar SN. Enhancing Heart Disease Risk Prediction Accuracy through Ensemble Classification Techniques. International Journal of Intelligent Systems and Applications in Engineering. 2023;11(10s):701-713. Available from: https://ijisae.org/index.php/IJISAE/article/view/3325/1911 (accessed: 12.09.2024).

Дополнительные файлы

Доп. файлы
Действие
1. JATS XML

Согласие на обработку персональных данных

 

Используя сайт https://journals.rcsi.science, я (далее – «Пользователь» или «Субъект персональных данных») даю согласие на обработку персональных данных на этом сайте (текст Согласия) и на обработку персональных данных с помощью сервиса «Яндекс.Метрика» (текст Согласия).