ПОРІВНЯЛЬНИЙ АНАЛІЗ АНСАМБЛЕВИХ АЛГОРИТМІВ МАШИННОГО НАВЧАННЯ У ПРОГНОЗУВАННІ НАЯВНОСТІ ЗАХВОРЮВАНЬ СЕРЦЯ
DOI:
https://doi.org/10.20535/2617-8974.2023.12.293469Анотація
Серцево-судинні захворювання (ССЗ) продовжують бути провідною причиною летальних випадків та інвалідизації на глобальному рівні, становлячи загрозу для здоров’я мільйонів осіб. Незважаючи на значні досягнення в області медичних технологій, існують виклики, пов’язані з ранньою діагностикою та точним прогнозуванням ССЗ, що ускладнюється різноманітністю клінічних даних та складністю патологій. Дане дослідження має на меті оцінити ефективність застосування ансамблевих алгоритмів машинного навчання для прогнозування ССЗ, аналізуючи їх точність, надійність та інтегрованість з клінічними даними. Особлива увага приділяється потенціалу цих алгоритмів у вдосконаленні клінічного прогнозування та терапевтичних підходів до лікування ССЗ. Науковий проект фокусується на реалізації алгоритмів машинного навчання, зокрема ансамблевих методів, які застосовуються для створення моделей бінарної класифікації. Використовуються такі методи ансамблевого навчання, як Random Forest, XGBoost та LightGBM. Основна увага зосереджена на оптимальному розподілі даних для забезпечення точної оцінки, з використанням 10% даних для екзамену, 80% для тренування та 20% для тестування. Параметри моделей оптимізуються за допомогою 5-fold перехресної валідації. Модель Random Forest продемонструвала високу точність під час тренування, однак показала меншу точність під час тестування і екзамену, що може свідчити про перенавчання. У контрасті, моделі LightGBM та XGBoost показали більш стабільні результати на всіх етапах, зокрема LightGBM виявилася більш ефективною з точки зору швидкості навчання. Висновки дослідження підтверджують, що ансамблеві алгоритми машинного навчання, особливо LightGBM, є ефективними у прогнозуванні ССЗ. Результати також акцентують увагу на тому, що вік, систолічний кров’яний тиск та індекс маси тіла є ключовими індикаторами для оцінки ризику ССЗ.
Ключові слова: серцево-судинні захворювання, аналіз медичних даних, алгоритми прогнозування, машинне навчання, ансамблеве навчання