Прогноз госпитальной смертности у пациентов с травматическими повреждениями: сравнение различных SMOTE
Методология медицинских исследований BMC, том 23, номер статьи: 101 (2023 г.) Цитировать эту статью
1026 доступов
1 Цитаты
1 Альтметрика
Подробности о метриках
Травма является одной из наиболее важных проблем общественного здравоохранения во всем мире, приводящей к смерти и инвалидности и затрагивающей все возрастные группы. Поэтому существует большой интерес к моделям прогнозирования смертности у пациентов с травмами, поступивших в отделения интенсивной терапии. Основная цель настоящего исследования — разработать и оценить инструменты машинного обучения на основе SMOTE для прогнозирования госпитальной смертности у пациентов с травмами с несбалансированными данными.
Это ретроспективное когортное исследование было проведено на 126 пациентах с травмами, поступивших в отделение интенсивной терапии больницы Бесат в провинции Хамадан, западный Иран, с марта 2020 года по март 2021 года. Данные были извлечены из медицинских карт пациентов. В соответствии со свойством несбалансированности данных для первичной предварительной обработки использовались методы SMOTE, а именно SMOTE, Borderline-SMOTE1, Borderline-SMOTE2, SMOTE-NC и SVM-SMOTE. Затем для прогнозирования госпитализации пациентов использовались методы дерева решений (DT), случайного леса (RF), наивного Байеса (NB), искусственной нейронной сети (ANN), машины опорных векторов (SVM) и экстремального повышения градиента (XGBoost). смертность от травматических повреждений. Эффективность используемых методов оценивалась по чувствительности, специфичности, положительной прогностической ценности (PPV), отрицательной прогностической ценности (NPV), точности, площади под кривой (AUC), среднему геометрическому значению (G-средние), баллу F1 и P. -значение теста Макнемара.
Из 126 пациентов, поступивших в отделения интенсивной терапии, 117 (92,9%) выжили и 9 (7,1%) умерли. Среднее время наблюдения от даты травмы до даты результата составило 3,98 ± 4,65 дня. Производительность алгоритмов ML не очень хорошая при работе с несбалансированными данными, тогда как производительность алгоритмов ML на основе SMOTE значительно улучшается. Средняя площадь под кривой ROC (AUC) всех моделей на основе SMOTE составила более 91%. Оценка F1 и G-средние до балансировки набора данных были ниже 70% для всех моделей ML, кроме ANN. Напротив, показатель F1 и G-средние для сбалансированных наборов данных достигли более 90% для всех моделей на основе SMOTE. Среди всех методов машинного обучения на основе SMOTE RF и ANN на основе SMOTE и XGBoost на основе SMOTE-NC достигли наивысшего значения по всем критериям оценки.
Это исследование показало, что алгоритмы машинного обучения на основе SMOTE лучше прогнозируют исходы травматических повреждений, чем алгоритмы машинного обучения. У них есть потенциал, чтобы помочь врачам отделения интенсивной терапии в принятии клинических решений.
Отчеты экспертной оценки
Травма является одной из наиболее важных проблем общественного здравоохранения в мире, приводящей к смерти и инвалидности и затрагивающей все возрастные группы [1]. Травматические повреждения являются ведущей причиной смертности в первые четыре десятилетия жизни [2]. Травма является причиной 4,4 миллиона смертей ежегодно и составляет почти 8% всех смертей в мире [1, 3]. В связи с этим важно найти решения, позволяющие снизить последствия травматических повреждений и количество смертей в результате травм. Например, улучшение способности прогнозировать исход пациента с травмой с высокой степенью точности и выявление важных факторов, влияющих на результат пациента, может помочь медицинским командам травматологов в их оперативных усилиях по лечению пациентов с травмами.
Во многих предыдущих исследованиях использовались традиционные методы, такие как модели логистической регрессии и регрессии Пуассона, для выявления факторов, влияющих на травматические повреждения [4,5,6]. В многочисленных исследованиях также использовалась шкала тяжести травм и травм (TRISS) в качестве одной из наиболее распространенных моделей, которая основана на логистической регрессии (LR) и использует небольшую когорту из одного центра для прогнозирования вероятности выживания пациентов с травматическими травмами. травмы [7]. Однако TRISS и его различные модификации являются научно обоснованными инструментами, а результаты некоторых исследований показывают, что они могут вводить врачей в заблуждение, неправильно классифицируя состояние пациента [8]. Тем не менее, обе категории моделей работали плохо, когда присутствовали коллинеарность, гетероскедастичность, взаимодействия более высокого порядка и нелинейные отношения между переменными [9,10,11]. Следовательно, для достижения лучших результатов лечения пациентов и оптимального использования ресурсов необходимы более ценные и точные прогностические инструменты, которые не ограничиваются этими предположениями.