Машина со вторым ядром для интеллектуального анализа клинических данных для принятия медицинских решений.
Том 13 научных отчетов, номер статьи: 10459 (2023) Цитировать эту статью
432 доступа
6 Альтметрика
Подробности о метриках
Принятие медицинских решений с помощью машинного обучения ставит перед собой три основные задачи: достижение экономичности модели, обеспечение достоверных прогнозов и предоставление рекомендаций в реальном времени с высокой вычислительной эффективностью. В этой статье мы формулируем принятие медицинских решений как задачу классификации и разрабатываем машину с моментным ядром (MKM) для решения этих проблем. Основная идея нашего подхода состоит в том, чтобы рассматривать клинические данные каждого пациента как распределение вероятностей и использовать моментные представления этих распределений для построения MKM, который преобразует многомерные клинические данные в низкоразмерные представления, сохраняя при этом важную информацию. Затем мы применяем эту машину к различным наборам предоперационных клинических данных для прогнозирования результатов хирургических операций и принятия медицинских решений, что требует значительно меньше вычислительной мощности и времени для классификации, обеспечивая при этом более высокую производительность по сравнению с существующими методами. Более того, мы используем синтетические наборы данных, чтобы продемонстрировать, что разработанная система интеллектуального анализа данных на основе моментов устойчива к шуму и отсутствующим данным, а также обеспечивает экономию моделей, предоставляя эффективный способ генерировать удовлетворительные прогнозы, помогающие принимать персонализированные медицинские решения.
Хирургическое вмешательство как серьезное медицинское вмешательство обычно рассматривается, когда другие методы лечения приводят к неудовлетворительным результатам. Прогнозирование нежелательных явлений после операции на основе дооперационных клинических данных пациентов, таких как данные электронных медицинских карт (ЭМК), имеет решающее значение для информирования как врачей, так и пациентов для принятия решений1,2. В последние годы возросшая доступность клинических данных и вычислительной мощности значительно стимулировали развитие методов машинного обучения (МО) для извлечения информации из клинических данных. В частности, алгоритмы МО добились значительных успехов в медицинских процедурах с использованием искусственного интеллекта для предоперационного прогнозирования послеоперационных результатов с помощью EHR3,4. Общая проблема ML фокусируется на поиске подходящей функции f, отображающей каждую точку входных данных \({\textbf{X}}\) на желаемый выход \({\textbf{y}}\), т.е.
Эта задача особенно сложна для наборов данных, содержащих клинические записи большого размера и смешанных типов данных, включая диагнозы, методы лечения, показатели жизнедеятельности и лабораторные показатели5.
За последнее десятилетие было предложено множество методов с использованием машинного обучения, помогающих принимать медицинские решения посредством прогнозирования послеоперационных событий. Например, в хирургии по снижению веса заметный вклад включает применение логистической регрессии (LR) и регрессии Пуассона (PR) для оценки уровня повторной госпитализации6, использование нейронных сетей (NN) и машин повышения градиента (GBM) для прогнозирования желудочно-кишечная утечка и венозная тромбоэмболия7,8, а также разработка алгоритма суперобучающегося для прогнозирования риска 30-дневной повторной госпитализации после бариатрической операции9,10. Помимо оценки возможных послеоперационных событий, методы МО широко применяются для выявления аномалий на медицинских изображениях, таких как предраковые или предраковые поражения11,12,13,14. Основные примеры варьируются от подхода глубокого обучения для прогнозирования смертности пациентов с ишемической болезнью сердца и сердечной недостаточностью15 до количественных методов извлечения признаков изображения для прогноза ранней реваскуляризации у пациентов с подозрением на ишемическую болезнь сердца16. С алгоритмической точки зрения глубокие нейронные сети привлекательны для медицинских исследователей и практиков из-за их способности обнаруживать скрытые структуры в больших наборах данных, что приводит к высокой вероятности достижения удовлетворительных результатов в подходящих условиях17. Среди этих работ интеграция ML-методов в медицинские исследования, хотя и успешная во многих отношениях, обычно страдает от низкой вычислительной эффективности из-за неоднородной структуры, например, из-за разреженности и нерегулярности, а также большого размера клинических данных18. В целом сложность алгоритмов машинного обучения растет экспоненциально с увеличением времени и использования памяти в зависимости от размера данных. Более того, для повышения производительности глубокие нейронные сети в дополнение к вычислительной эффективности жертвуют надежностью из-за шума и экономией моделей19.