Разделяемые временные сверточные сети, основанные на методе глубокого обучения для обнаружения противовирусных лекарств.
Том 13 научных отчетов, номер статьи: 13722 (2023) Цитировать эту статью
2985 Доступов
5 Альтметрика
Подробности о метриках
Тревожное количество смертей, вызванных пандемией COVID-19, заставило научное сообщество ускорить процесс открытия терапевтических лекарств. В этом отношении сотрудничество ученых-биомедиков и экспертов в области искусственного интеллекта (ИИ) привело к разработке ряда инструментов in silico для первоначального скрининга терапевтических молекул. Все живые организмы вырабатывают противовирусные пептиды (AVP) как часть первой линии защиты от вторжения вирусов. Модель Deep-AVPiden, предложенная в этой статье, и соответствующее ей веб-приложение, развернутое по адресу https://deep-avpiden.anvil.app, представляют собой попытку обнаружить новые AVP в протеомах живых организмов. Помимо Deep-AVPiden, также была разработана эффективная в вычислительном отношении модель Deep-AVPiden (DS) с использованием той же базовой сети, но с поточечно разделяемыми свертками. Модели Deep-AVPiden и Deep-AVPiden (DS) показывают точность 90% и 88% соответственно, и обе имеют точность 90%. Также предложенные модели были статистически сопоставлены с использованием t-критерия Стьюдента. При сравнении предложенных моделей с современными классификаторами выяснилось, что они значительно лучше их. Чтобы проверить предложенную модель, мы идентифицировали некоторые AVP в естественных защитных белках растений, млекопитающих и рыб и обнаружили, что они имеют заметное сходство последовательностей с некоторыми экспериментально подтвержденными антимикробными пептидами. Эти AVP можно синтезировать химическим путем и проверить на их противовирусную активность.
Открытие новых противомикробных препаратов, которые убивают или ингибируют опасные для жизни патогены, привлекает большое внимание из-за неэффективности и неэффективности обычных антибиотиков. Однако уместно то, что новый класс терапевтических средств должен обладать высокой эффективностью, широким спектром активности и практически не иметь побочных эффектов на здоровье человека. В этом направлении могут быть разработаны лекарства с использованием антимикробных пептидов (АМП), которые составляют неотъемлемую часть естественной первой линии защиты живых организмов. В настоящее время анализ и моделирование AMP с использованием машинного/глубокого обучения набрали обороты1,2,3,4,5,6,7. Методы моделирования последовательностей на основе глубокого обучения, такие как рекуррентные нейронные сети (RNN), сети долговременной памяти (LSTM), временные сверточные сети (TCN)8,9 и т. д., могут эффективно использоваться для разработки надежных моделей для классификации и обнаружить новые терапевтические пептиды, такие как AMP, противораковые пептиды10,11 и т. д., в протеомах различных форм жизни. Обратите внимание, что моделирование последовательностей — это метод, который вводит и выводит последовательные данные, которые могут быть в форме текста, аудио, видео и т. д. Для этой цели RNN была разработана как архитектура глубокого обучения для фиксации зависимостей между элементами заданного объекта. последовательность действий для прогнозирования. Однако он не может уловить долгосрочные зависимости между этими единицами из-за проблемы исчезновения градиента. LSTM были предложены как усовершенствование по сравнению с RNN, поскольку они решают эту проблему за счет использования механизма стробирования (входные, выходные и забывающие ворота) для запоминания корреляции между единицами на большом расстоянии. Однако LSTM требуют больше памяти, чем RNN, для хранения частичных результатов. Кроме того, модели на основе RNN и LSTM работают последовательно, поэтому единицы заданной последовательности (также известные как временные шаги) не могут обрабатываться параллельно. Однако подобных недостатков у ТКС нет. Вычисления, выполняемые этой архитектурой глубокого обучения, можно легко распределять и распараллеливать в многоядерных системах обработки, а также они не потребляют много памяти.
Было построено несколько моделей для классификации противовирусных пептидов (AVP) с использованием этих алгоритмов глубокого обучения. Обратите внимание, что AVP представляют собой подкласс AMP, которые нацелены на хозяина против вторгающихся вирусов, воздействуя на них или на клетки-хозяева для ингибирования репликации вируса. Некоторые AVP обладают вирулицидным действием, поскольку они либо ингибируют вирусный белок вне клетки-хозяина, либо конкурируют за сайт связи на мембране клетки-хозяина12. Напротив, некоторые другие вмешиваются в различные этапы жизненного цикла вируса, такие как экспрессия вирусных генов, репликация и т. д. Интересно, что многочисленные AVP присутствуют в протеомах млекопитающих, растений, рыб и других живых организмов. Семейство AVP, называемых циклотидами, обнаруженное в растениях, предотвращает связывание широкого спектра человеческих вирусов, таких как вирус иммунодефицита человека (ВИЧ)13, H1N114 и денге15, с клеточной мембраной хозяина. Цекропин-А, полученный из моли, действует против ВИЧ, подавляя его генетическую экспрессию. Аналогичным образом, семейство антимикробных пептидов (АМП), известных как дермасептины, обнаруженное у лягушек рода Phyllomedusa, продемонстрировало вирулицидный потенциал против ВИЧ-116. Говоря об AVP, полученных из морских организмов, класс пептидов, известных как клаванины, ингибирует вирулентность вируса простого герпеса (ВПГ), ротавируса и аденовируса17.