Пептиды, содержащие аминокислотные полиморфизмы (мутации), называются вариантыми. Задача детекции вариантых пептидов актульна тем, что данные полиморфизмы вызывают нарушения в работе белка, что может привести к развитию различных заболеваний.
В экспериментах в протеомике на основе жидкой хроматографии в тандеме с масс-спектрометрией (liquid chromatography-tandem mass spectrometry, LC-MS/MS) пептиды предварительно разделяются при помощи жидкой хроматографии и потом передаются масс-спектрометру. Время, за которое хроматограф подаёт пептид спектрометру называется временем удерживания (retention time, RT). Так как время удерживания основывается на физических и химических свойствах пептида при определённом виде жидкой хроматографии, оно предсказуемо в теории [1].
Целью данной работы является рассмотрение возможности применения времени удерживания как признака пептида для детекции вариантных пептидов.
В данной работе было исследовано устройство самых передовых моделей для предсказывания времени удерживания пептидов, проведены эксперименты для данных моделей как на широкоизвестных, так и на экспериментальных данных и построены соответствующие графики рассеивания с вычисленными коэффициентами корелляции Пирсона. Модель DeepRT+ проявила себя лучше всего, и, в теории, успешные предсказания должны помочь повысить качество идентификации вариантных пептидов в комбинации с уже известными методами. В дальнейшей работе планируется поближе изучить последовательности, в которых данные модели ошибаются и предложить методы по их улучшению, а так же выявить, какие признаки могут помочь успешно "почистить"датасет для лучшего качества предсказаний помимо EValue.