Тема: Метод Монте-Карло по схеме марковской цепи для оценки вероятности редких событий в задачах биоинформатики
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава
1. Постановка задачи
Модель фрагментации пептидных соединений
Вероятностная модель спектра пептида
Метод Монте-Карло и метод существенной выборки
Метод Метрополиса-Гастингса
2.3. Описание алгоритма построения pis
10
Глава 3. Особенности реализации построения pis
3.1. Оценка весовой функции по методу Ванга-Ландау
3.2. Выбор переходной плотности у
Глава 4.
Оценка дисперсии и критерий остановки
14
4.1. Способы вычисления дисперсии
14
4.2. Варианты критерия остановки
15
4.3. Теоретические аспекты в рамках исследуемой задачи
16
4.3.1. Дискретный случай
17
4.3.2. Сведения из теории марковских цепей
18
4.3.3. Непрерывный случай
20
Глава 5. Численные результаты
21
5.1. Одиночные идентификации
21
5.2. База данных GNPS
24
Заключение
26
Список литературы
27
📖 Введение
и более остатков аминокислот, соединенных в цепь пептидными связями. Существуют
живые организмы, способные продуцировать природные пептидные соединения, оказывающие сильное подавляющее действие на рост и размножение бактерий – натуральные антибиотики. В связи с проблемой резистентности существующих антибиотиков
к грамм-положительным бактериям и недавними успехами, связанными с открытием
теиксобактина – антибиотика, активного в отношении данных бактерий, задача идентификации природных пептидных соединений вновь становится задачей высокой важности в сфере протеомики. Она заключается в следующем: для исследуемого образца в
базе необходимо найти наиболее близкое по структуре к нему пептидное соединение. В
связи с тем, что схожесть структур во многих случаях влечет за собой схожесть свойств
соединений, решение данной задачи помогает в исследовании новых образцов.
Самым распространенным инструментом для идентификации пептидных соединений является масс-спектрометрия: исследуемый образец режется на части при помощи
химических реакций, после чего измеряется масса каждого полученного фрагмента,
и в дальнейшем исследуется полученный массив масс, который называют спектром
[1]. Тогда задача идентификации пептидного соединения сводится к тому, чтобы найти
наиболее похожий спектр теоретического пептида из базы на полученный по образцу
экспериментальный спектр и оценить эту похожесть.
Для случая пептидных соединений линейной структуры, существует метод MSGF+ [2], решающий задачу, используя комбинаторные методы. Однако в случае природных пептидных соединений, зачастую имеющих сложную нелинейную структуру,
метод MS-GF+ не может быть применен, и задача решается только вероятностными
подходами.
✅ Заключение
(1.3) для пары («Экспериментальный спектр», «Теоретический пептид»). Был продемонстрирован способ оценки ее дисперсии и предложен критерий остановки моделирования траектории марковской цепи, чтобы ее длины было достаточно для построения
оценки заданной точности.
Корректность работы полученного алгоритма была показана на наборе пептидов
различной структуры и проведено сравнение с существующим методом MS-DPR. Согласно результатам, полученный метод имеет меньший FDR для низких порогов значимости, что доказывает применимость метода в задачах биоинформатики.



