Реферат
1 Введение 5
2 Обзор литературы 8
2.1 Геномы хлоропластов голосеменных 8
2.2 Транспортные РНК хлоропластов 10
2.3 Предпочтение кодонов 13
3 Материалы и методы 15
3.1 Генетический материал и анализ базы 15
3.2 Частотные словари 17
3.3 Метод главных компонент и сопряженные методы кластери-
зации/классификации 19
3.4 Метод упругих карт 20
4 Результаты 23
4.1 Краткий обзор исследованной базы генов 23
4.2 Кластеризация словарей методом упругих карт 23
4.3 Кластеризация по синонимичным антикодонам 26
5 Обсуждение 31
5.1 Краткий обзор полученных результатов 31
5.2 Возможная связь между кластеризацией генов тРНК по ча
стотам триплетов и биохимическими свойствами соответствующих им аминокислот 32
Заключение 35
Список сокращений 36
Приложение А 37
Приложение Б
Исследование связи структуры, нуклеотидных последовательностей, функций, которые в них закодированы, и таксономии носителей этого генетического материала является важной задачей современной молекулярной биологии, биофизики, биоинформатики. Наибольший интерес представляет комплексный подход к изучению связи данных биологических свойств. Настоящая работа посвящена такому анализу на примере генов транспортных РНК хлоропластов. С точки зрения данной работы хлоропласты представляют собой очень удобный объект: все они однородны по своей функции. Это позволяет исключить из анализа различия в функциях используемого геномного материала.
Актуальность настоящей работы обусловлена как задачами анализа большого количества разнообразных геномных данных, результатов секвенирования, для оптимизированного выделения отличительных характеристик организмов, так и новыми возможностями в исследовании связи структуры и функции, открывающимися на больших массивах данных. Геномы хлоропластов могут содержать важную информацию о механизме эволюции голосеменных, поэтому используются в эволюционных и филогенетических исследованиях. Транспортные РНК принимают непосредственное участие в экспрессии генов и могут влиять на аминокислотный профиль организма. Они представляют интерес, поскольку не были изучены статистическими методами с использованием больших массивов данных.
Объектом настоящей работы является связь между структурой и функцией генов транспортных РНК хлоропластов голосеменных.
Целью данной работы является выявление связи между триплетным составом нуклеотидной последовательности генов тРНК хлоропластов голосеменных, их таксономией и функциями этих генов.
Для достижения данной цели были поставлены следующие задачи:
1) Создать из полногеномных последовательностей базу генов тРНК и проанализировать её;
2) Построить частотные словари данных последовательностей и провести кластеризацию словарей различными методами кластеризации и визуализации;
3) Проанализировать распределение словарей по кластерам с точки зрения функционального и таксономического состава.
Работа докладывалась на следующих конференциях:
• 56-я международная научная студенческая конференция (МНСК 2018), Новосибирск, устный доклад;
• X Международная конференция «Dynamical Systems Applied to Biology and Natural Sciences» (DSABNS), Неаполь, стендовый доклад;
• 7th International Work-Conference on Bioinformatics and Biomedical Engineering (IWBBIO), Гранада, устный доклад;
• 28-й Всероссийский семинар «Нейроинформатика, её приложения и анализ данных», 27 сентября 2019, Красноярск, устный доклад;
• XI международная конференция «Dynamical Systems Applied to Biology and Natural Sciences» (DSABNS), Тренто, стендовый доклад;
• 8th International Work-Conference on Bioinformatics and Biomedical Engineering (IWBBIO), Гранада, устный доклад;
• Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный — 2021», Красноярск, устный доклад.
Результаты работы опубликованы в следующих научных журналах и сборниках научных мероприятий:
• Колесникова А.И. Выявление связи тринуклеотидного состава генов и таксономии их носителей на примере генов митохондрий некоторых грибов / Колесникова А.И., Федотовская В.Д., Шпагина Т.О. // Материалы 56-й Международной научной студенческой конференции (МНСК). — 2018. — Vol. 56. — Стр. 18;
...
Результаты, полученные в ходе выполнения работы позволили сформулировать однозначные утверждения о связи между функцией, структурой и таксономией генов тРНК. Цель работы достигнута. Все поставленные задачи выполнены:
1) Создана база генов тРНК из полногеномных последовательностей и проанализирована;
2) Построены частотные словари данных последовательностей и проведена кластеризация словарей различными методами кластеризации и визуализации;
3) Проанализировано распределение словарей по кластерам с точки зрения функционального и таксономического состава.
Анализ результатов показал, что для случая генов тРНК хлоропластов голосеменных наблюдается преобладание функции над таксономией. Гены кластеризуются как по кодируемым аминокислотам, так и по синонимам антикодонов для аминокислот. При этом не выявлено однозначной зависимости кластеризации с группами по свойствам аминокислот и классам аминоацил-тРНК-синтетаз. Результаты нашей работы показывают, что для случая генов тРНК не наблюдается никакой связи между видовым составом и составом кластеров, выявленным по частотам триплетов. Точнее, исключения есть, но они малы: если какие-нибудь из генов, кодирующие синонимичные антикодоны для одной аминокислоты не попадали в соответствующие кластеры, определяемые антикодоном, то, как правило, эти гены принадлежат одному и тому же виду. Таким образом, эволюция поддерживает консервацию таких важных генов как тРНК. В базе последовательностей голосеменных было подтверждено, что tRNAIle кодирует антикодон CAU, который обычно кодируется tRNAMet. Подтверждено, что для генов тРНК хлоропластов голосеменных растений характерно предпочтение кодонов.