Введение 4
Основная часть 6
1. Обзор литературы 6
1.1. Митохондриии 6
1.2. Ядерный и митохондриальный геномы 6
1.3. Сравнительная характеристика филогении и таксономии 7
1.4. Методы анализа многомерных данных 9
1.5. Приёмы выделения структурированности данных 10
2. Материалы и методы 13
2.1. Генетический материал 13
2.2. Частотные словари 13
2.3. Индексированная база данных 14
2.4. Метод динамических ядер 15
2.5. ViDaExpert 19
2.6. Кластеризация митохондриальных геномов методом динамических
ядер 20
2.7. Анализ кластеризации 21
3. Результаты 25
3.1. Индексирование базы 25
3.2. Кластеризация и устойчивость кластеризации 26
3.3. Распределение таксонов в слоистом графе 27
3.4. Упругая карта типа Chordata 30
4. Обсуждения 33
5. Выводы 38
Список использованных источников 39
Последние достижения в области современной биологии привели к быстрому росту числа расшифрованных геномов, что, в свою очередь, ставит ряд вопросов перед исследователями в связи с анализом обширной генетической информации. Этот извлечение знаний из генетических систем и упорядочивание больших массивов данных.
Актуальность работы обусловлена как появлением большого числа вновь расшифрованных геномов, которые позволяют ставить задачи популяционного и эволюционного анализа, так и необходимостью развития новых методов анализа данных, использующих информацию, содержащуюся во всём геноме в целом, а не в отдельных его частях.
Объектом работы является связь структуры генома органеллы и таксономии его носителя. Предметом исследования являются нуклеотидные последовательности митохондриальных геномов разных видов животных и те виды связей, которые выявляются на множестве геномов и между геномами и таксономией их носителя.
Цель настоящей работы — выявление, описание и анализ связи структуры генома органеллы и таксономии его носителей на примере геномов митохондрий.
Для достижения указанной цели были решены следующие задачи:
- создание базы геномов и их частотных словарей;
- создание репрезентативной выборки с равномерным распределением видов в родах для кластеризации;
- кластеризация митохондриальных геномов методом динамических ядер (k-means) от 2 до 8 классов;
- построение упругой карты таксономического типа Chordataи изучение её особенностей;
- построение слоистого графа кластеризации и изучение его свойств.
По материалам бакалаврской работы опубликована 1 статья, основные результаты работы докладывались на следующих конференциях:
- седьмая международная школа молодых учёных «Системная биология и биоинформатика» SBB'2015;
- международная конференция студентов, аспирантов и молодых учёных «Проспект Свободный — 2015»;
- третья международная конференция IWBBIO 2015.
Показана синхрония в эволюции двух физически независимых изолированных систем (нуклеарный и митохондриальный геномы). При работе с полными митохондриальными геномами она проявляется в неслучайном распределении таксономических категорий внутри каждого слоя, а также в неслучайном перемещении их из слоя в слой.
Показана устойчивость деления. При делении методом ^-средних большая часть геномов базы устойчива (больше 2000). Кластеризация на три класса и далее показала, что некоторые группы геномов переходят вместе из слоя в слой, что говорит нам об их особенной устойчивости. Также из слоя в слой наблюдается таксономическая закономерность: геномы в большем количестве принадлежат к одной или же смежным таксономическим группам.