Реферат 2
Введение 4
1 Обзор литературы 7
1.1 Митохондрии 7
1.2 Геномы митохондрий 8
1.3 Окислительное фосфорилирование 9
1.4 Методы выделения структурированности данных 10
1.5 Выбор генетического материала и анализируемых структур 12
2 Материалы и методы 14
2.1 Генетический материал 14
2.2 Частотные словари 14
2.3 Метод динамических ядер 16
2.4 Метод упругих карт 18
3 Результаты 21
3.1 Кластеризация методом динамических ядер 21
3.2 Кластеризация методом K-means 22
3.3 Кластеризация словарей методом упругих карт 28
3.4 Таксономический состав кластеров 33
4 Обсуждение 34
4.1 Волатильные точки 34
4.2 Влияние типа частотного словаря на кластеризацию генов . 35
4.3 Словарь W(3,3) CDS 37
4.4 Выбор генов 37
4.5 Выбор геномов 38
5 Заключение 39
Список сокращений 40
Список использованных источников 41
Изучение любого генетического материала (генома митохондрий в нашем случае) требует его анализа с трёх сторон: анализ его структуры, его функции и таксономии его носителя. Каждую из этих сторон можно изучать индивидуально, однако большой интерес представляет их сочетанный анализ. Именно такому анализу посвящена настоящая работа.
Актуальность работы связана с появлением большого количества данных, а также с быстро развивающимися технологиями секвенирования генетического материала, что дает возможность быстро и эффективно изучить отличительные характеристики организмов. Тем не менее, геномы митохондрий грибов изучены хуже, чем геномы митохондрий растений. Митохондриальная ДНК может быть полезна в изучении эволюции грибов, а также в проведении популяционного анализа и построении филогении. Кроме того, некоторые грибы являются патогенами, вызывающими различные болезни лесных сообществ. Они могут нанести значительный, а иногда и непоправимый вред древесным растениям. Изучение патогенных организмов возможно с нескольких сторон, в том числе и с точки зрения генетики.
Объектом настоящей работы является связь между структурой, функцией и таксономией носителя определённых генов митохондрий грибов.
Предметом настоящей работы являются:
• последовательности генов митохондрий грибов 223 видов пяти таксономических отделов: Ascomycetes (185 видов), Basidiomycetes (24 вида), Blastocladiomycota (2 вида), Chytridiomycota (6 видов) и Zygomycota (6 видов);
• структура этих генов, определяемая их триплетным составом;
• связь между выделяемыми неоднородностями в этом распределении, таксономией и функцией.
Целью данной работы является выявление связи между триплетным составом нуклеотидной последовательности, ее функцией и таксономией ее носителей на примере генов митохондрий грибов. Для выявления такой связи были выбраны следующие гены: atp6, atp8 и atp9. Для достижения данной цели были поставлены следующие задачи:
1) Создание базы нуклеотидных последовательностей;
2) Построение частотных словарей последовательностей;
3) Кластеризация словарей методом упругих карт;
4) Кластеризация словарей методом динамических ядер (2 K V 5);
5) Анализ распределения словарей по кластерам с точки зрения функционального и таксономического состава.
Работа докладывалась на следующих конференциях:
• 56-я Международная научная студенческая конференция, Новосибирск, устный доклад;
• X международная конференция «Dynamical Systems Applied to Biology and Natural Sciences» (DSABNS), Неаполь, стендовый доклад;
• Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный — 2019», Красноярск, устный доклад;
• 7th International Work-Conference on Bioinformatics and Biomedical Engineering (IWBBIO), Гранада, устный доклад;
• XI международная конференция «Dynamical Systems Applied to Biology and Natural Sciences» (DSABNS), Тренто, стендовый доклад;
• Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный — 2020», Красноярск, устный доклад.
Результаты работы опубликованы в следующих научных журналах и сборниках научных мероприятий:
• Колесникова А.И. Выявление связи тринуклеотидного состава генов и таксономии их носителей на примере генов митохондрий некоторых грибов / Колесникова А.И., Федотовская В.Д., Шпагина Т.О. // Материалы 56-й Международной научной студенческой конференции (МНСК). — 2018. — Vol. 56. — Стр. 18;
• Колесникова А.И. Влияние функциональных различий сильнее влияния таксономических различий для генов семейства atp митохондрий грибов / Колесникова А.И., Федотовская В.Д., Шпагина Т.О., Садовский М.Г. // Моделирование неравновесных систем. / Материалы XXI Всероссийского семинара — 2018. — Vol. 21. — Стр. 49-54;
...
В ходе выполнения данной работы были выполнены все задачи, а поставленная цель достигнута:
1. Были построены частотные словари в четырех вариантах (на последовательностях CDS и Gene, с шагом t = 1 и t = 3 для каждой);
2. С помощью программы ViDaExpert были визуализированы данные, а также проведена кластеризация методом упругих карт, которая показала, что данные четко разбиваются на три кластера;
3. Была проведена кластеризация с помощью метода динамических ядер, посчитана устойчивость такой кластеризации и построены графы перехода точек между слоями при увеличении числа классов K.
4. Был проведен анализ состава каждого из классов: с точки зрения функции и таксономии и выявлены соответствующие характеристики распределений.
Анализ результатов данной работы показал, что в кластерах находятся словари, принадлежащие одному и тому же гену. Таким образом было доказано преобладание функции, кодируемой исследованными последовательностями, над таксономией их носителей. Нельзя сказать, что этот вывод является универсальным, то есть при проведении анализа последовательностей по частотному составу триплетов преобладание функции над таксономией может не выполняться на другом генетическом материале, например, на геномах хлоропластов или на геномах животных. Для того, чтобы утверждать об универсальности такого эффекта, необходимо провести дополнительные исследования.
[1] Основы молекулярной биологии клетки / Б Альберте, Д Брей, К Хопкин et al. — М.: Бином, 2015.
[2] High variability of mitochondrial gene order among fungi / G. Aguileta, D. M. De Vienne, O. N. Ross et al. // Genome biology and evolution. — 2014. — Vol. 6, no. 2. — Pp. 451-465.
[3] Smith, D. R. The past, present and future of mitochondrial genomics: have we sequenced enough mtDNAs? / D. R. Smith // Briefings in functional genomics. — 2016. — Vol. 15, no. 1. — Pp. 47-54.
[4] Deza, M. M. Encyclopedia of distances / M. M. Deza, E. Deza // Encyclopedia of distances. — Springer, 2009. — Pp. 1-583.
[5] Genome structure of organelles strongly relates to taxonomy of bearers / M. Sadovsky, Yu. Putintseva, A. Chernyshova, V. Fedotova // International Conference on Bioinformatics and Biomedical Engineering / Springer. — 2015. — Pp. 481-490.
[6] Sadovsky, M. G. System Biology on Mitochondrion Genomes / M. G. Sadovsky, N. A. Zaitseva, Yu. A. Putintseva // The Third International Conference on Bioinformatics, Biocomputational Systems and Biotechnologies. — 2011. — Pp. 61-66.
[7] Gorban, A. N. Classification of symbol sequences over their frequency dictionaries: towards the connection between structure and natural taxonomy / A. N. Gorban, T. G. Popova, M. G. Sadovsky // Open Systems & Information Dynamics. — 2000. — Vol. 7, no. 1. — Pp. 1-17.
[8] Information content of the frequency dictionaries, reconstruction, transformation and classification of dictionaries and genetic texts / A. N. Gorban, T. G. Popova, M. G. Sadovsky, D. C. Wunsch // Intelligent Engineering Systems Through Artificial Neural Networks. — American Society of Mechanical Engineers (ASME), 2001. — Pp. 657-663.
[9] Бадмаев, Б. Б. Сравнение таксономической структуры кормовых растений двух видов наземных беличьих Западного Забайкалья и степной флоры региона / Б. Б. Бадмаев // Вестник Красноярского государственного аграрного университета. — 2009. — no. 9.
[10] Горбань, А. Н. Классификация нуклеотидных последовательностей по частотным словарям обнаруживает связь между их структурой и таксономическим положением организмов / А. Н. Горбань, Т. Г. Попова, М. Г. Садовский // Журнал общей биологии. — 2003. — Vol. 64, no. 1. — Pp. 65-77.
[11] Садовский, М.Г. Выявление связи структуры и таксономии геномов хлоропластов методом динамических ядер / М.Г. Садовский, А.И. Чернышова // Фундаментальные исследования. — 2014. — Vol. 3, no. 11.
[12] Сенашова, М.Ю. Семикластерная структура геномов хлоропластов
отражает филогению их носителей / М.Ю. Сенашова, М.Г. Садовский / / Международный журнал прикладных и фундаментальных исследований. — 2016. — Vol. 12, no. 7. —
Pp. 1167-1173.
[13] Сенашова, М.Ю. Пространственная структура геномов цианобактерий / М.Ю. Сенашова, М.Г. Садовский // Международный журнал прикладных и фундаментальных исследований. — 2017. — Vol. 11, no. 2. — Pp. 255-259.
[14] Gorban, A. N. Principal manifolds and graphs in practice: From
molecular biology to dynamical systems / A. N. Gorban, A. Yu. Zinovyev // International Journal of Neural Systems. — 2010.
— Vol. 20, no. 03. — Pp. 219-232. — PMID: 20556849. https://www.worldscientific.com/doi/abs/10.1142/S0129065710002383.
[15] Gorban, A. N. Principal Manifolds for Data Visualisation and Dimension Reduction / A. N. Gorban, A. Yu. Zinovyev // Lecture Notes in Computational Science and Engineering / Ed. by A N Gorban, B Kegl, D Wiinsch, A Yu Zinovyev. — Berlin - Heidelberg - New York: Springer, 2007. — Vol. 58. — Pp. 153-176.
... всего 30 источников