Тип работы:
Предмет:
Язык работы:


СБОРКА, АННОТИРОВАНИЕ И АНАЛИЗ СТАТИСТИЧЕСКИХ И КОМБИНАТОРНЫХ СВОЙСТВ ХЛОРОПЛАСТНОГО ГЕНОМА ЛИСТВЕННИЦЫ СИБИРСКОЙ

Работа №24746

Тип работы

Бакалаврская работа

Предмет

биология

Объем работы50
Год сдачи2016
Стоимость5600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
387
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1 Обзор литературы 7
1.1 Актуальность исследования геномов хвойных 7
1.2 Сборка генома 8
1.2.1 Особенности данных Illumina и оценка качества 8
1.2.2 Методы ассемблирования 10
1.2.3 Выравнивание ридов на геном 14
1.3 Аннотация генома 17
1.3.1 Проверка качества и маскировка повторов 17
1.3.2 Предсказание кодирующих областей и функциональная аннотация. .19
1.4 Однонуклеотидные полиморфизмы 21
1.5 Кластеризация 22
1.5.1 Метод динамических ядер (k-means) 24
1.5.2 Упругие карты 26
1.5.3 Частотные словари 28
2 Материалы и методы 29
2.1 Сборка хлоропластного генома лиственницы сибирской 29
2.2 Поиск кодирующих участков и аннотирование 30
2.3 Поиск однонуклеотидных полиморфизмов 31
2.4 Построение частотных словарей 32
2.5 Классификация методом динамических ядер 33
2.6 Абсолютная и относительная фаза фрагмента в геноме 33
2.7 Построение упругой карты 34
3 Результаты 36
3.1 Сборка, аннотирование и поиск SNP 36
3.2 Кластеризация методом k-means 37
3.3 Кластеризация методом упругих карт 38
4 Обсуждение результатов 42
ПРИЛОЖЕНИЕ 44
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ

Широкое распространение технологий секвенирования нового поколения в последние десятилетия, позволившее сравнительно быстро и с гораздо меньшими затратами проводить геномные исследования, дало толчок развитию разнообразных методов биоинформатики для целей обработки получаемых данных. Подобные ДНК-технологии находят своё применение, в частности, в области изучения особенностей процессов, происходящих в популяциях, для решения задач селекции, сохранения биоразнообразия.
Хвойные растения составляют огромную часть лесного массива Сибири и Дальнего востока. Для геномов растений характерно наличие строго определенной системы наследования - передача митохондриальной ДНК по материнской линии, а хлоропластной - по отцовской [1]. Работа с митохондриальными геномами хвойных сопряжена с определенными трудностями - он сравнительно велик и обладает высоким уровнем структурных перестроек. Поэтому именно последовательности хлоропластной ДНК разных видов хвойных являются на сегодня важным источником генетических маркеров в популяционных и филогенетических исследованиях.
К настоящему моменту из более чем 100 депонированных в базе данных NCBI геномов хлоропластов семейства Pinaceaeбольшинство относятся к роду Pinus,и лишь два вида - к роду Larix.По состоянию на 20 апреля 2015 года в базе данных Genbank опубликовано 117 хлоропластных геномов представителей семейства Сосновые. Для представителей рода Larix опубликованы две последовательности хлоропластных геномов для видов L.decidua Mill. и L.occidentalis Nutt. Полная последовательность хлоропластного генома L. sibiricaв базе данных отсутствует, имеется лишь 11 последовательностей некоторых генов и их частей.
Цель настоящей работы — сборка и аннотирование хлоропластного генома лиственницы сибирской (Larix sibirica Ledeb., 1833), поиск однонуклеотидных полиморфизмов (SNPs), а также исследование геномной последовательности с помощью математических методов анализа многомерных данных.
В связи с этим были поставлены следующие задачи:
• Сборка хлоропластного генома L. Sibirica;
• Поиск кодирующих участков и их аннотирование;
• Поиск однонуклеотидных полиморфизмов среди генетического материала трех деревьев, произрастающих в разных регионах России.
• Анализ частотного словаря хлоропластного генома Larix sibiricaв программе VidaExpert.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


1. Семериков В. Л., Семерикова С. А., Дымшакова О. С., Зацепина К. Г., Тараканов В. В., Тихонова И. В., Экарт А. К., Видякин А. И., Жамьянсурен С., Роговцев Р. В., Кальченко Л. И.. Полиморфизм микросателлитных локусов хлоропластной ДНК сосны обыкновенной (Pinus sylvestris L.) в Азии и восточной Европе // Генетика, 2014. Т. 50. No 6. C. 660¬669.
2. Elaine R. Mardis. Next-Generation Sequencing Platforms. Annu. Rev. Anal. Chem. 2013. 6:287-303
3. Ewing B, Hillier L, Wendl MC, Green P (1998). "Base-calling of automated sequencer traces using phred. I. Accuracy assessment". Genome Res. 8 (3): 175-185.
4. Michael A Quail. A tale of three next generation sequencing platforms: comparison of Ion Torrent, Pacific Biosciences and Illumina MiSeq sequencers. BMC Genomics 2012, 13:341
5. Zhenyu Li et al. (2012). «Comparison of the two major classes of assembly algorithms: overlap-layout-consensus and de-bruijn-graph». Briefings in Functional Genomics 11 (1): 25-37.
6. Miller JR, Koren S, Sutton G. (2010). «Assembly algorithms for next-generation sequencing data». Genomics 95 (6): 315-327.
7. Pavel A. Pevzner, Haixu Tang, Michael S. Waterman (2001). «An Eulerian path approach to DNA fragment assembly». PNAS 98 (17): 9748-9753.
8. Ye, L. et al. A vertebrate case study of the quality of assemblies derived from next-generation sequences. Genome Biol. 12, R31 (2011).
9. Lander, E. S. et al. Initial sequencing and analysis of the human genome. Nature 409, 860-921 (2001).
10. RepeatMasker 3.0 [Электронный ресурс]: Smit, A. F., Hubley, R. Green, P. - Режим доступа: http://www.repeatmasker.org/webrepeatmaskerhelp.html
11. Altschul, S. F., Gish, W., Miller, W., Myers, E. W. &Lipman, D. J. Basic local alignment search tool. J. Mol. Biol. 215, 403-410 (1990).
12. Korf, I., Yandell, M. &Bedell, J. BLAST: an Essential Guide to the Basic Local Alignment Search Tool 339 (O'Reilly &Associates, 2003).
13. Burge, C., Karlin, S. Prediction of complete gene structures in human genomic DNA. J. Mol. Biol. 268, 78-94 (1997).
14. Borodovsky M. and Ekisheva S. Problems and Solutions in Biological Sequence Analysis. Cambridge University Press, 2006
15. Barreiro LB; Laval G; Quach H; Patin E; Quintana-Murci L. (2008). "Natural selection has driven population differentiation in modern humans".Nature Genetics 40 (3): 340-345.
16. Nachman, Michael W. (2001). "Single nucleotide polymorphisms and recombination rate in humans". Trends in genetics 17 (9): 481-485
17. M.A. Varela & W. Amos (2010). "Heterogeneous distribution of SNPs in the human genome: Microsatellites as predictors of nucleotide diversity and divergence". Genomics 95 (3): 151-159.
18. Факторный, дискриминантный и кластерный анализ: Пер. с англ. / Дж.-О. Ким [и др.]; под ред. И. С. Енюкова. — Москва : Финансы и статистика, 1989.— 215 с.
19. Жамбю М. Иерархический кластер-анализ и соответствия / М. Жамбю. - М.: Финансы и статистика, 1988. -342 с.
20. Gorban, A. and Zinovyev, A.: Elastic Principal Graphs and Manifolds and their Practical Applications / A. Gorban, A. Zinovyev // Computing - 2005 - №75 - C. 359-379.
21. Gorban, A.N., Zinovyev, A.Yu., and Wunsch, D.C. / Application of the method of elastic maps in analysis of genetic texts. // In: Proceedings of International Joint Conference on Neural Networks (IJCNN Portland, Oregon, July 20-24) (2003)
22. Sadovsky M.G. Information Capacity of Nucleotide Sequences and Its Applications / M.G. Sadovsky // Bulletin of Mathematicla Biology - 2006
23. Садовский М.Г. О фундаментальной связи геномов митохондрий с геномами организмов-носителей / М.Г. Садовский // Биологические науки - 2014 - № 9 - 781-783.
24. C.S.Wu et al. (2011) Comparative chloroplast genomes of pinaceae: insights into the mechanism of diversified genomic organizations, Genome Biol Evol, 3: 309-319.
25. M.Parks et al. (2009) Increasing phylogenetic resolution at low taxonomic levels using massively parallel sequencing of chloroplast genomes, BMC Biol., 7: 84.
26. Белякова Г. А. Водоросли и грибы // Ботаника: в 4 т. / Белякова Г. А., Дьяков Ю. Т., Тарасов К. Л. — М.: Издательский центр «Академия», 2006. — Т. 1. — 320 с.
27. Ramy K Aziz, Daniela Bartels at al.( 2008) The RAST Server: Rapid Annotations using Subsystems Technology, BMC Genomics, 9:75.
28. Okonechnikov K.. et al (2012). Unipro UGENE: a unified bioinformatics toolkit. Bioinformatics 28 (8).
29. ViDaExpert v 1.2 [Электронный ресурс] : Institute of Curie // Andrei Zinovyev. — Режим доступа: http://bioinfo-out.curie.fr/projects/vidaexpert/.
30. Gorban A. N. et al. Four basic symmetry types in the universal 7- cluster structure of microbial genomic sequences. // In Silico Biology - 2005 - 5: 25 - 37.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ