АННОТАЦИЯ 2
ВВЕДЕНИЕ 4
1 Обзор литературы 6
1.1 Структура генома хвойных 6
1.2 Повторяющиеся последовательности в геномах хвойных 7
1.2 CRISPR 8
1.3 Строение локусов CRISPR 8
1.4 Онлайн ресурсы для поиска CRISPR 9
1.5 Палиндромные повторы 10
1.6 Редакционное расстояние 10
2 Материалы и методы 12
2.1 Материалы 12
3 Результаты 15
3.1.1 Проверка на присутствие известных CRISPRs 15
4 Обсуждение 37
ЗАКЛЮЧЕНИЕ 39
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 40
Данная работа посвящена поиску палиндромных повторов и повторов с параметрами, аналогичными повторам CRISPR, в геноме лиственницы сибирской (Larix sibirica Ledeb.). Повторяющиеся элементы играют важную роль в структуре генома: они являются регуляторными элементами, структурируют геном, участвуют в регуляции экспрессии генов. Их изучение играет ключевую роль в понимании детальных механизмов функционирования генома в целом. Такие элементы крайне слабо изучены для геномов хвойных, что и определяет актуальность диссертационного исследования.
Данная работа была выполнена под руководством д. ф.-м. н., в.н.с. ИВМ СО РАН Садовского М.Г. в лаборатории лесной геномики СФУ и базовой кафедры защиты и современных технологий мониторинга лесов (зав. каф. д.б.н. И. Е. Ямских) в рамках проекта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации», руководимого проф. К. В. Крутовским и финансируемого Правительством РФ (договор №14.Y26.31.0004)
Целью работы является изучение особенностей повторяющихся элементов в геноме лиственницы сибирской.
Для достижения заданной цели были поставлены следующие задачи:
- поиск повторов определенной структуры в контигах заданной длины;
- сравнение выделенных повторов с аналогами, содержащимися в различных базах данных;
- описание статистических свойств выделенных повторов.
Предметом исследования является геном лиственницы сибирской, ранее полученный в лаборатории лесной геномики.
Автор выражает искреннюю благодарность Орешковой Н.В. за пробоподготовку и секвенирование, Кузьмину Д.А. и Шарову В.В. за сборку и ассемблирование генома, Путинцевой Ю.А., Садовскому М.Г. и Крутовскому К.В. за идею исследования и общее руководство на всех этапах работы. Так же
автор выражает благодарность всем членам лаборатории лесной геномики за участие в обсуждении работы и ценные советы по ней.
22 контига из первоначальной сборки имеют протяженную идентичную часть последовательности, что позволило обнаружить избыточность первоначальной сборки и улучшить повторную сборку генома.
В повторной сборке не было найдено ни одного из подтвержденных CRISPR, что может свидетельствовать об отсутствии бактериального загрязнения.
Были найдены прямые повторы и комплементарные палиндромы в геноме лиственницы сибирской. Найдена асимметрия в частоте встречаемости повторов одного комплекса, требующая дополнительного исследования.
Проверка BLAST'ом выявила большое количество совпадений с последовательностями митохондрий в некоторых контигах, что может быть причиной асимметрии частот повторов. Дальнейшая проверка BLAST'ом самих повторов на базу NCBI выявила закономерность в частоте встречаемости повтора в геноме и результатами BLAST'а, а именно, между высокой копийностью повтора и хитами хвойных и митохондрий. Интересно, что бактериальные хиты не давали такого результата, как и другие хиты. Однако, было и исключение, где без каких-либо найденных хитов число копий повтора было очень высоким. Данное исключение требует дальнейшего исследования.
1 Plant DNA C-values Database: http://data.kew.org/cvalues/CvalServlet? querytype=1* Murray et al., 2010
2 JG Burleigh, WB Barbazuk, JM Davis, AM Morse, PS soltis. Exploring diversification and genome size evolution in extant Gymnosperms through phylogenetic synthesis. Journal of Botany 2012, - doi: 10.1155/2012/292857
3 E Buschiazzo, C Ritland, J Bohlmann, K Ritland. Slow but not low: genomic comparisons reveal slower evolutionary rate and higher dN/dS in conifers compared to angiosperms. BMC Evolutionary Biology. - 2012. - 12. - 8
4 P Rigault, B Boyle, P Lepage, JEK Cooke, J Bousquet, et al. A white spruce gene catalog for conifer genome analyses. Plant Physiology.2011. - 57:14-28
5 A Kovach, II Wegrzyn, G Parra, C Holt, GE Burning, et al. The Pinus tadel genome characterised by diverse and highly divergent repetitive sequences. BMC Genomics.2010. - 11:420. doi: 10.1186/1471-2164-11-420.
6 D Lisch, JL Benetzen. Transposable element origins of epigenetic gene regulation / [Current Opinion in Plant Biology / V14(2), 2011. - Pp.156-161
7 RS Baucom, JC Estill, C Chaparro, N Upshaw, A Jogi, JM Deragon, RP Westerman, PJ SanMiguel, JL Bennetzen. Exceptional Diversity, Non-Random Distribution, and Rapid Evolution of Retroelements in the B73 Maize Genome / PLoS Genetics, 2009, - V5(11),e1000732
8 M Morgante, E De Paoli. Towards the conifer genome sequence. In: Plomion C, Bousquet J, Kole C (eds). Genetics, genomics and Breeding of Conifers. Science Publishers, Edenbridge. pp.389-403.
9 W Liu, S Thummasuwan, SK Sehgal, P Chouvarine, DG Peterson. Characterization of the genome of bald cypress. BMC Genomics. 2011. - 12:553
10 DB Neale, RR Sederoff. Paternal inheritance of chloroplast DNA and maternal inheritance of mitochondrial DNA in loblolly pine. Theoretical and Applied Genetics.77:212-16.
11 Grissa, I. Clustered Regularly Interspaced Short Palindromic Repeats (CRISPRs) for the Genotyping of Bacterial Pathogens / I.Grissa, G.Vergnaud, C.Pourcel // Molecular Epidemiology of Microorganisms. - Vol.551. - N 2. - 2009. - DOI: 10.1007/978-1-60327-999-4
12 Mojica, FJ. Intervening sequences of regularly spaced 123 prokaryotic repeats derive from foreign genetic elements / FJ. Mojica, C. Diez-Villasenor, J. Garcia-Martinez, E. Soria // J Mol Evol. - 2005.- 60:174-182
13 Kurtz, S. REPuter: The Manifold Applications of Repeat Analysis on a Genomic Scale / S. Kurtz, J.V. Choudhuri, E. Ohlebusch, C. Schleiermacher, J. Stoye, R. Giegerich // Nucleic Acids Res., - 2001. - 29(22):4633-4642
14 RS Baucom, JC Estill, C Chaparro, N Upshaw, A Jogi, JM Deragon, RP Westerman, PJ SanMiguel, JL Bennetzen. Exceptional Diversity, Non-Random Distribution, and Rapid Evolution of Retroelements in the B73 Maize Genome / PLoS Genetics, 2009, - V5(11),e1000732