АННОТАЦИЯ 2
ВВЕДЕНИЕ 4
1 Обзор литературы 6
1.1 Структура генома хвойных 6
1.2 Повторяющиеся последовательности в геномах хвойных 7
1.2 CRISPR 8
1.3 Строение локусов CRISPR 8
1.4 Онлайн ресурсы для поиска CRISPR 9
1.5 Палиндромные повторы 10
1.6 Редакционное расстояние 10
2 Материалы и методы 12
2.1 Материалы 12
3 Результаты 15
3.1.1 Проверка на присутствие известных CRISPRs 15
4 Обсуждение 37
ЗАКЛЮЧЕНИЕ 39
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 40
Данная работа посвящена поиску палиндромных повторов и повторов с параметрами, аналогичными повторам CRISPR, в геноме лиственницы сибирской (Larix sibirica Ledeb.). Повторяющиеся элементы играют важную роль в структуре генома: они являются регуляторными элементами, структурируют геном, участвуют в регуляции экспрессии генов. Их изучение играет ключевую роль в понимании детальных механизмов функционирования генома в целом. Такие элементы крайне слабо изучены для геномов хвойных, что и определяет актуальность диссертационного исследования.
Данная работа была выполнена под руководством д. ф.-м. н., в.н.с. ИВМ СО РАН Садовского М.Г. в лаборатории лесной геномики СФУ и базовой кафедры защиты и современных технологий мониторинга лесов (зав. каф. д.б.н. И. Е. Ямских) в рамках проекта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации», руководимого проф. К. В. Крутовским и финансируемого Правительством РФ (договор №14.Y26.31.0004)
Целью работы является изучение особенностей повторяющихся элементов в геноме лиственницы сибирской.
Для достижения заданной цели были поставлены следующие задачи:
- поиск повторов определенной структуры в контигах заданной длины;
- сравнение выделенных повторов с аналогами, содержащимися в различных базах данных;
- описание статистических свойств выделенных повторов.
Предметом исследования является геном лиственницы сибирской, ранее полученный в лаборатории лесной геномики.
Автор выражает искреннюю благодарность Орешковой Н.В. за пробоподготовку и секвенирование, Кузьмину Д.А. и Шарову В.В. за сборку и ассемблирование генома, Путинцевой Ю.А., Садовскому М.Г. и Крутовскому К.В. за идею исследования и общее руководство на всех этапах работы. Так же
автор выражает благодарность всем членам лаборатории лесной геномики за участие в обсуждении работы и ценные советы по ней.
22 контига из первоначальной сборки имеют протяженную идентичную часть последовательности, что позволило обнаружить избыточность первоначальной сборки и улучшить повторную сборку генома.
В повторной сборке не было найдено ни одного из подтвержденных CRISPR, что может свидетельствовать об отсутствии бактериального загрязнения.
Были найдены прямые повторы и комплементарные палиндромы в геноме лиственницы сибирской. Найдена асимметрия в частоте встречаемости повторов одного комплекса, требующая дополнительного исследования.
Проверка BLAST'ом выявила большое количество совпадений с последовательностями митохондрий в некоторых контигах, что может быть причиной асимметрии частот повторов. Дальнейшая проверка BLAST'ом самих повторов на базу NCBI выявила закономерность в частоте встречаемости повтора в геноме и результатами BLAST'а, а именно, между высокой копийностью повтора и хитами хвойных и митохондрий. Интересно, что бактериальные хиты не давали такого результата, как и другие хиты. Однако, было и исключение, где без каких-либо найденных хитов число копий повтора было очень высоким. Данное исключение требует дальнейшего исследования.