Разработка микросателлитных маркеров лиственницы сибирской (Larix sibirica Ledeb.) на основе полногеномного de novo секвенирования
|
ВВЕДЕНИЕ 5
1 ХАРАКТЕРИСТИКА РОДА LARIX MILL 8
1.1 Морфологическая характеристика 8
1.2 Систематика рода Larix 9
1.3 Экология и ареал обитания 10
1.4 Экономическое значение и использование 12
1.5 Краткая характеристика лиственницы сибирской Larix sibirica Ledeb. 13
2 ГЕНЕТИЧЕСКИЕ МАРКЕРЫ В ПОПУЛЯЦИЯХ И ФИЛОГЕНЕТИЧЕСКИХ ИССЛЕДОВАНИЯХ 16
2.1 Основные понятия и критерии оценки молекулярного маркера 17
2.2 Основные классы молекулярных маркеров 18
3 МИКРОСАТЕЛЛИТНЫЕ МАРКЕРЫ ДЛЯ ИЗУЧЕНИЯ ГЕНЕТИЧЕСКОГО РАЗНООБРАЗИЯ РАСТЕНИЙ 20
3.1 Определение и свойства 20
3.2 Микросателлиты в генетике растений 21
3.3 Разработка и применение микросателлитных маркеров в
популяционно-генетических исследованиях рода Larix 23
4 МЕТОДИКА РАЗРАБОТКИ МИКРОСАТЕЛЛИТНЫХ МАРКЕРОВ И
ПРОВЕДЕНИЕ SSR АНАЛИЗА 26
4.1 NGS-технологии в разработке микросателлитных маркеров 27
4.2 Идентификация тандемных повторов и подбор праймеров для
микросателлитных локусов 28
4.3 Оптимизация условий ПЦР и применение гель-электрофореза для
идентификации SSR локусов 28
5 МАТЕРИАЛЫ И МЕТОДЫ 31
5.1 Идентификация повторов и дизайн праймеров 31
5.2 Отбор полиморфных маркеров 32
5.3 Отработка полиморфных маркеров на нескольких популяциях L.
sibirica, L. gmeliniи L. cajanderi 35
5.4 Оценка показателей генетического разнообразия 35
6 РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ 38
6.1 Отбор повторов и дизайн праймеров 38
ВЫВОДЫ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 42
1 ХАРАКТЕРИСТИКА РОДА LARIX MILL 8
1.1 Морфологическая характеристика 8
1.2 Систематика рода Larix 9
1.3 Экология и ареал обитания 10
1.4 Экономическое значение и использование 12
1.5 Краткая характеристика лиственницы сибирской Larix sibirica Ledeb. 13
2 ГЕНЕТИЧЕСКИЕ МАРКЕРЫ В ПОПУЛЯЦИЯХ И ФИЛОГЕНЕТИЧЕСКИХ ИССЛЕДОВАНИЯХ 16
2.1 Основные понятия и критерии оценки молекулярного маркера 17
2.2 Основные классы молекулярных маркеров 18
3 МИКРОСАТЕЛЛИТНЫЕ МАРКЕРЫ ДЛЯ ИЗУЧЕНИЯ ГЕНЕТИЧЕСКОГО РАЗНООБРАЗИЯ РАСТЕНИЙ 20
3.1 Определение и свойства 20
3.2 Микросателлиты в генетике растений 21
3.3 Разработка и применение микросателлитных маркеров в
популяционно-генетических исследованиях рода Larix 23
4 МЕТОДИКА РАЗРАБОТКИ МИКРОСАТЕЛЛИТНЫХ МАРКЕРОВ И
ПРОВЕДЕНИЕ SSR АНАЛИЗА 26
4.1 NGS-технологии в разработке микросателлитных маркеров 27
4.2 Идентификация тандемных повторов и подбор праймеров для
микросателлитных локусов 28
4.3 Оптимизация условий ПЦР и применение гель-электрофореза для
идентификации SSR локусов 28
5 МАТЕРИАЛЫ И МЕТОДЫ 31
5.1 Идентификация повторов и дизайн праймеров 31
5.2 Отбор полиморфных маркеров 32
5.3 Отработка полиморфных маркеров на нескольких популяциях L.
sibirica, L. gmeliniи L. cajanderi 35
5.4 Оценка показателей генетического разнообразия 35
6 РЕЗУЛЬТАТЫ И ОБСУЖДЕНИЯ 38
6.1 Отбор повторов и дизайн праймеров 38
ВЫВОДЫ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 42
Лиственница сибирская является листопадных хвойным деревом из семейства Сосновых. Это одна из преобладающих бореальных пород в Евразии, и наиболее распространенный вид в Сибири [1], где суровые климатические условия ограничивают нормальный рост других древесных видов. Лиственница сибирская имеет большой адаптивный потенциал, как на индивидуальном, так и на популяционном уровне [2, 3]. Благодаря своей прочности, долговечности и устойчивости к гниению она используется в судостроении и гидротехнических сооружениях, для получения целлюлозы, этилового спирта, эфирного масла.
Генетическая структура определяет адаптивный потенциал и устойчивость популяции к неблагоприятным факторам. Следовательно, знание основных популяционно-генетических характеристик, таких как гетерозиготность, аллельная частота и уровень внутри- и межпопуляционной изменчивости становится необходимым для разработки эффективных стратегий сохранения и поддержания лесных ресурсов [4].
Молекулярные маркеры уже долгое время являются признанным инструментом для оценки популяционной изменчивости и идентификации видов. В частности, SSR-маркеры, или микросателлитные повторы, широко используются для анализа генетической структуры популяций и определения родства. Они представляют собой повторяющиеся участки ДНК, в которых мотив (обычно от 2 до 9 п.н.) повторяется тандемно, образуя повтор длиной до тысячи нуклеотидов. Ввиду высокой скорости мутирования, кодоминантного характера наследования, равномерного распределения по геному и высокой воспроизводимости, в сравнении с RAPD-маркерами и аллозимами [5], микросателлитные маркеры получили обширное применение в изучении растений [6, 7]. Было показано, что SSR-маркеры могут быть использованы для различения между видами одного рода, а также для определения происхождения деревьев [8-10]. К недостаткам SSR-анализа можно отнести тот факт, что микросателлитные маркеры, разработанные для одного вида часто плохо амплифицируются в других, даже родственных видах. Для конкретного вида самые надежные результаты показывают видоспецифичные маркеры, специально разработанные для этого вида, что в случае с немодельными организмами часто является дорогостоящей процедурой. Учитывая большие размеры генома (от 10 до 30 млрд. п.н), для хвойных данная задача становится особенно сложной. Однако развитие методов секвенирования нового поколения позволила значительно облегчить процесс, сделав его более быстрым и дешевым.
Исследование нуклеотидного разнообразия и работы по разработке SSR-маркеров за последние несколько лет были проведены для нескольких видов хвойных: Pinus massoniana Lamb. [11], Pseudolarix amabilis Rehd. [12], Abies firma Sieb. et Zucc. [13], Pinus sibirica Du Tour. [14]. Из видов рода Larix на сегодняшний день микросателлитные маркеры были разработаны для лиственницы японской [15, 16], лиственницы европейской [17], лиственницы Гмелина [18], лиственницы Лайэля и лиственницы западной [19; 20]. Для лиственницы сибирской был разработан набор из 11 динуклеотидных локусов [21], однако для работы с данными маркерами необходимо применение капиллярного электрофореза с использованием секвенатора, что является преградой для многих лабораторий, ввиду отсутствия необходимого оборудования.
Несмотря на то, что лиственница сибирская является чрезвычайно важным лесообразующим видом, разработка и использование микросателлитных маркеров для ее исследования до сих пор остаются ограниченными. Стоит так же отметить, что благодаря своей ценной древесине лиственница сибирская подвержена незаконной вырубке, что, в свою очередь, вызывает серьезные экономические и экологические проблемы, и несет угрозу лесному биоразнообразию. Существует объективная потребность в разработке генетических маркеров, которые можно использовать для оценки популяционно-генетических характеристик и идентификации происхождения деревьев.
Цель настоящей работы — разработка полиморфных ядерных микросателлитных (SSR) маркеров для лиственницы сибирской и их апробация.
В связи с этим были поставлены следующие задачи:
— поиск тандемно повторяющихся последовательностей с заданными параметрами и дизайн праймеров для отобранных повторов;
— проверка праймеров на однократную встречаемость в геноме;
— отбор полиморфных маркеров и оценка уровня аллельного разнообразия;
— тестирование отобранных маркеров на популяциях трех видов лиственницы.
Автор выражает искреннюю благодарность научному руководителю Орешковой Н.В. за неоценимую помощь на всех этапах работы, руководителю лаборатории лесной геномики Крутовскому К.В., Садовскому М.Г. и Путинцевой Ю.А. за обсуждение результатов и ценные комментарии, Кузьмину Д.А. и Шарову В.В. за ассемблирование генома. Так же автор благодарен сотрудникам отдела мониторинга состояния лесных генетических ресурсов ЦЗЛ г. Красноярска за предоставленные образцы лиственницы сибирской.
Магистерская диссертация выполнена в лаборатории лесной геномики СФУ и базовой кафедры защиты и современных технологий мониторинга лесов (зав. каф. д.б.н. И. Е. Ямских) в рамках проекта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации», руководимого проф. К. В. Крутовским и финансируемого Правительством РФ (договор №14.Y26.31.0004).
Генетическая структура определяет адаптивный потенциал и устойчивость популяции к неблагоприятным факторам. Следовательно, знание основных популяционно-генетических характеристик, таких как гетерозиготность, аллельная частота и уровень внутри- и межпопуляционной изменчивости становится необходимым для разработки эффективных стратегий сохранения и поддержания лесных ресурсов [4].
Молекулярные маркеры уже долгое время являются признанным инструментом для оценки популяционной изменчивости и идентификации видов. В частности, SSR-маркеры, или микросателлитные повторы, широко используются для анализа генетической структуры популяций и определения родства. Они представляют собой повторяющиеся участки ДНК, в которых мотив (обычно от 2 до 9 п.н.) повторяется тандемно, образуя повтор длиной до тысячи нуклеотидов. Ввиду высокой скорости мутирования, кодоминантного характера наследования, равномерного распределения по геному и высокой воспроизводимости, в сравнении с RAPD-маркерами и аллозимами [5], микросателлитные маркеры получили обширное применение в изучении растений [6, 7]. Было показано, что SSR-маркеры могут быть использованы для различения между видами одного рода, а также для определения происхождения деревьев [8-10]. К недостаткам SSR-анализа можно отнести тот факт, что микросателлитные маркеры, разработанные для одного вида часто плохо амплифицируются в других, даже родственных видах. Для конкретного вида самые надежные результаты показывают видоспецифичные маркеры, специально разработанные для этого вида, что в случае с немодельными организмами часто является дорогостоящей процедурой. Учитывая большие размеры генома (от 10 до 30 млрд. п.н), для хвойных данная задача становится особенно сложной. Однако развитие методов секвенирования нового поколения позволила значительно облегчить процесс, сделав его более быстрым и дешевым.
Исследование нуклеотидного разнообразия и работы по разработке SSR-маркеров за последние несколько лет были проведены для нескольких видов хвойных: Pinus massoniana Lamb. [11], Pseudolarix amabilis Rehd. [12], Abies firma Sieb. et Zucc. [13], Pinus sibirica Du Tour. [14]. Из видов рода Larix на сегодняшний день микросателлитные маркеры были разработаны для лиственницы японской [15, 16], лиственницы европейской [17], лиственницы Гмелина [18], лиственницы Лайэля и лиственницы западной [19; 20]. Для лиственницы сибирской был разработан набор из 11 динуклеотидных локусов [21], однако для работы с данными маркерами необходимо применение капиллярного электрофореза с использованием секвенатора, что является преградой для многих лабораторий, ввиду отсутствия необходимого оборудования.
Несмотря на то, что лиственница сибирская является чрезвычайно важным лесообразующим видом, разработка и использование микросателлитных маркеров для ее исследования до сих пор остаются ограниченными. Стоит так же отметить, что благодаря своей ценной древесине лиственница сибирская подвержена незаконной вырубке, что, в свою очередь, вызывает серьезные экономические и экологические проблемы, и несет угрозу лесному биоразнообразию. Существует объективная потребность в разработке генетических маркеров, которые можно использовать для оценки популяционно-генетических характеристик и идентификации происхождения деревьев.
Цель настоящей работы — разработка полиморфных ядерных микросателлитных (SSR) маркеров для лиственницы сибирской и их апробация.
В связи с этим были поставлены следующие задачи:
— поиск тандемно повторяющихся последовательностей с заданными параметрами и дизайн праймеров для отобранных повторов;
— проверка праймеров на однократную встречаемость в геноме;
— отбор полиморфных маркеров и оценка уровня аллельного разнообразия;
— тестирование отобранных маркеров на популяциях трех видов лиственницы.
Автор выражает искреннюю благодарность научному руководителю Орешковой Н.В. за неоценимую помощь на всех этапах работы, руководителю лаборатории лесной геномики Крутовскому К.В., Садовскому М.Г. и Путинцевой Ю.А. за обсуждение результатов и ценные комментарии, Кузьмину Д.А. и Шарову В.В. за ассемблирование генома. Так же автор благодарен сотрудникам отдела мониторинга состояния лесных генетических ресурсов ЦЗЛ г. Красноярска за предоставленные образцы лиственницы сибирской.
Магистерская диссертация выполнена в лаборатории лесной геномики СФУ и базовой кафедры защиты и современных технологий мониторинга лесов (зав. каф. д.б.н. И. Е. Ямских) в рамках проекта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации», руководимого проф. К. В. Крутовским и финансируемого Правительством РФ (договор №14.Y26.31.0004).
1. В полногеномной сборке L. sibiricaбыло выявлено 1015 тандемных повторов с длиной мотива от 3 до 6 нуклеотидов и минимальным числом повторов: от 7 для шестинуклеотидных мотивов до 15 для трёхнуклеотидных мотивов. После отбора тандемных повторов по минимальному числу повторения мотивов и положению в контиге при помощи WebSat был выполнен дизайн праймеров для 222 локусов.
2. Было отобрано 60 пар праймеров для дальнейшего тестирования в лаборатории после проверки последовательностей на встречаемость в геноме лиственницы сибирской.
3. 14 наиболее перспективных микросателлитных локусов (Ls_980491,Ls_2672894, Ls_4040657, Ls_1008427, Ls_417667, Ls_840190, Ls_954234, Ls_752897, Ls_2552367, Ls_1247092(2), Ls_3765334, Ls_611965, Ls_3952800 Ls_305132),демонстрирующих средне- и высоко-полиморфные спектры для лиственниц сибирской, Гмелина и Каяндера предложены нами для дальнейших популяционно-генетических исследований этих видов.
4. Результаты первичного популяционно-генетического анализа, проведенного с использованием разработанных SSR-маркеров, позволили получить оценки уровня генетического разнообразия и дифференциации четырех выборок из популяций лиственниц сибирской, Гмелина и Каяндера.
5. Для 14 проанализированных локусов было выявлено 86 аллельных вариантов, 28 (32,5%) из которых оказались общими. Видоспецифичными для L. sibiricaоказались 11 аллелей, для L. gmeliniiи L. cajanderi — 7 и 5 соответственно.
6. Выборки лиственниц Гмелина (NA= 4,429, NE= 2,316) и Каяндера (NA = 4,357, NE= 2,217) продемонстрировали наиболее высокое аллельное разнообразие. Однако гораздо больший уровень изменчивости был выявлен в выборках лиственницы сибирской по уровням наблюдаемой и ожидаемой гетерозиготности (HO= 0,436, HE= 0,466).
7. Анализ популяционной структуры лиственниц с помощью F-статистик Райта показал, что около 14% от всей наблюдаемой изменчивости (FST= 0,137) приходится на межпопуляционную. Внутри популяций сосредоточено
86,3 % всего генетического разнообразия.
8. Расчет уровня генетической дифференциации показал, что значения генетического расстояния DNмежду популяциями лиственницы варьируют в достаточно широких пределах (от 0,079 до 0,311), составляя в среднем 0,210. Наиболее генетически удалёнными друг от друга являются выборки лиственницы Каяндера из Якутии и лиственницы сибирской из Хакасии (DN = 0,311), а наименьшее значение генетического расстояния наблюдается между выборками одного вида — лиственницы сибирской (DN= 0,079). Полученные невысокие значения расстояния Нея (DN= 0,085) между выборками из лиственниц Гмелина и Каяндера служат подтверждением существующей в литературе гипотезы, что они являются расами одного вида.
9. Разработанные нами маркеры могут успешно применяться для изучения не только лиственницы сибирской, но также лиственниц Гмелина и Каяндера. Дальнейший анализ уровней изменчивости природных и искусственных популяций лиственницы с помощью предложенных маркеров позволит получить количественные оценки их генетической структуры, таких как внутрипопуляционное аллельное и генное разнообразие, генетическая подразделенность и дифференциация на разных иерархических уровнях, степень инбридинга и др.
2. Было отобрано 60 пар праймеров для дальнейшего тестирования в лаборатории после проверки последовательностей на встречаемость в геноме лиственницы сибирской.
3. 14 наиболее перспективных микросателлитных локусов (Ls_980491,Ls_2672894, Ls_4040657, Ls_1008427, Ls_417667, Ls_840190, Ls_954234, Ls_752897, Ls_2552367, Ls_1247092(2), Ls_3765334, Ls_611965, Ls_3952800 Ls_305132),демонстрирующих средне- и высоко-полиморфные спектры для лиственниц сибирской, Гмелина и Каяндера предложены нами для дальнейших популяционно-генетических исследований этих видов.
4. Результаты первичного популяционно-генетического анализа, проведенного с использованием разработанных SSR-маркеров, позволили получить оценки уровня генетического разнообразия и дифференциации четырех выборок из популяций лиственниц сибирской, Гмелина и Каяндера.
5. Для 14 проанализированных локусов было выявлено 86 аллельных вариантов, 28 (32,5%) из которых оказались общими. Видоспецифичными для L. sibiricaоказались 11 аллелей, для L. gmeliniiи L. cajanderi — 7 и 5 соответственно.
6. Выборки лиственниц Гмелина (NA= 4,429, NE= 2,316) и Каяндера (NA = 4,357, NE= 2,217) продемонстрировали наиболее высокое аллельное разнообразие. Однако гораздо больший уровень изменчивости был выявлен в выборках лиственницы сибирской по уровням наблюдаемой и ожидаемой гетерозиготности (HO= 0,436, HE= 0,466).
7. Анализ популяционной структуры лиственниц с помощью F-статистик Райта показал, что около 14% от всей наблюдаемой изменчивости (FST= 0,137) приходится на межпопуляционную. Внутри популяций сосредоточено
86,3 % всего генетического разнообразия.
8. Расчет уровня генетической дифференциации показал, что значения генетического расстояния DNмежду популяциями лиственницы варьируют в достаточно широких пределах (от 0,079 до 0,311), составляя в среднем 0,210. Наиболее генетически удалёнными друг от друга являются выборки лиственницы Каяндера из Якутии и лиственницы сибирской из Хакасии (DN = 0,311), а наименьшее значение генетического расстояния наблюдается между выборками одного вида — лиственницы сибирской (DN= 0,079). Полученные невысокие значения расстояния Нея (DN= 0,085) между выборками из лиственниц Гмелина и Каяндера служат подтверждением существующей в литературе гипотезы, что они являются расами одного вида.
9. Разработанные нами маркеры могут успешно применяться для изучения не только лиственницы сибирской, но также лиственниц Гмелина и Каяндера. Дальнейший анализ уровней изменчивости природных и искусственных популяций лиственницы с помощью предложенных маркеров позволит получить количественные оценки их генетической структуры, таких как внутрипопуляционное аллельное и генное разнообразие, генетическая подразделенность и дифференциация на разных иерархических уровнях, степень инбридинга и др.



