ВВЕДЕНИЕ 3
1 Основная часть 6
1.1 Некодирующие РНК 6
1.1.1 МикроРНК и механизмы регуляции экспрессии мРНК 8
1.2 Секвенирование РНК (RNA-seq) 10
1.3 Алгоритмические подходы 12
1.3.1 Сборка RNA-Seq данных 12
1.3.2 In silicoпредсказание микроРНК и их мишеней 15
2 Материалы и методы 18
3 Результаты и обсуждения 20
3.1 Результаты ассемблирования 20
ЗАКЛЮЧЕНИЕ 30
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 31
Актуальность проблемы. В последнее десятилетие во многих областях биологии произошли серьезные изменения, в частности, претерпела преобразование и молекулярная биология РНК. Одним из наиболее значимых достижений в данной области стало обнаружение некодирующих белок РНК, способных регулировать экспрессию генов на посттранскрипционном и посттрансляционном уровнях. Было также показано, что подавляющее число молекул РНК в клетке представляют собой именно эту группу РНК, в то время как кодирующие белок последовательности, в зависимости от организма, составляют всего 1-3% от суммарного количества РНК в клетке [1, 2].
Некодирующие РНК способны регулировать метаболические пути, ассоциированные с онтогенезом, дифференциацией клеток, а также связанные с ответом на абиотические и биотические стресс-факторы окружающей среды [3¬5]. Кроме того, имеются данные о том, что микроРНК (миРНК, один из классов некодирующих РНК) играет особую роль в межвидовой коммуникации [6]. Было показано, что подобная связь на молекулярном уровне между миРНК патогена и организмом хозяина может играть ключевую роль в развитии болезни путем репрессии большого количества защитных генов хозяина [7, 8]. С данным классом молекул связан также один из возможных механизмов патогенности грибов.
Многие заболевания растений, вызванные грибами, могут протекать в скрытой форме, поэтому, после инвазии возбудителя, лечение зараженных деревьев практически невозможно. Затруднено это также и из-за способа передачи патогена: грибной патоген распространяется через корневые контакты деревьев и сохраняет способность к инфицированию в течение десятилетий, что часто приводит к повторному заражению саженцев и молодых растений, которые через несколько лет погибают [9]. Изменения климатических условий и интенсивная лесозаготовка приводят еще к большему распространению возбудителя, что, в свою очередь, наносит огромный экономический урон для лесной промышленности. Поэтому очень важно изучить механизм патогенности этих видов. Одним из популярных методов для изучения регуляции экспрессии генов и регуляторных механизмов клетки и организма в целом является секвенирование РНК и анализ транскриптома (совокупности всей РНК организма, представляющей экспрессируемую часть генома - экзом).
Цели и задачи исследования. Целью настоящей работы стали de novo сборка тотального транскриптома лиственницы сибирской (Larix sibirica Ledeb.) и поиск таргетных последовательностей для различных микроРНК в полученной сборке: консервативных миРНК, опубликованных в базе данных miRBase, а также миРНК одного из наиболее патогенных грибов Fusarium oxysporum Schlecht. emend. Snyder et. Hansen.
Для достижения данной цели, были поставлены следующие задачи:
- осуществить de novoсборку тотального транскриптома лиственницы сибирской;
- провести оценку полученного транскриптома;
- осуществить поиск и анализ таргетов для консервативных миРНК, опубликованных в базе данных miRBase;
- осуществить поиск и анализ таргетов для миРНК Fusarium oxysporum.
Научная новизна. Впервые проведена de novoсборка тотального транскриптома лиственницы сибирской. Впервые определены основные таргеты в полученном транскриптоме для консервативных миРНК, а также для миРНК патогенного гриба F. oxysporum.Установлено, что многие таргеты ассоциированы с ответом на биотический стресс, в частности, с ответом на воздействие патогена.
Практическая значимость. Данное исследование имеет важное значение для лесной геномики и лесного хозяйства, так как полученные результаты могут быть применены в разработке природоохранных мероприятий и позволят решить вопросы, связанные с массовой гибелью лесов вследствие воздействия различных патогенов. Результаты данной работы смогут помочь в разработке молекулярно-генетических методик для укрепления защитных механизмов деревьев против возбудителей заболеваний, а также могут быть использованы для дальнейшего изучения подходов для раннего выявления инфекции.
Апробация работы. Результаты данной работы будут представлены на 11-ой Международной мультиконференции по биоинформатике регуляции и структуры геномов и системной биологии (Bioinformatics of Genome Regulation and Structure Systems Biology — BGRSSB-2018).
Благодарности. Автор выражает искреннюю признательность Н.В. Орешковой за пробоподготовку и секвенирование, В.В. Шарову за предварительную обработку данных секвенирования, а также руководителю Лаборатории лесной геномики К.В. Крутовскому, научному руководителю М.Г. Садовскому и руководителю биоинформатической группы Ю.А. Путинцевой за обсуждение результатов, ценные указания и советы в проведении исследования.
Магистерская диссертация выполнена в лаборатории лесной геномики СФУ и базовой кафедры защиты и современных технологий мониторинга лесов (зав. каф. д.б.н. И. Е. Ямских) в рамках проекта «Геномные исследования основных бореальных лесообразующих хвойных видов и их наиболее опасных патогенов в Российской Федерации», руководимого проф. К. В. Крутовским и финансируемого Правительством РФ (договор №14.Y26.31.0004).
В ходе данной исследовательской работы были выполнены все поставленные задачи, а именно:
- Проведена очистка данных секвенирования от рибосомальной РНК и осуществлена de novoсборка транскриптомов хвои, побега 1 года, камбия и проростка лиственницы сибирской, а также впервые получен тотальный транскриптом данного вида. Длина тотального транскриптома составила 412382049 н.о. (244222634 н.о. с учетом только самых длинных изоформ для каждого юнигена).
- Произведена оценка полученных данных. Набор транскриптов, включающий в себя только самые длинные изоформы каждого юнигена, оказался наиболее подходящим для дальнейшего анализа - он является наиболее завершенным (72,1%) с низким уровнем дупликаций (3,8%).
- Определены таргеты для консервативных миРНК, опубликованных в базе данных miRBase. Установлено, что основными таргетами являются транскрипционные факторы, участвующие в ответе растения на биотический и абиотический стрессы, а также большое количество найденных таргетов соответствует гипотетическим неохарактеризованным белкам, что указывает на пока ещё плохо изученные функции данных таргетов.
- Определены гены-мишени для миРНК патогенного гриба Fusarium oxysporum.Большинство таргетов ассоциировано с белками, ответственными за ответ растения на воздействие патогенов. Также показано, что ослабление защитных механизмов путем РНК-интерференции может быть характерно не только для F. oxysporum,но и для других патогенных грибов.
Таким образом, поставленные в магистерской диссертации цель и задачи полностью достигнуты.
1. Harrow J. et al. GENCODE: the reference human genome annotation for The ENCODE Project // Genome research. - 2012. - T. 22. - №. 9. - С. 1760-1774.
2. Harrow J. et al. GENCODE: producing a reference annotation for ENCODE // Genome biology. - 2006. - T. 7. - №. 1. - C. S4.
3. Bartel D. P. MicroRNAs: genomics, biogenesis, mechanism, and function // Cell. - 2004. - Т. 116. - №. 2. - С. 281-297.
4. Koroban N. V. et al. The role of microRNA in abiotic stress response in plants // Molecular Biology. - 2016. - Т. 50. - №. 3. - С. 337-343.
5. Wang J. et al. Non-coding RNAs and Their Roles in Stress Response in Plants // Genomics, proteomics &bioinformatics. - 2017. - T. 15. - №. 5. - C. 301-312.
6. Liang H. et al. New roles for microRNAs in cross-species communication // RNA biology. - 2013. - T. 10. - №. 3. - C. 367-370.
7. Gupta O. P. et al. Current status on role of miRNAs during plant-fungus interaction // Physiological and molecular plant pathology. - 2014. - T. 85. - C. 1-7.
8. Chen L. et al. Genome-wide profiling of novel and conserved Populus microRNAs involved in pathogen stress response by deep sequencing // Planta. - 2012. - T. 235. - №. 5. - C. 873-883.
9. Oliva J., Bendz-Hellgren M., Stenlid J. Spread of Heterobasidion annosum ss and Heterobasidion parviporum in Picea abies 15 years after stump inoculation // FEMS microbiology ecology. - 2011. - T. 75. - №. 3. - C. 414-429.
10. Carthew R. W., Sontheimer E. J. Origins and mechanisms of miRNAs and siRNAs // Cell. - 2009. - T. 136. - №. 4. - C. 642-655.
11. Masotti A. et al. Quantification of small non-coding RNAs allows an accurate comparison of miRNA expression profiles // Journal of Biomedicine and Biotechnology. - 2009. - T. 2009. ID 659028.
12. Wu H., Yang L., Chen L. L. The diversity of long noncoding RNAs and their generation // Trends in Genetics. - 2017. - T. 33. - №. 8. - C. 540-552.
13. Bartonicek N., Maag J. L. V., Dinger M. E. Long noncoding RNAs in cancer: mechanisms of action and technological advancements // Molecular cancer. - 2016. - T. 15. - №. 1. - С. 43.
14. Chekanova J. A. Long non-coding RNAs and their functions in plants // Current opinion in plant biology. - 2015. - T. 27. - C. 207-216.
15. Liu X. et al. Long non-coding RNAs and their biological roles in plants // Genomics, proteomics & bioinformatics. - 2015. - T. 13. - №. 3. - C. 137-147.
16. Zhu Q. H., Wang M. B. Molecular functions of long non-coding RNAs in plants // Genes. - 2012. - T. 3. - №. 1. - C. 176-190.
17. Franco-Zorrilla J. M. et al. Target mimicry provides a new mechanism for regulation of microRNA activity // Nature genetics. - 2007. - T. 39. - №. 8. - C. 1033.
18. Kim V. N., Han J., Siomi M. C. Biogenesis of small RNAs in animals // Nature reviews Molecular cell biology. - 2009. - T. 10. - №. 2. - C. 126.
19. Патрушев Л. И., Коваленко T. Ф. Функции некодирующих последовательностей генома млекопитающих // Успехи биологической химии. - 2014. - Т. 54. - С. 39-102.
20. Westholm J. O., Lai E. C. Mirtrons: microRNA biogenesis via splicing // Biochimie. - 2011. - Т. 93. - №. 11. - С. 1897-1904.
21. Tomari Y., Zamore P. D. Perspective: machines for RNAi //Genes &development. - 2005. - Т. 19. - №. 5. - С. 517-529.
22. Vaucheret H. Post-transcriptional small RNA pathways in plants: mechanisms and regulations // Genes &development. - 2006. - T. 20. - №. 7. - С. 759-771.
23. Макарова Ю. А., Крамеров Д. А. Некодирующие РНК (обзор) // Биохимия. - 2007. - Т. 72. - №. 11. - С. 1427-1448.
24. Valencia-Sanchez M. A. et al. Control of translation and mRNA degradation by miRNAs and siRNAs // Genes & development. - 2006. - T. 20. - №. 5. - C. 515¬524.
25. Rhoades M. W. et al. Prediction of plant microRNA targets // Cell. - 2002. - T. 110. - №. 4. - C. 513-520.
26. Bartel D. P. MicroRNAs: genomics, biogenesis, mechanism, and function // Cell. - 2004. - T. 116. - №. 2. - С. 281-297.
27. Hrdlickova R., Toloue M., Tian B. RNA-Seq methods for transcriptome analysis // Wiley Interdisciplinary Reviews: RNA. - 2017. - T. 8. - №. 1.
28. Ansorge W. J. Next-generation DNA sequencing techniques // New biotechnology. - 2009. - T. 25. - №. 4. - C. 195-203.
29. Zhao W. et al. Comparison of RNA-Seq by poly (A) capture, ribosomal RNA depletion, and DNA microarray for expression profiling // BMC genomics. - 2014. - T. 15. - №. 1. - C. 419.
30. Armour C. D. et al. Digital transcriptome profiling using selective hexamer priming for cDNA synthesis // Nature methods. - 2009. - T. 6. - №. 9. - C. 647.
31. Adomas A. B. et al. Multi-targeted priming for genome-wide gene expression assays // BMC genomics. - 2010. - T. 11. - №. 1. - C. 477.
32. Wang Z., Gerstein M., Snyder M. RNA-Seq: a revolutionary tool for transcriptomics // Nature Reviews Genetics. - 2009. - T. 10. - №. 1. - C. 57.
33. Grabherr M. G. et al. Trinity: reconstructing a full-length transcriptome without a genome from RNA-Seq data // Nature Biotechnology. - 2011. - T. 29. - №. 7. - C. 644.
34. Miller J. R., Koren S., Sutton G. Assembly algorithms for next-generation sequencing data // Genomics. - 2010. - T. 95. - №. 6. - C. 315-327.
35. Касьянов, А. С. Новые методы обработки данных, полученных с помощью современных технологий секвенирования, для решения задач анализа экспрессии генов : автореф. дне. ... канд. физ.-мат. наук : 03.01.03 / Касьянов Артем Сергеевич. - Москва, 2012. - 23 с.;
36. Bartel B., Bartel D. P. MicroRNAs: at the root of plant development? // Plant Physiology. - 2003. - Т. 132. - №. 2. - С. 709-717.
37. Lim L. P. et al. The microRNAs of Caenorhabditis elegans// Genes &development. - 2003. - Т. 17. - №. 8. - С. 991-1008.
38. Lim L. P. et al. Vertebrate microRNA genes // Science. - 2003. - T. 299. - №. 5612. - C. 1540-1540.
39. Peterson S. M. et al. Common features of microRNA target prediction tools // Frontiers in Genetics. - 2014. - T. 5. - C. 23.
40. Enright A. J. et al. MicroRNA targets in Drosophila // Genome biology. - 2003. - T. 5. - №. 1. - C. R1.
41. Dai X., Zhao P. X. psRNATarget: a plant small RNA target analysis server // Nucleic acids research. - 2011. - T. 39. - №. suppl_2. - C. W155-W159.
42. Dai X., Zhuang Z., Zhao P. X. psRNATarget: a plant small RNA target analysis server (2017 release) // Nucleic acids research. - 2018.
43. Kopylova E., Noe L., Touzet H. SortMeRNA: fast and accurate filtering of ribosomal RNAs in metatranscriptomic data // Bioinformatics. - 2012. - T. 28. - №. 24. - C. 3211-3217.
44. Simao F. A. et al. BUSCO: assessing genome assembly and annotation completeness with single-copy orthologs // Bioinformatics. - 2015. - T. 31. - №. 19. - C. 3210-3212.
45. Waterhouse R. M. et al. BUSCO applications from quality assessments to gene prediction and phylogenomics // Molecular biology and evolution. - 2017.
46. Finn R. D. et al. The Pfam protein families database: towards a more sustainable future //Nucleic acids research. - 2015. - T. 44. - №. D1. - C. D279-D285.
47. Griffiths-Jones S. The microRNA registry // Nucleic acids research. - 2004. - T. 32. - №. suppl_1. - C. D109-D111.
48. Griffiths-Jones S. et al. miRBase: tools for microRNA genomics //Nucleic acids research. - 2007. - T. 36. - №. suppl_1. - C. D154-D158.
49. Chen R. et al. Exploring microRNA-like small RNAs in the filamentous fungus Fusarium oxysporum// PloS One. - 2014. - T. 9. - №. 8. - C. e104956.
50. Conesa A. et al. Blast2GO: a universal tool for annotation, visualization and analysis in functional genomics research // Bioinformatics. - 2005. - T. 21. - №. 18. - C. 3674-3676.
51. Guo H. S. et al. MicroRNA directs mRNA cleavage of the transcription factor NAC1 to downregulate auxin signals for Arabidopsis lateral root development // The Plant Cell. - 2005. - T. 17. - №. 5. - C. 1376-1386.
52. Kim J. H. et al. Trifurcate feed-forward regulation of age-dependent cell death involving miR164 in Arabidopsis // Science. - 2009. - T. 323. - №. 5917. - C. 1053-1057.
53. Fang Y., Xie K., Xiong L. Conserved miR164-targeted NAC genes negatively regulate drought resistance in rice // Journal of experimental botany. - 2014. - T. 65. - №. 8. - C. 2119-2135.
54. Dubreuil-Maurizi C., Poinssot B. Role of glutathione in plant signaling under biotic stress // Plant signaling & behavior. - 2012. - T. 7. - №. 2. - C. 210-212.
55. Dubreuil-Maurizi C. et al. Glutathione deficiency of the Arabidopsis mutant pad2-1 affects oxidative stress-related events, defense gene expression, and the hypersensitive response // Plant Physiology. - 2011. - T. 157. - №. 4. - C. 2000¬2012.
56. Padmanabhan M., Cournoyer P., Dinesh-Kumar S. P. The leucine-rich repeat domain in plant innate immunity: a wealth of possibilities // Cellular microbiology. - 2009. - T. 11. - №. 2. - C. 191-198.