Тема: СРАВНИТЕЛЬНЫЙ АНАЛИЗ ТИПОВ ВНУТРЕННЕЙ СТРУКТУРИРОВАННОСТИ ГЕНОМОВ БАКТЕРИЙ ДЛЯ РАЗЛИЧНЫХ ДЛИН ФРАГМЕНТОВ С УЧЁТОМ ЗНАЧЕНИЙ GC-COCTABA
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 4
1.1. Бактерии 6
1.2. Генетическая система бактерий 7
1.3 GC-состав 9
2 Материалы и методы 10
2.1 Базы данных 10
2.2 Построение частотных словарей 10
2.3 Использованное программное обеспечение 12
3 Результаты работы 13
3.1 Выделенные структуры при длине окна считывания в 603 нуклеотида 13
3.2 Выделенные структуры при длине окна считывания в 60000 нуклеотидов 17
3.3 Обработка данных 22
3.4 Распределение и средние данные о содержании GC-состава в структурах 26
3.5 Изменчивость структур при увеличении длины окна считывания 32
ЗАКЛЮЧЕНИЕ 42
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 43
📖 Введение
Объектом в данном исследовании стали бактерии. Они являются очень удобным организмом для изучения ДНК, так как их геном сравнительно мал.
Развитие технологий позволило изучать ДНК разнообразными методами. Один из таких методов - определение структуры генома при помощи частотных словарей [1]. Данный метод уже применялся как к бактериям в общем [2], так и к отдельным их группам [3, 4]. Такими же методами исследуются и геномы органелл: митохондрий [5] и хлоропластов [6, 7, 8, 9]. Метод частотных словарей позволяет строить пространственные структуры, которые могут нести в себе информацию о функциях и таксономии носителя генома, что делает изучение данного метода актуальным вопросом.
Цель данной работы: выявить различия в наблюдаемых структурах геномов бактерий для разных параметров их фрагментации и установить связь этих различий с таксономией носителей геномов.
Для достижения цели были поставлены следующие задачи:
• Выделить структуры при различных длинах окон считывания;
• Проследить путь изменения структур при изменении длины окна считывания;
• Определить однородность распределения GC-состава в структурах и изменение данного распределения при перемене длины окна считывания;
• Определить, наблюдается ли соответствие между таксоном растения и свойственной этому таксону структурой.
Основные результаты работы были доложены на конференции «Нейроинформатика, её приложения и анализ данных» (Красноярск, 27-29 сентября 2019 г.)
Основные результаты работы опубликованы в сборнике «Нейроинформатика, её приложения и анализ данных: Материалы XXVII Всероссийского семинара».
✅ Заключение
Распределение GC-состава внутри данных структур показало, что структуры «Шестилучевая» и «Совпадающие треугольники» имеют градиентное распределение GC-состава, в то время как остальные — хаотичное. В результате исследования среднего содержания GC-состава в различных типах структур выявлено, что каждая из структур имеет свой характерный диапазон процентного содержания GC-состава.
При увеличении окна считывания до 60000 нуклеотидов образуются совершенно иные структуры. Их основное отличие заключается в нитчатом составе. Так, структуры, выделяемые при чётном шаге, состоят из 3 раздельных нитей, а при нечётном из одной длинной непрерывной нити. Всего было выделено 3 такие структуры. Им были присвоены названия «Клубок», «Снитч» и «Две плоскости». GC-состав внутри данных структур всегда распределяется градиентно, однако средние его значения в структуре могут сильно варьировать, что говорит о независимости типа структуры от содержания в ней GC-состава.
Показано, что постепенное увеличение длины фрагментов, по которым определяется структура, приводит к её плавной трансформации. Полученные данные дают основание полагать, что любая структура, выделяемая при длине окна считывания в 603 нуклеотида, может преобразовываться в любую структуру, выделяемую при длине окна считывания в 60000 нуклеотидов.





