ВВЕДЕНИЕ 3
1. ОБЗОР ЛИТЕРАТУРЫ 4
1.1. Строение ДНК 4
1.2. Длина генома 4
1.3. Частотный словарь 6
1.4. Правила Чаргаффа 6
2. МАТЕРИАЛЫ И МЕТОДЫ ИССЛЕДОВАНИЯ 7
2.1. Материалы 7
2.2. Методы 20
3. РЕЗУЛЬТАТЫ 20
4. ВЫВОДЫ 54
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 55
Наука не стоит на месте, еще совсем недавно только начинали секвенировать геномы простейших организмов (Haemophilus influenzae 1995г.) [1], а на сегодняшний день уже очень много полностью аннотированных геномов различных организмов (включая человека), они нуждаются в обработке, но работать с ними неудобно из-за различной длины геномов.
Поэтому придумали простой способ сократить разницу между геномами посредством перехода от полного текста к его частотному словарю. Это простой, но продуктивный прием, позволяющий единообразно работать с текстами различной длины, сравнивать их, производить информационный анализ.
Цель моей работы заключалась в выявлении наличия зависимости между таксономическими признаками и степенью нарушения второго правила Чаргаффа в геноме.
Были поставлены следующие задачи:
1. Составить базу данных геномов бактерий, архей, эукариот.
2. Сравнить, совпадают ли разделения на группы по коэффициентам невязки с таксономией.
1) Выявлена зависимость между коэффициентом невязки и таксономическим положением организмов. У организмов одного рода коэффициенты невязки принимают близкие значения. Корреляция между невязками разных порядков одного отдела выше, чем между невязками разных отделов.
2) Значение невязки падает экспоненциально с ростом толщины словаря, для любых организмов.