МОДЕЛИРОВАНИЕ САЙТОВ РЕСТРИКЦИИ НА ОСНОВЕ КОМБИНАТОРНЫХ СВОЙСТВ ОЛИГОНУКЛЕОТИДОВ
|
ВВЕДЕНИЕ 4
ОБЗОР ЛИТЕРАТУРЫ 7
1 Характеристика и классификация сайтов рестрикции и рестриктаз 7
1.1 Рестриктаза 8
1.1.1 Рестриктаза второго типа 10
1.1.2 Изошизомеры 11
1.1.3 Неошизомеры 11
1.1.4 Изокаудомеры 11
1.1.5 Прототип 11
1.1.6 Звёздная активность 12
1.2 Сайт рестрикции 13
1.2.1 Палиндромные и непалиндромные последовательности 14
1.3 Метилирование 15
1.4 Клонирование и к чему оно ведет 17
1.5 Эволюция рестриктаз второго типа 20
2 Материалы и методы 21
2.1 База данных REBASE NEB 21
2.2 Метод оценивания «силы» дуплетов 21
2.3 RSSP сравнение двух последовательностей 26
2.4 Филогенетическое исследование рестриктаз и сайтов рестрикции 28
2.5 Расстояние Хэмминга, Левенштейна и Дамерау - Левенштейна 29
2.6 Определение частот замен нуклеотидов на основе геномов 10
штаммов Escherichia coli 30
3 Результаты 31
3.1 Палиндромные шестибуквенные последовательности 31
3.2 Непалиндромные шестибуквенные последовательности 37
3.3 Филогенетическое дерево шестибуквенных рестриктаз на основе
нуклеотидного состава и вычисление редакционного расстояния 40
3.4 Определение частот замен нуклеотидов на основе геномов 10
штаммов Escherichia coliи применение для вычисления редакционного расстояния филогенетически родственных рестриктаз 49
3.5 Филогенетическое дерево шестибуквенных рестриктаз на основе таксономии 57
4. Обсуждения 63
ЗАКЛЮЧЕНИЕ 65
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 66
ПРИЛОЖЕНИЕ A 74
ПРИЛОЖЕНИЕ B 78
ОБЗОР ЛИТЕРАТУРЫ 7
1 Характеристика и классификация сайтов рестрикции и рестриктаз 7
1.1 Рестриктаза 8
1.1.1 Рестриктаза второго типа 10
1.1.2 Изошизомеры 11
1.1.3 Неошизомеры 11
1.1.4 Изокаудомеры 11
1.1.5 Прототип 11
1.1.6 Звёздная активность 12
1.2 Сайт рестрикции 13
1.2.1 Палиндромные и непалиндромные последовательности 14
1.3 Метилирование 15
1.4 Клонирование и к чему оно ведет 17
1.5 Эволюция рестриктаз второго типа 20
2 Материалы и методы 21
2.1 База данных REBASE NEB 21
2.2 Метод оценивания «силы» дуплетов 21
2.3 RSSP сравнение двух последовательностей 26
2.4 Филогенетическое исследование рестриктаз и сайтов рестрикции 28
2.5 Расстояние Хэмминга, Левенштейна и Дамерау - Левенштейна 29
2.6 Определение частот замен нуклеотидов на основе геномов 10
штаммов Escherichia coli 30
3 Результаты 31
3.1 Палиндромные шестибуквенные последовательности 31
3.2 Непалиндромные шестибуквенные последовательности 37
3.3 Филогенетическое дерево шестибуквенных рестриктаз на основе
нуклеотидного состава и вычисление редакционного расстояния 40
3.4 Определение частот замен нуклеотидов на основе геномов 10
штаммов Escherichia coliи применение для вычисления редакционного расстояния филогенетически родственных рестриктаз 49
3.5 Филогенетическое дерево шестибуквенных рестриктаз на основе таксономии 57
4. Обсуждения 63
ЗАКЛЮЧЕНИЕ 65
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 66
ПРИЛОЖЕНИЕ A 74
ПРИЛОЖЕНИЕ B 78
На сегодняшний день актуальность сайтов рестрикции заметно упала, комплекс рестриктаз и сайтов рестрикции воспринимают как средство для молекулярных изысканий, но, по непонятным причинам, значимость самих сайтов не раскрыта до сих пор. Практически все манипуляции в генной инженерии и молекулярной биологии, в генетическом анализе и гомологичных областях невозможны без использования сайтов рестрикции и рестриктаз для разрезания последовательностей и внедрения других фрагментов генетической манипуляции.
Начало эпохи генетических манипуляций можно назвать во времена открытия сайтов рестрикции и рестриктаз, лекция о которых была прочитана 8 декабря 1978 года учеными Гамильтоном Смитом (Hamiltom Smith) и Дениэлем Натансом (Daniel Nathans) на вручении Нобелевской премии. В то время комплекс сайтов рестрикции и рестриктаз считали исключительно бактериальной функцией защиты от чужеродной ДНК путем измельчения этой самой плазмиды - кольцевого участка ДНК бактерий, которые они внедряют в чужеродные клетки для распространения своего влияния, - и ее полной инактивации. Дальнейшее изучение позволило применить данные системы в перечисленных выше отраслях и значительно продвинуло научный прогресс.
Рестриктазы быстро завоевали внимание в связи с возможностью лечения вируса иммунодефицита и некоторых других заболеваний, распространяющихся вирусами или бактериями. Исследования сайтов рестрикции позволяет проводить модификации организмов в отраслях, как генная инженерия, на счет особенностей функционирования комплексов рестриктаза - сайт рестрикции. Работы последних лет указывают на возможности регуляции этих процессов in vivo, за счет внедрения известных ныне генов рестриктаз и близких им белков для контроля над процессами. Однако, интерес, проявленный непосредственно к сайтам рестрикции, невелик - по сравнению с рестриктазами. Изучение закономерностей и свойств сайтов рестрикции может дать толчок в понимании механизмов узнавания и работы комплексов, возможности предсказания последовательностей.
Актуальность работы обусловлена как малой изученностью комбинаторных свойств сайтов рестрикции на основе их нуклеотидной последовательности, так и важностью задачи выявления связи структуры и функции на примере этих объектов, что позволит определять новые сайты рестрикции исключительно исходя из последовательностей уже известных. Дальнейшее моделирование сайтов рестрикции на основе их комбинаторных свойств может значительно упростить такие повседневно важные действия, как, например, секвенирование ДНК, ведь перед непосредственно секвенированием необходимо последовательность разрезать в определенных местах - сайтах.
Мы хотим определить почему некоторые палиндромные последовательности являются сайтами рестрикции, а иные палиндромные последовательности, хоть их и намного меньше, не являются таковыми. Проводимое сравнение непалиндромных и близких к ним палиндромных последовательностей с минимальным количеством изменений в нуклеотидном составе может привнести ясность к объяснению наличия непалиндромных сайтов рестрикции. Так же на данный момент не объяснима тенденция популярности CG-островов в сайтах рестрикции (палиндромы с аденозином и тимином встречаются много реже в списках сайтов рестрикции, чем последовательности с повышенным содержанием CG- отсровов). Это может быть связано с важностью разрезания кодирующих частей плазмид, в которых больше CG-островов, но применимо ли данное заключение к плазмидам бактериальным неизвестно.
Объектом выпускной бакалаврской работы являются известные на сегодняшний момент сайты рестрикции и соответствующие им рестриктазы.
Целью выпускной бакалаврской работы является изучение комбинаторных свойств олигонуклеотидов, входящих в состав палиндромных и непалиндромных сайтов рестрикции, не включающих в себя вырожденные основания.
Исходя их поставленной цели были определены следующие задачи:
1. Составление частотных словарей палиндромных и непалиндромных сайтов рестрикции;
2. Сравнительное изучение свойств палиндромных и непалиндромных последовательностей сайтов рестрикции без учета вырожденных оснований;
3. Выявление оптимальных цен модификаций для вычисления редакционного расстояния;
4. Реализация классификации сайтов рестрикции в зависимости от набора коротких нуклеотидных последовательностей и их комбинаторных свойств;
Работа выполнена на базе кафедры биофизики Института Фундаментальной Биологии и Биотехнологии Сибирского Федерального Университета
Начало эпохи генетических манипуляций можно назвать во времена открытия сайтов рестрикции и рестриктаз, лекция о которых была прочитана 8 декабря 1978 года учеными Гамильтоном Смитом (Hamiltom Smith) и Дениэлем Натансом (Daniel Nathans) на вручении Нобелевской премии. В то время комплекс сайтов рестрикции и рестриктаз считали исключительно бактериальной функцией защиты от чужеродной ДНК путем измельчения этой самой плазмиды - кольцевого участка ДНК бактерий, которые они внедряют в чужеродные клетки для распространения своего влияния, - и ее полной инактивации. Дальнейшее изучение позволило применить данные системы в перечисленных выше отраслях и значительно продвинуло научный прогресс.
Рестриктазы быстро завоевали внимание в связи с возможностью лечения вируса иммунодефицита и некоторых других заболеваний, распространяющихся вирусами или бактериями. Исследования сайтов рестрикции позволяет проводить модификации организмов в отраслях, как генная инженерия, на счет особенностей функционирования комплексов рестриктаза - сайт рестрикции. Работы последних лет указывают на возможности регуляции этих процессов in vivo, за счет внедрения известных ныне генов рестриктаз и близких им белков для контроля над процессами. Однако, интерес, проявленный непосредственно к сайтам рестрикции, невелик - по сравнению с рестриктазами. Изучение закономерностей и свойств сайтов рестрикции может дать толчок в понимании механизмов узнавания и работы комплексов, возможности предсказания последовательностей.
Актуальность работы обусловлена как малой изученностью комбинаторных свойств сайтов рестрикции на основе их нуклеотидной последовательности, так и важностью задачи выявления связи структуры и функции на примере этих объектов, что позволит определять новые сайты рестрикции исключительно исходя из последовательностей уже известных. Дальнейшее моделирование сайтов рестрикции на основе их комбинаторных свойств может значительно упростить такие повседневно важные действия, как, например, секвенирование ДНК, ведь перед непосредственно секвенированием необходимо последовательность разрезать в определенных местах - сайтах.
Мы хотим определить почему некоторые палиндромные последовательности являются сайтами рестрикции, а иные палиндромные последовательности, хоть их и намного меньше, не являются таковыми. Проводимое сравнение непалиндромных и близких к ним палиндромных последовательностей с минимальным количеством изменений в нуклеотидном составе может привнести ясность к объяснению наличия непалиндромных сайтов рестрикции. Так же на данный момент не объяснима тенденция популярности CG-островов в сайтах рестрикции (палиндромы с аденозином и тимином встречаются много реже в списках сайтов рестрикции, чем последовательности с повышенным содержанием CG- отсровов). Это может быть связано с важностью разрезания кодирующих частей плазмид, в которых больше CG-островов, но применимо ли данное заключение к плазмидам бактериальным неизвестно.
Объектом выпускной бакалаврской работы являются известные на сегодняшний момент сайты рестрикции и соответствующие им рестриктазы.
Целью выпускной бакалаврской работы является изучение комбинаторных свойств олигонуклеотидов, входящих в состав палиндромных и непалиндромных сайтов рестрикции, не включающих в себя вырожденные основания.
Исходя их поставленной цели были определены следующие задачи:
1. Составление частотных словарей палиндромных и непалиндромных сайтов рестрикции;
2. Сравнительное изучение свойств палиндромных и непалиндромных последовательностей сайтов рестрикции без учета вырожденных оснований;
3. Выявление оптимальных цен модификаций для вычисления редакционного расстояния;
4. Реализация классификации сайтов рестрикции в зависимости от набора коротких нуклеотидных последовательностей и их комбинаторных свойств;
Работа выполнена на базе кафедры биофизики Института Фундаментальной Биологии и Биотехнологии Сибирского Федерального Университета
В ходе работы был составлен частотный словарь палиндромных сайтов рестрикции, включающие в себя 110 последовательностей, 68 из которых вошла в финальный вариант словаря. Остальные последовательности, являясь изошизомерами прототипа, имеющие незначительные отличия от последних. В это словарь вошло 34 прототипа, 10 более изученных изошизомеров, заменивших малоизученные прототипы, и 14 неошизомеров. Был построен частотный словарь непалиндромных последовательностей, включающий в себя 22 последовательности, из которых 16 являются прототипами, 4 - изошизомерами и 2 - неошизомерами.
Сайты рестрикции были рассмотрены с точки зрения эволюции посредством построения филогенетического дерева, основанного на генах, кодирующих рестриктазы, и исходя из таксономии. Таксономические изыскания не привнесли ясности в работу.
Предложены оптимальные цены модификаций для попарного сравнения последовательностей бактериальной природы, исходя из данных вероятностей нуклеотидных замен в консервативных фрагментах десяти геномов кишечной палочки. Данный метод успешно применен к парам сайтов, сгруппировавшихся в филогенетическом исследовании.
Сайты рестрикции были рассмотрены с точки зрения эволюции посредством построения филогенетического дерева, основанного на генах, кодирующих рестриктазы, и исходя из таксономии. Таксономические изыскания не привнесли ясности в работу.
Предложены оптимальные цены модификаций для попарного сравнения последовательностей бактериальной природы, исходя из данных вероятностей нуклеотидных замен в консервативных фрагментах десяти геномов кишечной палочки. Данный метод успешно применен к парам сайтов, сгруппировавшихся в филогенетическом исследовании.



