Тема: ИССЛЕДОВАНИЕ СТАТИСТИЧЕСКИХ СВОЙСТВ СИМВОЛЬНЫХ ПОСЛЕДОВАТЕЛЬНОСТЕЙ ПО НАБОРАМ НАИКРАТЧАЙШИХ «ПОТЕРЯННЫХ» СТРОК
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1 6
Глава 2 8
Глава 3 10
Список использованных источников 36
Приложение А 37
📖 Введение
Задач, связанных с символьными последовательностями, можно придумать очень много, например, выделение упорядоченности, подсчет статистики различных комбинаций символов, и т.п. Тем не менее, в этой работе будет освещено в частном порядке именно анализ ДНК. Какую бы задачу мы ни решали в связи с анализом ДНК, в конечном итоге она почти наверняка сводится к изучению частотного словаря. Носитель частотного словаря - это все символьные последовательности определенного количества символов; в данной работе назовем их словами. Если каждому такому слову сопоставить натуральное число его копий включая нуль, получится конечный словарь. А если число копий заменить на частоту их появления, то есть число копий данного слова, деленное на сумму чисел копий всех слов, то получится частотный словарь. Рано или поздно наверняка какие-то достаточно длинные слова из носителя пропадут, то есть число копий слов будет равно нулю. Назовем их «потерянными» словами.
Целью данной работы было выявить связи вышеназванных «потерянных» слов с таксономией, то есть положением в живом мире, и другими биологическими показателями. Предмет исследования включает в себя списки «потерянных» слов и их свойства: насколько состав списков связан с конкретными организмами (или группой организмов) и насколько он связан со специфическими (короткими) последовательностями, играющими важную регуляторную роль. Объектом являются комбинаторные и статистические свойства таких «потерянных» слов. То есть рассматривается состав слов, «потерянных» определенными последовательностями, и их таксономия.
Задачами магистерской работы были:
- написание программы, вычисляющую список «потерянных» слов,
- подбор релевантного генетического материала (геномы подходящих организмов),
- обработка этого материала, анализ полученных списков слов (их подобие у разных организмов, связь с GC-контентом и прочее) и выявление связи установленных списков потерянных слов с таксономией носителей соответствующих последовательностей.



