📄Работа №180526

Тема: ПРИМЕНЕНИЕ ГЕНЕРАТИВНЫХ МОДЕЛЕЙ ДЛЯ УЛУЧШЕНИЯ РАСПОЗНАВАНИЯ ВТОРИЧНЫХ СТРУКТУР ДНК

📝

Тип работы Бакалаврская работа

📚

Предмет информатика

📄

Объем: 47 листов

📅

Год: 2024

👁️

4400 руб.

🛒 Купить работу

Не подходит эта работа?
Закажите новую по вашим требованиям

Узнать цену на написание

ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить

📋 Содержание

АННОТАЦИЯ 3
ВВЕДЕНИЕ 3
1 Анализ предметной области 4
1.1 Нуклеотид 4
1.2 Первичная структура ДНК 5
1.3 Вторичная структура ДНК 6
1.4 Методы аннотации ДНК 12
2 Набор данных 15
2.1 HG Kouzine 15
2.2 MM Chipseq 16
3 Моделирование 17
3.1 Подготовка данных 17
3.2 Диффузионный процесс 17
3.3 Архитектура нейронной сети 21
4 Оценка качества генерации 26
4.1 Содержание GC 26
4.2 Критерий Хи квадрат 27
4.3 ZDNABERT 30
4.4 Векторы признаков ДНК 32
4.5 Начальное расстояние Фреше 33
4.6 Визуализация распределений 37
ЗАКЛЮЧЕНИЕ 40
ЛИТЕРАТУРА 41

📖 Введение

ДНК является жизненно важной молекулой для всех живых организмов, храня и передавай генетическую информацию. Вторичная структура ДНК может приобретать различные формы, такие как A-ДНК, B-ДНК, Z-ДНК, H- ДНК. B-ДНК в геномах организмов находится в гораздо большем количестве, чем другие формы. Однако вторичные структуры, отличные от B-ДНК, играют важную роль в регуляции процессов живых организмов.
На данные момент существуют лабораторные методы, которые позволяют размечать ДНК последовательности. Но для таких методов требуются дорогостоящие реагенты и материалы. С развитием машинного обучения появились более дешёвые компьютерные методы аннотирования ДНК последовательностей.
Существующие подходы машинного обучения к распознаванию вторичных структур ДНК полагаются на данные с незначительным содержанием отличных от B-формы структур ДНК и поэтому страдают от дисбаланса классов. Из-за дисбаланса модели машинного обучения не могут с большой точностью распознать миноритарный класс последовательности ДНК, что приводит к плохой производительности и уменьшению сферы использования таких моделей.
Целью данного исследования является разработка нового метода для генерации правдоподобных вторичных структур ДНК для дополнения миноритарных классов в наборах данных без нарушения их структурной целостности. Такой подход позволит увеличить количество последовательностей в миноритарных классах, что, как ожидается, улучшит точность распознавания вторичных структур ДНК, отличных от B-ДНК.

✅ Заключение

Результаты проведённой работы продемонстрировали, что предложенный метод генерации последовательностей вторичных структур ДНК способен создавать последовательности, схожие с реальными и при этом сохраняющие важные структурные характеристики.
Сгенерированные последовательности ДНК имеют схожее содержание GC-нуклеотидов с реальными данными. Кроме того, сгенерированные последовательности отличаются от реальных данных в небольшой степени, что свидетельствует об их схожести.
В случае Z-ДНК для HG Kouzine сгенерированные последовательности также обладают схожими характеристиками с реальными последовательностями. Результаты показывают, что сгенерированные последовательности содержат Z-ДНК, хотя её содержание ниже, чем в реальных данных.
Для MM Chipseq несмотря на удовлетворительную генерацию ДНК, Z- ДНК сгенерированные последовательности значительно отличаются от реальных Z-ДНК. Что, возможно, может быть связано с тем, что в обучающих данных многие последовательности, помеченные как Z-ДНК, схожи с B-ДНК, поэтому модель воспринимает их неправильно.
Результаты данного исследования свидетельствуют о том, что предложенный метод генерации последовательностей ДНК разного типа может быть эффективным инструментом для устранения дисбаланса классов в наборах данных для распознавания вторичных структур ДНК и потенциально может улучшить качество моделей классификации.

Нужна своя уникальная работа?

Срочная разработка под ваши требования

Рассчитать стоимость

ИЛИ

Поиск аналога

📕 Список литературы

🖼 Скриншоты

Содержание и часть введения к бакалаврской работе

🛒 Оформить заказ

⚡ Работу высылаем в течении 5 минут после оплаты.

Имя

E-mail

Телефон

Дополнительная информация

С условиями приобретения работы согласен

📋 Содержание 📖 Введение ✅ Заключение 📕 Литература 🖼 Скриншоты 🔍 Похожие 🛒 Купить ⬆️

Оценка стоимости

Предмет *

Тип работы *

Объем работы *

Срок выполнения *

Это краткая форма заказа. После ее заполнения вы перейдете на полную форму заказа работы

Каталог работ (208538)

Статьи

»» Все статьи

Вход в личный кабинет