Тип работы:
Предмет:
Язык работы:


ИССЛЕДОВАНИЕ ПРИМЕНЕНИЯ НЕЙРОННЫХ СЕТЕЙ ДЛЯ РЕШЕНИЯ ЗАДАЧИ ПОИСКА АТОМ-АТОМНОГО ОТОБРАЖЕНИЯ ХИМИЧЕСКОЙ РЕАКЦИИ

Работа №39004

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы103
Год сдачи2019
Стоимость4900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
154
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1. Обзор методов решения задачи построения атом-атомного отображения
химической реакции 6
1.1. Алгоритмы фрагментной сборки 6
1.2. Алгоритмы нахождения общей подструктуры 6
1.3. Оптимизационные алгоритмы 7
1.4. Алгоритмы целочисленной линейной оптимизации 8
1.5. Алгоритмы машинного обучения 9
2. Теоретические основы нейронных сетей 11
2.1. Понятие о нейронных сетях 11
2.2. Топологии нейронных сетей 13
2.3. Методы обучения 18
3. Нейронные сети для решения задачи построения атом-атомного
отображения химической реакции 21
3.1. Многослойный персептрон 22
3.2. Модель сверточно-разверточной сети 26
3.3. Модель Atom2Vec 27
3.4. Модель Transformer 28
4. Анализ результатов 32
4.1. Многослойный персептрон 33
4.2. Модель сверточно-разверточной сети 35
4.3. Модель Atom2Vec 36
4.4. Модель Transformer 38
ЗАКЛЮЧЕНИЕ 39
СПИСОК ЛИТЕРАТУРЫ 40
ПРИЛОЖЕНИЕ 1. Описание классов для хранения
информации 43
ПРИЛОЖЕНИЕ 2. Выгрузка данных из rdf-файла 61
ПРИЛОЖЕНИЕ 3. Реализация персептрона 63
ПРИЛОЖЕНИЕ 4. Сверточно-разверточная сеть 70
ПРИЛОЖЕНИЕ 5. Конфигурация сверточно-разверточной сети 77
ПРИЛОЖЕНИЕ 6. Модель кодировок позиций 78
ПРИЛОЖЕНИЕ 7. Модель Transformer 85
ПРИЛОЖЕНИЕ 8. Конфигурация нейронных сетей 102


Рассматриваемая в данной работе тема относится к области хемоинформатики - науки, которая образовалась на стыке химии и информатики около 40 лет назад. Для исчерпывающего описания поставленной задачи необходимо дать определения основным понятиям, которые относятся к данной тематике [1].
Самое основное определение - это процесс, над которым ставится задача.
«Химическая реакция — превращение одного или нескольких исходных веществ (реагентов) в другие вещества, при которых ядра атомов не меняются, при этом происходит перераспределение электронов и ядер, и образуются новые химические вещества» [2].
Понимание того, как протекает реакция и что именно изменяется в реагентах, является ключевым для использования информации, получаемой в ходе таких реакций. Немаловажный момент для достижения данного понимания - это определение точных местоположений каждого атома исходных продуктов после реакции.
Наиболее точным методом для установления всех местоположений является ЯМР-спектроскопия, но, так как этот метод экспериментальный, он используется редко в связи с высокими трудовыми и денежными затратами.
Еще одним способом определения местоположений атомов является задача атом-атомного отображения, которая и лежит в основе данного исследования.
Атом-атомное отображение (ААО) - это процедура установления соответствия атомов исходных реагентов и продуктов реакции в соответствии с механизмом реакции. Данные об ААО используются для определения изменяющейся части молекулы реагента и продукта - реакционного центра [3]. На рисунке 1 отображен пример ААО одной из химической реакции. Цифрами в левой и правой частях реакции обозначены соответствующие атомы.
Задача поиска ААО является NP-полной, т.е. может потребовать много времени для ее решения. Поиск корректного ААО играет значительную роль в хемоинформатике и используется для решения следующих задач [3-9]:
— классификация реакций,
— составление баз данных химических реакций,
— изучение механизмов реакций,
— открытие новых классов реакций,
— моделирование.
Целью данной работы является апробация нейронных сетей различных топологий с соответствующими постановками и представлениями входных и выходных данных реакций для понимания целесообразности и возможности их применения. В задачи данной работы входит:
1) Составление набора постановок задачи ААО для применения нейронных сетей при решении;
2) Подбор нейронных сетей различных топологий для решения поставленной задачи;
3) Исследование возможности и качества применения подобранных нейронных сетей для решения поставленной задачи.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Данная работа, содержащая в себе нестандартный подход к представлению входных данных, предоставляет базовый фундамент для дальнейших исследований возможностей решения задачи ААО различными нейронными сетями. Как и предполагалось, задача нахождения ААО нетривиальна, чтобы решать ее с помощью простых моделей, что было проверено опытным путем.
Ключевым моментом всей работы является тот факт, что в ходе исследований удалось создать модель представления атомов, которая имеет фиксированную размерность и которая содержит в себе семантику, описывающую процессы реакций. В ходе работы наибольшие затруднения возникали именно с формулировкой задачи таким образом, чтобы было возможно применить ту или иную нейронную сеть. Созданное фиксированное векторное представление атомов открывает множество вариаций для новых постановок не только задачи ААО, но и других задач, в которых используется информация об атомах. Также нужно отметить, что данное представление было получено на сравнительно небольшой выборке при помощи метода, разработанного в 2013 году. На данный момент были представлены гораздо более продвинутые методы в сфере обработки естественного языка, которые могут быть применены к атомам аналогичным описанному в данной работе образом.
Были рассмотрены как и простые «прямые» подходы, так и более сложные постановки задачи. Полученные результаты показывают, что использование нейронных сетей для прогнозирования состояний атомов после реакции обосновано и вполне может быть доработано до состояния, когда построенные модели будут давать более высокую точность.



1. Ханин, А.Р. Исследование применения нейронных сетей для решения задачи поиска атом-атомного отображения химической реакции: курсовая работа [Текст]/ А.Р.Ханин. - Казань: КФУ, 2018. - 44 с.
2. Эмануэль Н. М Курс химической кинетики. [Текст]/ Эмануэль Н. М., Кнорре Д. Г. // 4-е изд., переработанное и дополненное. — М.: Высшая школа, 1984. — 48 с.
3. Chen, W.L. Automatic reaction mapping and reaction center detection. [Текст]/ W.L. Chen, D.Z. Chen, K.T. Taylor // Wiley Interdiscip. Rev. Comput. Mol. Sci. - 2013. - V. 3. - Is. 6. - P. 560-593.
4. Varnek, A. Substructural fragments: an universal language to encode reactions, molecular and supramolecular structures. [Текст]/ A. Varnek, D. Fourches, F. Hoonakker, V.P. Solov’ev // J. Comput. Aided. Mol. Des. - 2005. - V. 19. - Is. 9-10. - P. 693-703.
5. Vleduts, G.E. Concerning one system of classification and codification of organic reactions [Текст] / G.E. Vleduts // Inf. Storage Retr. - 1963. - V. 1. - Is. 2-3. - P. 117-146.
6. Gasteiger, J. Handbook of Chemoinformatics [Текст]/ J. Gasteiger // Weinheim: Wiley-VCH Verlag GmbH. - 2003.
7. Madzhidov, T.I. Structure-reactivity relationships in terms of the condensed graphs of reactions [Текст]/ T.I. Madzhidov, P.G. Polishchuk, R.I. Nugmanov, A. V. Bodrov, A.I. Lin, I.I. Baskin, A. Varnek, I.S. Antipin // Russ. J. Org. Chem. - 2014. - V. 50. - Is. 4. - P. 459-463.
8. Kraut, H. Algorithm for Reaction Classification [Текст]/ H. Kraut, J. Eiblmaier, G. Grethe // J. Chem. Inf. Model. - 2013.
9. Bawden, D. Classification of chemical reactions: potential, possibilities and continuing relevance [Текст]/ D. Bawden // J. Chem. Inf. Model. - 1991. - V. 31. - Is. 2. - P. 212-216.
10. Маджидов, Т.И. Хемоинформатика. Конспект лекций [Текст]/ Т.И. Маджидов, И.И. Баскин, А.А. Варнек; Каз.федер.ун-т. - Казань, 2014. - 137 с.
11. Lynch, M.F. The production of machinereadable descriptions of chemical reactions using Wiswesser line notations. [Текст]/ M.F.Lynch, P.Willett// J Chem. Inf. Comput. Sci. - 1978. - V.18 - P.149-154.
12. Raymond, J.W. Maximum common subgraph isomorphism algorithms for the matching of chemical structures. [Текст]/ J.W. Raymond, P. Willett.// J. Comput. Mol. Des. - 2002. - V. 16. - No. 7. - P.521-533.
13. Lynch, M.F. The Automatic Detection of Chemical Reaction Sites [Текст]/ M.F. Lynch, P. Willett // J. Chem. Inf. Model. - 1978. - V. 18. - Is. 3. - P. 154-159.
14. Jochum, C. The Principle of Minimum Chemical Distance(PMCD) [Текст]/ C. Jochum, J. Gasteiger, I. Ugi // Angew. Chemie Int. Ed. English. - 1980. - V. 19. - Is. 7. - P. 495-505.
15. Akutsu T. Efficient extraction of mapping rules of atoms from enzymatic reaction data [Текст]/ Akutsu T. // Comoput Biol - 2004 - P.449-462.
16. First, E.L. Stereochemically consistent reaction mapping and identification of multiple reaction mechanisms through integer linear optimization. [Текст] / E.L. First, C.E. Gounaris, C.A. Floudas // J. Chem. Inf. Model. - 2012. - V. 52. - Is. 1. - P. 84-92.
17. Мухин Н.В. Разработка и исследование алгоритмов классификации
атом-атомных отображений химических реакций: магистерская
диссертация [Текст] / Каз.федер.ун-т. - Казань, 2017. - 59 с.
18. Хайруллина А.И. Разработка подхода для поиска атом-атомного отображения в химических реакциях с использованием машинного обучения: магистерская диссертация [Текст] / Каз.федер.ун-т. - Казань, 2017. - 34 с.
19. Matthew D. Zeiler. Deconvolutional Networks [Электронный ресурс] - URL: https ://cs. nyu. edu/~fergus/drafts/utexas2. pdf (дата обращения 25.12.2018. )
20. Tomas Mikolov. Efficient Estimation of Word Representations in Vector Space [Текст] / Tomas Mikolov, Kai Chen, Greg Corrado, Jeffrey Dean - 2013. - P.12.
21. Vaswani, Ashish. Attention Is All You Need [Текст] / Vaswani, Ashish, Noam Shazeer, Niki Parmar, Jakob Uszkoreit, Llion Jones, Aidan N. Gomez, Lukasz Kaiser and Illia Polosukhin // NIPS - 2017 - P.15.
22. Ханин А.Р. Отчет по производственной практике [Текст] / А.Р.Ханин. - Казань: КФУ, 2018. - 11 с.
23. Ханин А.Р. Отчет по производственной практике [Текст] / А.Р.Ханин. - Казань: КФУ, 2019. - 13 с.


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ