ВВЕДЕНИЕ 4
ГЛАВА 1. ПРОБЛЕМА СООТВЕТСТВИЯ СТРУКТУРЫ И ФУНКЦИИ СИСТЕМ, ВОЗНИКШИХ ЭВОЛЮЦИОННЫМ ПУТЕМ
1.1 ЭКСПЕРИМЕНТАЛЬНЫЕ ДАННЫЕ О СООТНОШЕНИИ СТРУКТУРЫ И ФУНКЦИИ
БИОЛОГИЧЕСКИХ СИСТЕМ 9
1.2 ФЕНОМЕНОЛОГИЧЕСКИЕ МОДЕЛИ - ИНСТРУМЕНТ ИССЛЕДОВАНИЯ СЛОЖНЫХ СИСТЕМ 12
1.3 СЕТИ КАК СПОСОБ ОПИСАНИЯ СЛОЖНЫХ СИСТЕМ 19
1.4 НЕЙРОННЫЕ СЕТИ 22
1.5. ЭВОЛЮЦИОННЫЙ ПРОЦЕСС КАК ПОИСК ЭКСТРЕМУМА ФУНКЦИИ ПРИСПОСОБЛЕННОСТИ 26
ГЛАВА 2. МАТЕРИАЛЫ И МЕТОДЫ 29
2.1. АЛГОРИТМИЧЕСКОЕ ОБЕСПЕЧЕНИЕ ГЕНЕРАЦИИ НЕЙРОСЕТЕВЫХ МОДЕЛЬНЫХ ОБЪЕКТОВ С ЗАДАННОЙ ФУНКЦИЕЙ 29
2.2 СТАНДАРТНЫЕ МЕТОДЫ ОЦЕНКИ СХОДСТВА СТРУКТУР НМО 37
2.3 МЕТОДЫ ПОИСКА ЛОКАЛЬНОЙ И ДИСКРЕТНОЙ СИММЕТРИЙ 38
2.4. КОНТРАСТИРОВАНИЕ НМО 39
2.5. ПОЛУЧЕНИЕ СТРУКТУР НЕЙРОСЕТЕЙ, СФОРМИРОВАННЫХ ПОД ДЕЙСТВИЕМ "МУТАЦИОННОГО ДАВЛЕНИЯ.” 39
2.6. ОБОЗНАЧЕНИЯ НЕЙРОСЕТЕЙ, ИСПОЛЬЗУЕМЫЕ В РАБОТЕ 40
2.7. ОПИСАНИЕ ПРОГРАММНОГО ПАКЕТА, ИСПОЛЬЗУЕМОГО В РАБОТЕ 41
ГЛАВА 3. РЕЗУЛЬТАТЫ ВЫЧИСЛИТЕЛЬНЫХ ЭКСПЕРИМЕНТОВ ПО СРАВНЕНИЮ СТРУКТУР НМО 47
3.1 РЕЗУЛЬТАТЫ СРАВНЕНИЯ СТРУКТУР НМО ПРИ ПОМОЩИ СТАТИСТИЧЕСКИХ И АЛГЕБРАИЧЕСКИХ МЕТОДОВ 47
3.2 ОЦЕНКИ СХОДСТВА СТРУКТУР НМО, ПОЛУЧЕННЫЕ ВЫЧИСЛЕНИЕМ ЕВКЛИДОВА
РАССТОЯНИЯ 50
РЕЗУЛЬТАТЫ И ВЫВОДЫ ГЛАВЫ 58
ГЛАВА 4. ТЕОРЕТИЧЕСКИЙ АНАЛИЗ МЕХАНИЗМОВ ФОРМИРОВАНИЯ КЛАСТЕРОВ 60
4.1 ЛОКАЛЬНАЯ СИММЕТРИЯ СТРУКТУР НМО, ВЫПОЛНЯЮЩИХ ОДИНАКОВЫЕ ФУНКЦИИ 61
4.2 ДИСКРЕТНАЯ СИММЕТРИЯ. ЧИСЛО КЛАСТЕРОВ, ФОРМИРУЕМЫХ СТРУКТУРАМИ
НМО 63
РЕЗУЛЬТАТЫ И ВЫВОДЫ ГЛАВЫ 65
ГЛАВА 5. ЭКСПЕРИМЕНТАЛЬНАЯ ПРОВЕРКА ЭКВИВАЛЕНТНОСТИ СТРУКТУР нмо, ВЫПОЛНЯЮЩИХ ОДИНАКОВЫЕ ФУНКЦИИ 66
5.1 ПРИМЕНЕНИЕ СИММЕТРИЧНЫХ ПРЕОБРАЗОВАНИЙ К НМО, ВЫПОЛНЯЮЩИМ ОДНУ И ТУ ЖЕ ФУНКЦИЮ 66
5.2 АНАЛИЗ МИНИМАЛЬНЫХ СТРУКТУР, ОБЕСПЕЧИВАЮЩИХ ВЫПОЛНЕНИЕ ДАННОЙ
ФУНКЦИИ 75
РЕЗУЛЬТАТЫ И ВЫВОДЫ ГЛАВЫ 77
глава 6. аналогии МЕЖДУ свойствами НМО И другими
СИСТЕМАМИ, ВОЗНИКШИМИ ЭВОЛЮЦИОННЫМ ПУТЕМ 79
ОСНОВНЫЕ РЕЗУЛЬТАТЫ И ВЫВОДЫ 83
ЗАКЛЮЧЕНИЕ 85
ЛИТЕРАТУРА 87
ПРИЛОЖЕНИЕ 94
ПАРАМЕТРЫ РАЗЛИЧНЫХ РЕЖИМОВ ОБУЧЕНИЯ 94
ЗНАЧЕНИЯ КОЭФФИЦИЕНТОВ КОРРЕЛЯЦИИ НМО 94
РАСПРЕДЕЛЕНИЕ СИНАПСОВ НМО 102
СРАВНЕНИЕ МАТРИЦ НМО 105
ПРИМЕРЫ ВЫЧИСЛЕНИЯ ПАРНЫХ РАССТОЯНИЙ ДЛЯ РАЗЛИЧНЫХ НМО 108
Примеры применения симметричных преобразований к структурам 6-ти нейронных НМО, выполняющим функцию A3 (сигмоидальная
ПЕРЕХОДНАЯ ХАРАКТЕРИСТИКА, АДФ) 112
Применение преобразований к структурам, выполняющим разные функции 122
Проблема развития является центральной проблемой биофизики сложных систем (Волькенштейн, 1978; Fontana, Schuster, 1998a), и один из ее аспектов состоит в непредсказуемости конкретного пути эволюции при его принципиальной неизбежности (Эйген, 1973). Недетерминированность эволюции связана с тем, что требуемая для выживания вида функция может реализовываться разными эволюционно возникшими структурами (Фокс, 1966; Мейен, 1974; Fontana, Schuster, 1998a, 1998b). Следовательно, одной из причин непредсказуемости пути и исхода эволюции является неоднозначность отношений "структура-функция" в эволюционно возникших системах.
В то же время известен определенный параллелизм в эволюции различных видов и родов, нашедший свое выражение в законе гомологичных рядов в наследственной изменчивости Н.И.Вавилова (Мейен, 1974). Возникает вопрос о существовании некоторой структурной общности у систем, выполняющих одну и ту же функцию, но сформированных на разных эволюционных траекториях. Если эта общность существует, то в определенном смысле можно говорить об эквифинальности (прогнозируемости) эволюции.
Проблема структурно-функционального соответствия в контексте эволюции может быть сформулирована следующим образом: "Существует ли нечто общее в эволюционно возникших структурах, выполняющих одну и ту же функцию, что отличает их от структур, реализующих другие функции?". Тем самым ставится вопрос о существовании функционального инварианта структуры. Практический аспект этой проблемы значим для молекулярной биологии, белковой инженерии и экологии и может быть сформулирован следующим образом: "Можно ли по известной структуре предсказать функцию биологической системы, и наоборот, построить или реконструировать структуру, выполняющую данную функцию?".
5
Исследованию общих свойств биологических систем препятствуют два основных фактора. Во-первых, это единственность эволюционных исходов, которая не позволяет проводить сравнительный анализ биологических структур (в распоряжении исследователей имеется только один вариант живого, реализовавшийся на Земле). Во-вторых, это чрезвычайная сложность реальных биологических объектов, которая приводит к невозможности учесть все то огромное количество взаимодействий элементов структуры, которое определяет функцию данного объекта.
Средством работы со сложными системами являются феноменологические модели, описывающие систему в общем, не детализируя ее. Феноменологические модели являются традиционным инструментом исследований в биофизике сложных систем (Волькенштейн, 1978). Они предназначены для ответа на принципиальные вопросы. Примеры таких исследований "по принципу" хорошо известны в физике и биофизике (Рашевский, 1968; фон Нейман, 1973; Эйген, 1973; Николис, Пригожин, 1979).
В соответствии с подходом биофизики сложных систем для исследования проблемы структурно-функционального соответствия нужно использовать предельно простую, "прозрачную", возможно даже абстрактную, феноменологическую модель. Если выделено некоторое общее для множества систем свойство, то исследование "по принципу" можно проводить на объектах различной природы. Задача заключается в подборе модели, в которой структурно-функциональные отношения, лежащие в основе реальных жизненных процессов, выражены наиболее выпукло.
В настоящее время развивается подход к исследованию сложных систем, основанный на моделях эволюционирующих сетей. Проводится сравнительный топологический анализ моделей сетей различной природы: метаболических путей, белок белковых взаимодействий; пищевых цепей экосистем; нервных сетей, энергетических систем; Интернета и т.п. (Barbasi, 1999; Amaral, et. all., 2000; Albert et. al, 2001; Jeong et.,al., 2001; Strogatz, 2001; Sanjay, Sandeep, 2001). Обнаружен ряд свойств, общих для этих сетей, что говорит о потенциально
6
широкой применимости сетевых моделей, к которым относятся и нейронные сети.
Развитие теории и практики нейронных сетей дает в руки исследователей инструмент моделирования с богатыми возможностями (Hopfield, 1982; Rumelhart, Hinton, Williams, 1986; Kohonen, 1982; Grossberg, 1988). Относительная простота обучения нейронных сетей позволяет создавать ансамбли из отдельных экземпляров нейросетей, выступающих в качестве нейросетевых модельных объектов (НМО), к которым применимы методы статистики и сравнительного анализа.
Сходство формального описания процессов эволюции и обучения нейронных сетей (Барцев, Гилев, Охонин, 1989; Wolpert, Macready, 1995; Stadler et.,al, 2000) позволяет использовать нейросетевую модель, как инструмент исследования эквифинальности эволюционных процессов. Тем более, что в практике использования нейронных сетей, существует проблема воспроизводимости вычислительных экспериментов, родственная проблеме эволюционной эквифинальности (Partridge, Yates, 1996).
Цель работы. На примере простых эволюционно сформированных систем, в роли которых используются нейронные сети, оценить сходство структур, выполняющих одинаковые и различные функции.
Для достижения поставленной цели необходимо было решить следующие задачи:
1. Разработать пакет программ для генерации и исследования нейросетевых моделей в контексте эволюции их структуры и функции.
2. Провести вычислительные эксперименты с ансамблями нейронных сетей для получения достаточного для статистической обработки количества данных.
3. Провести сравнительный анализ нейросетей, выполняющих одну и ту же и различные функции, при помощи различных статистических и теоретических инструментов.
7
4. Оценить применимость выводов, полученных на нейросетевых моделях, к реальным биологическим системам.
Научная новизна:
1. Предложен подход к исследованию общих свойств структурно¬функциональных отношений эволюционно возникших систем с помощью модельного объекта - ансамбля нейронных сетей;
2. Обнаружено, что структуры нейросетей, выполняющих одну и ту же функцию, образуют в пространстве структурных параметров обособленные скопления, кластеры. Показано, что структуры нейросетей, выполняющих одну и ту же функцию, могут различаться больше, чем структуры нейросетей, выполняющих разные функции.
3. На основе теоретического описания механизма формирования кластеров выявлены типы симметрий структур нейросетей, позволяющие свести все множество независимо сформированных нейросетей, выполняющих одну и ту же функцию, к любой нейросети из этого множества. Это указывает на существование функционального инварианта и функциональной симметрии структуры.
Полученные на НМО результаты выходят за рамки нейросетевого моделирования и могут использоваться двояко. С одной стороны, некоторые выводы относительно свойств нейронных сетей могут быть перенесены на реальные системы в той мере, в какой они соответствуют сетевому описанию. По крайней мере, эти выводы могут иметь вид предположений или гипотез о свойствах реальных систем. Об этом говорилось в шестой главе работы, где и сформулированы выводы-гипотезы. С другой стороны, из данной работы можно выделить своего рода алгоритм (пусть и эвристический), позволяющий понижать видимое разнообразие наблюдаемых биологических систем.
В работе показано, что структуры систем, состоящих из элементов одной природы и, выполняющих одну и ту же функцию, в принципе, сводимы к одной структуре. Вопрос в том, как от принципиальной возможности перейти к конкретной процедуре уменьшения разнообразия экспериментальных данных. На данном этапе исследований можно говорить только о проекте такой процедуры, некотором эвристическом алгоритме. Но даже эвристический алгоритм требует априорного обоснования его применимости. Алгоритм является формальной процедурой и это означает, что его можно применять к системам с подходящим этой процедуре формальным описанием.
Это описание должно органично включать структуру, функцию и принцип оптимальности, тесно связанный с понятием целесообразности биологической системы и ее эволюции (Волькенштейн, 1975; Блюменфельд, 1977). Под эволюционным процессом будет пониматься изменение структуры биологической системы в соответствии с некоторым функциональным критерием оптимальности (Forst et al., 1995; Schuster, 1996). По современным представлениям в основе эволюции лежат микромутационные процессы и процесс эволюции можно рассматривать как плавное движение по ландшафту
86
целевой функции приспособленности (Niklas, 1994, Huynen et al., 1996; Schuster, 1996).
То есть первый шаг алгоритма редукции сложности заключается в построении сетевого описания исследуемого класса систем.
Затем к выбранному формальному описанию системы с заданной функцией применяется известная процедура отыскания локальной группы преобразований (Ибрагимов, 1983), позволяющая непрерывным образом сводить одну функционирующую структуру к другой.
Знание вида инфинитезимального преобразования позволяет малыми шагами выделить подмножества сводимых друг к другу структур, выполняющих одну и ту же функцию.
Если выделяется несколько таких подмножеств, то с помощью сравнительного анализа отыскиваются дискретные симметрии относительно преобразований, переводящих эти подмножества в одно. В ряде случаев дискретные симметрии можно определить по виду формального описания ансамбля исследуемых биосистем. Уже есть примеры отыскания групп преобразований, то есть нахождения некоторого порядка в разнообразии данных для генетических последовательностей и макромолекул (Bellido, 1996; Blundell, Srinivasan, 1996; Zhang,1997; Sankoff, Blanchette, 1999; Goodsell, Olson, 2000).
Отыскание системы преобразований, сводящих огромное разнообразие, например экосистем, к ограниченному набору типов дало бы возможность объединения существующих разрозненных наблюдений природных экосистем в большие блоки, обеспечивающие высокую степень достоверности, что важно для построения адекватных моделей и надежного прогноза динамики этих систем.
1. Барцев С.И., Гилев С.Е., Охонин В.А. Принцип двойственности в организации адаптивных сетей обработки информации. В кн. Динамика химических и биологических систем. Новосибирск: Наука, 1989, с.6-55.
2. Барцев С.И., Охонин В.А. Адаптивные сети обработки информации. Препринт Ин-т физики СО АН СССР, №59Б, Красноярск, 1986, 20 с.
3. Барцев С.И., Охонин В.А. Адаптивные сети, функционирующие в непрерывном режиме. В кн. Эволюционное моделирование и кинетика. Новосибирск: Наука, 1992, с. 24- 30.
4. Бернал Дж.Д. Молекулярная структура, биохимическая функция и эволюция. В кн: Теоретическая и математическая биологи. М.: Мир, 1968, с.110-151.
5. Блюменфельд Л. А. Проблемы биологической физики. М.: Наука, 1977, 336 с.
6. Вейль Г. Симметрия. М.: Наука, 1969, 191с.
7. Волькенштейн М.В. Молекулярная биофизика. М.: Наука, 1975, 616 с.
8. Волькенштейн М.В. Общая биофизика. М.: Наука, 1978, 590 с.
9. Газарян К.Г., Белоусов Л.В. Биология индивидуального развития животных. М.: Высшая школа, 1983, 287с.
10. Глотов И.В., Животинский Л.А., Хованов И.В. и др. Биометрия. Л.: изд-во ЛГУ, 1982, 264 с.
11. Голованов И. Б., Иваницкий Г. Р., Цыганкова И.Г. Простая форма корреляционного соотношения и физико-химический смысл входящих в него параметров. // ДАН, 1998, т.359, №2, c. 258-262.
12. Горбань А.Н. Обучение нейронных сетей. М.:СП ПараГраф, 1990, 159 с.
13. Горбань А.Н. Обобщенная аппроксимационная теорема и вычислительные возможности нейронных сетей. // Сиб. Журн. Вычисл. Математики. РАН Сиб. Отд-ние, Новосибирск, 1998, т.1, №1, с.11-24.
14. Ибрагимов Н.Х. Группы преобразований в математической физике. М.: Наука, 1983, 280 с.
88
15. Кастлер Г. Возникновение биологической организации. М: Мир, 1967, с. 90.
16. Кимура М. Молекулярная эволюция: теория нейтральности. М.: Мир, 1985, 396 с.
17. Лакин Г.Ф. Биометрия М.: Высшая школа, 1980, 293 с.
18. Лима-де-Фариа А. Эволюция без отбора. Автоэволюция формы и функции. М.: Мир, 1991, 455с.
19. Любищев А.А. О критериях реальности в таксономии. В сб.: Информационные вопросы семиотики, лингвистики и автоматического перевода. М., ВИНИТИ, 1971, вып.1, с. 67-82.
20. Мандель И.Д. Кластерный анализ М.: Финансы и статистика, 1988, 176с.
21. Мармарелис П., Мармарелис В. Анализ физиологических систем. М.: Мир, 1981, 480 с.
22. Мейен С.В. О соотношении номогенетического и тихогенетического аспекта эволюции. // Журнал общей биологии, 1974, т. XXXV, №3, сс.353-364.
23. Мейен С.В., Соколов Б.С., Шрейдер Ю.А. Классическая и неклассическая биология. Феномен Любищева. // Вестник АН СССР, 1977, №10, сс.112-125.
24. Мейен С.В. Основные аспекты типологии организмов. // Журнал общей биологии, 1978, т.ХХХ1Х, №4, сс.495-509.
25. Мецлер Д. Биохимия. М.: Мир, т.2., 1980a, 606 с.
26. Мецлер Д. Биохимия. М.: Мир, т.3., 1980b, 488 с.
27. Моровиц Г. Исторический очерк. В кн.: Теоретическая и математическая биология. М.: Мир, 1968, с.34-48.
28. Николис Г., Пригожин И. Самоорганизация в неравновесных системах. М.: Мир, 1979, 512 с.
29.Охонин В.А. Вариационный принцип в теории адаптивных сетей. Красноярск, 1987, 18 с. (Препринт АН СССР. Сиб. Отделение. Ин-т физики; № 61 Б).
30. Петухов С.В. Биомеханика, бионика и симметрия. М.: Наука, 1981, 240 с.
31. Печуркин Н.С. Энергетические аспекты развития надорганизменных систем. Новосибирск: Наука, 1982, 113с.
89
32. Печуркин Н.С. Энергия и жизнь. Н.: Наука, Сибирское отделение, 1988,
189 с.
33. Попов Е.М. Структурная организация белка. М.: Наука, т.3 из пятитомника "Проблема белка", 1997, 604 с.
34. Рашевский Н. Модели и математические принципы в биологии. В кн.: Теоретическая и математическая биология. М.: Мир, 1968, сс.48-66.
35. Розен Р. Принципы оптимальности в биологии. М.: Мир, 1969, 216 с.
36. Романовский Ю.М., Степанова Н.В., Чернавский Д.С. Математическая биофизика. М.: Наука, 1984, 304 с.
37. Уайт А., Хендлер Ф., Смит Э., Хилл Р., Леман И. Основы биохимии. М.: Мир, 1981, т.2, 617с.
38. Урманцев Ю.А. Поли - и изоморфизм в живой и неживой природе. // Вопросы философии, 1968, №12, с.77-88.
39. Урманцев Ю.А. Симметрия природы и природа симметрии. М.: Мысль, 1974, 229 с.
40. Урманцев Ю.А. Что может дать биологу представление как системы в в системе объектов того же рода? // Журнал общей биологии, 1978, т.39, №5, с. 699-718.
41. Философский энциклопедический словарь. М.: Сов. энц., 1989, 603 с.
42. Фокс С. Происхождение предбиологических систем. М.: Мир, 1966, 362 с.
43. Фон Нейман Дж., закончено и отредактировано А. Бёрксом. Теория самовоспроизводящихся автоматов. М.: Мир, 1971, 382 с.
44. Хан Т., Шапиро С., Статистические модели в инженерных задачах, М.: Наука, 1975, 107 с.
45. Хорн Р., Джонсон Ч. Матричный анализ. М.: Мир. 1989, 655 с.
46. Худсон Д., Статистика для физиков., М.:Мир, 1967, 242 с.
47. Шпаков А.О. Внутренняя симметрия зеркального типа в нуклеотидных последовательностях генов, кодирующих различные классы белков. // ДАН, 2001, т.377, №2, с. 273-276.
90
48.Эйген М. Самоорганизация материи и эволюция биологических макромолекул М.: Мир, 1973, 216.
49. Albert R., Jeong H., Barabasi A. Error and attack tolerance of complex networks. // Nature, 2000,406, pp. 378-382.
50. Amaral L.A.N., Scala A., Barthelemy M., Stanley H.E. Classes of small-wold networks. // Proc. Natl. Acad. Sci., 2000, v.97, №21, pp.11149-11152.
51. Barabasi A.L., Reka A. Emergence of Scaling in Random Networks. // Science, 1999, v.286, pp. 509-512.
52. Bartsev S.I., Okhonin V.A., Variation principle and the algorithm of dual functioning: examples of applications, in "Neurocomputers and Attention", Manchester Univ. Press, 1991, pp.445-452.
53. Bartsev S.I., Okhonin V.A., Self-learning neural networks playing "Two coins", in "Neurocomputers and Attention", Manchester Univ. Press, 1991, pp.453-458.
54. Belido A.G. Symmetries Throughout organic evolution. // Proc. Natl. Acad. Sci., 1996, v.93, pp. 14229-14232.
55. Blundell T.L., Srinivasan N. Symmetries, stability, and Dynamics of multidomain and multicomponent protein systems. // Proc. Natl. Acad. Sci., 1996, v.93, pp. 14243-14248.
56. Derome J.R. Biological similarity and group theory. // J. Theor. Biol., 1977, v.65, №2, pp. 366-378.
57. Ermentrout G.B. and Edelstein-Keshet L. Cellular automata approaches to biological modeling.// Journal of Theoretical Biology, 160:97-133, 1993.
58. Fitch W.M. Rate of change of concomitantly variable codons. //J. Mol. Evol., 1971, v.2, P. 84-96.
59. Fontana W., Shuster P. Continuity in Evolution: jn the Nature of Transition. // Science, 1998a, v. 280, pp. 1454-1455.
60. Fontana W. and Shuster P. Shaping Space: The Possible and the Attainable in RNA Genotype-Phenotype Mapping. // J. Theor. Biol., 1998b, №194, pp. 491¬515.
91
61. Forst C.V., Reidys C., Weber J. Evolutionary Dynamics and Optimization. // Advances in Artificial Life, v.929, pp.128-147, 1995.
62. Goodsell D.S., Olson A.J. Structural symmetry and protein function. // Annu Rev. Biophys. Biomol. Struct., 2000, no. 29, pp. 105-153.
63. Grossberg S. Nonlinear neural networks: principles, mechanisms, and architectures. // Neural Network, v.4, 1988, pp. 17-61.
64. Hopfield J.J. Neural networks and physical systems with emergent collective computational abilities. // Proc. Nat. Acad. Sci. USA, v.79, 1982, pp.2554-2558.
65. Huynen M.A., Stadler P.F., Fontana W. Smoothness within ruggedness: The role of neutrality in adaptation. // Proc. Natl. Acad. Sci. USA v.93, pp.397-401, 1996.
66. Kimura M. Recent development of the neutral theory viewed from the Wrightian tradition of theoretical population genetics. // Proc. Natl. Acad. Sci. USA, 1991, v.88, pp. 5969-5973.