ВВЕДЕНИЕ 3
ГЛАВА 1. ЭМОЦИОНАЛЬНАЯ ОЦЕНКА И МЕТОД ВРЕМЕННОЙ
РАЗНИЦЫ 5
1.1 Эмоциональная оценка 5
1.2 Постановка задачи обучения с подкреплением 7
1.3 Метод временной разницы (TD-learning) 8
ГЛАВА 2. ВЛИЯНИЕ ПОДКРЕПЛЯЮЩЕГО СИГНАЛА НА
ДОФАМИНОВУЮ И СЕРОТОНИНОВУЮ СИСТЕМЫ 11
2.1 Дофаминовая система 11
2.2 Серотониновая система 12
2.3 Влияние награды на активность дофаминовой и серотониновой систем 13
ГЛАВА 3. РЕАЛИЗАЦИЯ СИСТЕМЫ ЭМОЦИОНАЛЬНОЙ ОЦЕНКИ С УЧЕТОМ ВЛИЯНИЯ НА ДОФАМИНОВУЮ И СЕРОТОНИНОВУЮ
СИСТЕМЫ 16
3.1 Нейросимулятор NEST 16
3.2 Нейрональная архитектура 17
3.3 Реализация системы эмоциональной оценки 20
3.3.1 Математическая модель 20
3.3.2 Применение полученной модели 22
3.4 Результаты 24
Заключение 28
Список использованных источников 29
ПРИЛОЖЕНИЕ
Марвин Мински, один из основоположников направления эмоциональных вычислений, среди основных проблем искусственного интеллекта выделял отсутствие понимания естественных процессов, происходящих внутри нашего мозга. [1] Он также подчёркивал важность эмоционального процесса для создания мыслящих вычислительных машин.
В действительности эмоции играют чрезвычайно важную роль в жизни человека. Чарльз Дарвин, например, считал эмоции адаптациями, которые помогают людям и животным выживать. [2] В первую очередь, они имеют значительное влияние на принятие решений. Исследования показывают, что у людей с определенными видами повреждениями головного мозга, влияющими на их способность испытывать эмоции, начинают возникать сложности с принятием решений. Эмоции также в некоторой степени определяют поведенческие особенности и помогают в задаче социального взаимодействия. [3]
Таким образом, можно сделать вывод, что неспособность вычислительных систем испытывать эмоции лишает их жизненно необходимых функций. Реализация эмоциональных процессов у интеллектуальных агентов сделает их более адаптированными к условиям динамично меняющегося мира, а также значительно упростит наше с ними взаимодействие.
Целью дипломной работы является реализация модели эмоциональной оценки с учетом её влияния на дофаминовую и серотониновую системы.
Для достижения поставленной цели необходимо решить следующие задачи:
• Составить математическую модель эмоциональной оценки на базе TD- learning;
• Определить нейрональную архитектуру
• Реализовать модель, используя нейросимулятор NEST;
• Протестировать модель;
• Проанализировать полученные результаты.
В начале работы были поставлены следующие задачи, которые в ходе написания выпускной квалификационной были успешно выполнены:
• Составить математическую модель эмоциональной оценки на базе TD- learning;
• Определить нейрональную архитектуру
• Реализовать модель, используя нейросимулятор NEST;
• Протестировать модель.
Созданная модель эмоциональной оценки на базе дофаминовой и серотониновой систем - это очередной этап на пути к эмоциональным машинам.
1. Марвин Мински и эмоциональные машины [Электронный источник] / Таланов Максим // Режим доступа: https://postnauka.ru/faq/58727 - свободный
2. The Expression of the Emotions in Man and Animals [Текст] / Charles
Darwin, 1872
3. The Purpose of Emotions [Электронный источник] / Kendra Cherry // Режим
доступа: https://www.verywell.com/the-purpose-of-emotions-2795181-
свободный
4. Brain and emotion: Cognitive neuroscience of emotions [Текст] / Anita Deak, 2011
5. Reinforcement Learning [Тект] / Leslie Pack Kaelbling, Michael L. Littman, 1998
6. Dopamine and performance in a reinforcement learning task: evidence from Parkinson’s disease [Текст] / Tamara Shiner, Ben Seymour, Klaus Wunderlich, Ciaran Hill, Kailash P. Bhatia, Peter Dayan, Raymond J. Dolan, 2012
7. Value Learning through Reinforcement: The Basics of Dopamine and Reinforcement Learning [Текст] / Nathaniel Daw & Philippe Tobler, 2014
8. Dopamine, uncertainty and TD learning [Текст] / Yael Niv, Michael O Duff and Peter Dayan, 2005
9. Varieties of impulsivity [Текст] / Evenden J.L., 1999
10.Serotonin and the evaluation of future rewards. Theory, experiments and possible neural mechanisms [Текст] / Nicolas Schweighofer, Saori C. Tanaka, Kenji Doya, 2007
11. Effect of lesions of the ascending 5-hydroxytryptaminergic pathways on choice between delayed reinforcers [Текст] / Wogar M.A., Bradshaw C.M., Szabadi E., 1993
12. Dopamine reward prediction error coding [Текст] / Schultz W., 2016
13.Serotonin neurons in the dorsal raphe nucleus encode reward signals [Текст] / Yi Li, Weixin Zhong, Daqing Wang, Qiru Feng, Zhixiang Liu, Jingfeng Zhou, Chunying Jia, Fei Hu, Jiawei Zeng, Qingchun Guo, Ling Fu & Minmin Luo, 2016
14. Activation of Dorsal Raphe Serotonin Neurons Underlies Waiting for Delayed Rewards [Текст] / Katsuhiko Miyazaki, Kayoko W. Miyazaki and Kenji Doya, 2011
15. The Neural Simulation Technology Initiative [Электронный источник] // Режим доступа: http://www.nest-simulator.org - свободный