Аннотация 2
ВВЕДЕНИЕ 6
Глава 1 Теоретическое описание скрытых марковских моделей 9
1.1 Обзор работ, связанных с применением методов Монте-Карло для решения задач теории игр 9
1.2 Описание скрытой марковской модели 10
1.3 Постановка задачи и пошаговый алгоритм решения 11
1.4 Описание алгоритмов и инструментарий 14
1.4.1 Алгоритм Баума-Велша 15
1.4.2 Алгоритм Витерби 19
Выводы к первой главе 20
Глава 2 Тестирование методов Монте-Карло для решения задач теории игр 21
2.1 Тестирование на примере игры «Теннис» 21
2.1.1 Вычисление элементов матрицы B 22
2.1.2 Тестирование на данных, представленных в статье 25
2.1.3 Тестирование на данных матрицы B, найденной выше 28
2.1.4 Сравнение с другими подходами решения поставленной задачи 30
2.2 Применение модели к другой игре со схожими характеристиками 33
Выводы ко второй главе 38
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 41
ПРИЛОЖЕНИЕ А Реализация алгоритма Баума-Велша из пакета «HMM» 43
ПРИЛОЖЕНИЕ Б Реализация алгоритма Витерби из пакета «HMM» 46
Многокритериальная задача - это математическая модель принятия оптимального решения одновременно по нескольким критериям. Эти критерии могут отражать оценки различных качеств объекта (или процесса), по поводу которых принимается решение, или оценки одной и той же его характеристики, но с различных точек зрения. В данной работе под многокритериальными задачами понимаются задачи теории игр.
Математическая теория игр - дисциплина, возникшая на стыке 2 наук: математики и экономики. В настоящее время область её практического применения достаточно широка: политические и дипломатические отношения, биология, информатика и другие. Предметом изучения данной дисциплины являются игры и связанные с ними стратегии (т.е. множества доступных игрокам действий), а целью - выработка методов нахождения оптимальных стратегий. Под игрой, как правило, понимается некоторая конфликтная ситуация, т.е. процесс, в котором принимают участие от двух и более сторон преследующих собственные цели [7].
Основополагающей работой в теории игр является книга Джона фон Неймана и Оскара Моргенштерна «Теория игр и экономическое поведение» (1944) [4]. Большая часть данной книги посвящена играм с нулевой суммой. Игры с нулевой суммой - игры, в которых выигрыш одной стороны равен проигрышу другой. Игры с нулевой суммой с участием 2-х игроков называются антагонистическими. К таким играм также можно отнести игры с постоянной суммой, при которых сумма общего выигрыша всех игроков фиксирована, и поэтому увеличение выигрыша одного из них возможно только за счёт уменьшения выигрышей других игроков.
В конце 1960-х годов Джон Харшаньи ввёл понятие игр с неполной информацией и разработал концепцию байесовских равновесий. Д. Харшаньи рассматривал ситуации, когда у одного игрока нет информации о возможных выигрышах другого игрока, и выигрыши приходится оценивать вероятностно.
Игры принято различать по типу. Например, кооперативные и некооперативные игры, с нулевой суммой и ненулевой суммой, параллельные и последовательные, метаигры, игры с полной или неполной информацией [4, 17]. Последние, с одной стороны, наиболее сложны для построения моделей прогнозирования, с другой - представляют значительный практический интерес, т.к., достаточно часто в реальных конфликтных ситуациях, участники не обладают полной информацией о действиях оппонентов [9, 13, 16].
Для дальнейших рассуждений понадобится следующее определение: ход игрока - это выбор действия из некоторого множества возможных действий игрока, определяемых правилами игры.
В работе рассматриваются игры, включающие в себя следующие элементы.
1. Чередование ходов, которые могут быть как личными, так и случайными.
2. Недостаточность информации.
3. Функция выигрыша [6].
Как уже было отмечено ранее, во многих реальных конфликтных ситуациях участники не обладают всей информацией об истинных состояниях процесса и могут оценивать результаты действий соперников только по некоторым ограниченным наборам данных. В этих условиях принятие решений может зависеть от нескольких факторов, в том числе - случайных. Один из возможных подходов к нахождению оптимальной стратегии в таких задачах это использование для описания исследуемой ситуации вероятностных моделей.
В данной работе используются Скрытые Марковские Модели (СММ) для описания состояний игры в различные моменты времени. СММ зарекомендовали себя как мощное средство обработки данных в самых различных областях, с примерами применения можно ознакомиться в [15]. Преимущества СММ перед другими моделями следующие.
1. СММ обладают простой математический структурой.
2. Структура СММ позволяет моделировать сложную цепочку наблюдений.
3. Параметры модели могут быть автоматически выбраны таким образом, чтобы описать имеющийся набор данных для обучения (под обучением СММ понимается определение оценок параметров модели).
В недавно опубликованной работе [14] был предложен метод нахождения оптимальной стратегии для игры с двумя участниками, основанный на применении СММ. В статье был описан подход к решению стратегических игр, в которых игроки могут менять стратегии в течении игры. Целью было увеличить шансы игрока, т.е. узнать какую стратегию принимает соперник в каждый момент времени. Предложенный подход основан на использовании алгоритма Баума-Велша, решения марковской игры поиска смешанного равновесия Нэша.
В бакалаврской работе данный подход получил развитие: предложен альтернативный метод, основанный на применении алгоритма Витерби для получения цепочки скрытых состояний и выбора наиболее вероятного хода вместо решения марковской игры.
Работа алгоритма иллюстрируется на двух демонстрационных примерах: игры в теннис и игры в «Камень, ножницы, бумага».
Данная работа организована следующим образом. В главе 1 дано теоретическое описание скрытых марковских моделей, а также предложена модель решения игры двух лиц с неполной информацией. В главе 2 тестируется предложенная модель решения по игре, описанной в [14], также алгоритм тестируется по другой игре со схожими характеристиками.
Таким образом, в данной работе:
1) представлен алгоритм решения частных случаев стохастической игры с отсутствием полной информации;
2) использованы СММ (скрытые марковские модели) в качестве инструмента описания данного процесса (стохастической игры);
3) проведён обзор литературы на близкие темы;
4) изучены алгоритмы Баума-Велша и Витерби как инструмент решения задач, описанных СММ.
Предложенный алгоритм был протестирован на гипотетическом примере игры в «теннис», описанном в [14]. Результаты выполнения алгоритма, предложенного в данной работе, оказались лучше результатов, представленных в [14].
Было проведено сравнение результатов работы предложенного алгоритма с результатами применения других подходов к решению поставленной задачи. В качестве альтернативных подходов были взяты следующие: использование равномерной стратегии игроком и выбор последнего хода противника. Было рассмотрено 4 случая СММ противника (комбинаций почти равномерных и неравномерных матриц А и В). В каждом из случаев предложенный алгоритм отработал лучше, чем альтернативные подходы.
Предложенный алгоритм был протестирован на произвольных данных другой игры со схожими характеристиками: «камень, ножницы, бумага». В ходе экспериментов алгоритм показал высокую эффективность работы алгоритма, что подтверждает возможность использования предложенного алгоритма в любой игре со схожими характеристиками.
Возможные направления дальнейшей деятельности:
• применение алгоритма к играм с большим количеством игроков;
• адаптация и применение других подходов к решению такого класса игр.
Научная и методическая литература
1. Акулич И.Л. Математическое программирование в примерах и задачах: учебное пособие/ И.Л. Акулич - СПб.: Издательство «Лань», 2011. - 352 с.
2. Григорьева, К.В. Методические указания. Часть 1. Бескоалиционные игры в нормальной форме / К.В. Григорьева. - Санкт-Петербург: Факультет ПМ-ПУ СПбГУ, 2007. - 40 с.
3. Данилов, В.И. Лекции по теории игр / В.И. Данилов. - М.: Российская экономическая школа. - 2002. - 140 с.
4. Моргенштерн, О. Теория игр и экономическое поведение / О. Моргенштерн, Дж. Фон-Нейман. - М.: Книга по Требованию, 2012. - 708 с.
5. Морозов, В.В. Исследование операций в задачах и упражнениях / В.В. Морозов, А.Г. Сухарев, В.В. Федоров. - М.: КД Либроком, 2016. - 288 с.
6. Оуэн, Г. Теория игр / Г. Оуэн. - Пер. с англ. И.Н. Врублевский, Г.Н. Дюбина, А.Н. Ляпунова. Под ред. А.А. Корбута. - 2-е изд. - М.: Едиториал УРСС, 2004. - 216 с.
7. Петросян, Л. Теория игр / Л. Петросян, Н. Зенкевич, Е. Шевкопляс. - 2е изд. - Санкт-Петербург: БХВ-Петербург, 2012. - 432 с.
8. Соколов А.В. Методы оптимальных решений. Общие положения. Математическое программирование / А.В. Соколов, В.В. Токарев. - М.: Физматлит, 2011. - 564 с.
9. Харшаньи, Дж. Игры с неполной информацией // Мировая экономическая мысль. Всемирное признание (лекции нобелевских лауреатов). Т. 5. Кн. 2. - М.: Мысль, 2005. - С. 44-63.
Электронные ресурсы
10. Himmelmann Lin. - 201 . - Режим доступа: https://github.eom/cran/HMM/blob/master/R/HMM.r (дата обращения 15.06.2019).
11. Himmelmann Lin. Package «HMM». - 2010. Режим доступа: https://cran.r-project.org/web/packages/HMM/HMM.pdf (дата обращения 15.06.2019).
12. Theussl S. R/GNU Linear Programming Kit Interface / S. Theussl, K. Hornik, C. Buchta, F. Schwendinger. - 2017. - Режим доступа: https://cran.r- project.org/web/packages/Rglpk/Rglpk.pdf (дата обращения 15.06.2019).
Литература на иностранном языке
13. Aumann, R.J. Repeated games with incomplete information / R.J. Aumann, M. Maschler, R.E. Stearns. - Cambridge, MA.: MIT press, 1995. - 360 p.
14. Benevides, M. Using HMM in Strategic Games / M. Benevides, I. Lima, R. Nader, P. Rougemont // Proceedings 9th International Workshop on Developments in Computational Models, Buenos Aires, Argentina, 26 August 2013. Ed. by Mauricio Ayala-Rincon, Eduardo Bonelli, Ian Mackie. - Vol. 144 of Electronic Proceedings in Theoretical Computer Science. - Open Publishing Association, 2014. - Pp. 73-84.
15. Dymarski, P. Hidden Markov Models, Theory and Applications / P. Dymarski. - Rijeka: InTechOpen, 2011. - 314 p.
...