Тип работы:
Предмет:
Язык работы:


Многоагентное планирование траектории в условиях частичной наблюдаемости

Работа №141725

Тип работы

Бакалаврская работа

Предмет

математика и информатика

Объем работы42
Год сдачи2022
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
35
Не подходит работа?

Узнай цену на написание


Введение 4
1. Обзорный раздел по предметной области 6
1.1. Описание задачи 6
1.2. Обзор литературы 7
1.3. Планирование траектории 8
1.4. Планирование траектории с ограниченной наблюдаемостью 9
1.5. Многоагентное планирование траектории (MAPF) 10
2. Методы и алгоритмы 11
2.1. Формальная постановка задачи 11
2.1.1 Карта 11
2.1.2 Планирование траектории агента 11
2.1.3 Многоагентное планирование траектории 12
2.1.4 Планирование траектории с условием частичной на­блюдаемости 14
2.1.5 Многоагентное планирование траектории с условием
частичной наблюдаемости 15
2.1.6 Общая схема алгоритма 17
2.2. Централизованная постановка задачи 18
2.2.1 Постановка и схема алгоритма 18
2.2.2 Оптимизация планирования 19
2.3. Частично-децентрализованная постановка задачи 21
2.3.1 Постановка и схема алгоритма 21
2.3.2 Посредничество 22
2.4. Полная-децентрализованная постановка задачи 23
3. Программная реализация 29
3.1. Реализация алгоритмов и прототипа системы 29
3.2. Реализация программы для визуализации работы алгоритмов 31
4. Результаты экспериментов 33
4.1. Оптимизация планирования 34
4.2. Сравнение разных постановок задачи 35
4.3. Выбор стратегии для полностью-децентрализованной версии 36
Заключение 39
Благодарность 39
Список литературы 40

Многоагентные системы планирования траектории - одна из развиваю­щихся направлений искусственного интеллекта. Разработки в этой области активно применяются в компьютерных играх, авиации [1] и робототехни­ке. При разработке систем многоагентного планирования траектории перед разработчиками появляется ряд задач. Одной из таких задач является эффек­тивное планирование траектории для каждого агента от начальной позиции до конечной и координация агентов между собой так, чтобы они не мешали движению других агентов.
Зачастую, агенты не могут знать всю местность заранее, но могут авто­матически наблюдать за ней в определенном диапазоне вокруг себя и запоми­нать ее для использования в будущем. Например, такие ситуации встречаются при разработке навигации для персонажей в компьютерных играх реального времени (таких, как Baldur’s Gate (рис. 1), Total Annihilation, Age of Empires или Dark Reign).Агенты в нашей задаче могут не знать всю местность заранее и в ходе их движения по местности могут возникнуть большое количество непредви­денных обстоятельств, которые затрудняют поиск. По мере того как агенты перемещаются по местности, они наблюдают за ней все больше, что ускоряет будущие поиски, поскольку уменьшает количество возможных непредвиден­ных обстоятельств. Также, агенты могут обмениваться между собой какой-то информацией для того, чтобы помогать другим агентам избегать конфликтов с другими агентами или препятствиями. В данной ситуации нахождение опти­мального решения - сложно-разрешимая задача и необходимо использовать производительный поисковый подход, который может немного пожертвовать оптимальностью результирующих траекторий ради общей производительно­сти. Результирующие траектории, вероятно, не являются оптимальными, но это часто перевешивается экономией вычислений.
Целью данной дипломной работы является в исследование формальной постановки задачи многоагентного планирования траектории в условиях ча­стичной наблюдаемости, различных постановок данной задачи и разработка системы навигации групп мобильных агентов для решения данной задачи.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения работы были исследованы задачи многоагентного планирования траектории и планирования траектории в условиях частичной наблюдаемости. Был проведен анализ технической литературы, на его основе были разработаны новые алгоритмы для задачи многоагентного планирования траектории в условиях частичной наблюдаемости, основанные на изученных алгоритмах многоагентного планирования и планирования в условиях ча­стичной наблюдаемости. Данные алгоритмы были реализованы, на их основе был разработан прототип системы планирования движения роботов на языке программирования C++. Было проведено экспериментальное исследование производительности написанных алгоритмов.
К основным результатам работы относится программная реализация алгоритмов и системы планирования движения группы агентов в условиях частичной наблюдаемости и также результаты экспериментального исследо­вания алгоритмов.
На основании экспериментальных исследований можно сделать вывод, что версии, в которых происходил обмен между агентами большим количе­ством информации, показывают лучшие результаты. Для версии алгоритма с полной децентрализацией лучше всего себя показывает стратегия «Квад- рат+», так как в отличие от других стратегий она лишена случаев взаимной блокировки.
В будущих работах планируется разработка стратегий, основанные на субоптимальных алгоритмах основанных на правилах (TASS, Push And Swap), использовать подходы с других алгоритмов частичной наблюдаемости (напри­мер как LSS-LRTA*) или других алгоритмов многоагентного планирования траектории.


[1] Ho, F., Goncalves, A., Salta, A., Cavazza, M., Geraldes, R., Prendinger, H. (2019). Multi-agent path finding for UAV traffic management: Robotics track.
[2] Han, Y., Gmytrasiewicz, P. (2019, July). Ipomdp-net: A deep neural network for partially observable multi-agent planning using interactive pomdps. In Proceedings of the AAAI Conference on Artificial Intelligence (Vol. 33, No. 01, pp. 6062-6069).
[3] Brafman, R., Shani, G., Zilberstein, S. (2013, June). Qualitative planning under partial observability in multi-agent domains. In Twenty-Seventh AAAI Conference on Artificial Intelligence.
[4] Mohseni-Kabir, A., Veloso, M., Likhachev, M. (2020, June). Efficient robot planning for achieving multiple independent partially observable tasks that evolve over time. In Proceedings of the International Conference on Automated Planning and Scheduling (Vol. 30, pp. 202-211).
[5] Omidshafiei, S., Pazis, J., Amato, C., How, J. P., Vian, J. (2017, July). Deep decentralized multi-task multi-agent reinforcement learning under partial observability. In International Conference on Machine Learning (pp. 2681­2690). PMLR.
[6] Spaan, M. T. (2012). Partially observable Markov decision processes. In Reinforcement Learning (pp. 387-414). Springer, Berlin, Heidelberg.
[7] Яковлев, К. С., Баскин, Е. С. (2013). Графовые модели в задаче плани­рования траектории на плоскости. Искусственный интеллект и принятие решений, (1), 5-12.
[8] Dijkstra E. W. A note on two problems in connexion with graphs // Numerische Mathematik. 1959. V. 1. P. 269-271.
[9] Korf R.E. Articial Intelligence Search Algorithms // In Algorithms and Theory of Computation Handbook, CRC Press, 1996. P. 40.
[10] Koenig S., Likhachev M., Furcy D. Lifelong planning A // Artificial Intelligence. 2004. V. 155. N. 1-2. P. 93-146.
[11] Stentz, A. (1994). Optimal and efficient path planning for partially known environments. In Intelligent unmanned ground vehicles (pp. 203-220). Springer, Boston, MA.
[12] Stentz, A. (1995, August). The focussed d* algorithm for real-time replanning. In IJCAI (Vol. 95, pp. 1652-1659).
[13] Koenig, S., and Maxim Likhachev. "D* lite."Aaai/iaai 15 (2002): 476-483.
[14] Koenig, S., Sun, X. (2009). Comparing real-time and incremental heuristic search for real-time situated agents. Autonomous Agents and Multi-Agent Systems, 18(3), 313-341.
[15] Stern, R., Sturtevant, N. R., Felner, A., Koenig, S., Ma, H., Walker, T. T., ... Boyarski, E. (2019, July). Multi-agent pathfinding: Definitions, variants, and benchmarks. In Twelfth Annual Symposium on Combinatorial Search....25


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ