Введение 3
Постановка задачи 5
Обзор литературы 7
1 Стохастическая аппроксимация 9
1.1 Постановка задачи, метод стохастической аппроксимации 9
1.2 Алгоритм Роббинса-Монро 10
1.3 Процедура Кифера-Вольфица 11
1.4 Рандомизированные алгоритмы 11
1.4.1 Алгоритмы первого порядка 11
1.4.2 Сглаживаемый SPSA 13
1.4.3 SPSA второго порядка 13
2 Нейронные сети 15
2.1 Базовые понятия 15
2.2 Аппроксимация 17
2.3 Задачи управления 18
2.3.1 Непрямое обучение 18
2.3.2 Прямой подход 18
3 Оптимизация работы светофоров 22
3.1 Структура транспортной сети 22
3.2 Метод решения 24
3.2.1 Моделирование 25
3.2.2 Архитектура нейроконтроллера 26
3.2.3 Пошаговое описание алгоритма 27
3.3 Запуски программы 28
Выводы 32
Заключение 33
Список литературы 34
Приложения 37
Развитие транспортных средств всегда преследовало следующие цели: повышение скорости передвижения, грузоподъёмности, надёжности и уровня комфорта. Появление в начале 20 века автомобилей, последовательное улучшение их характеристик и массовая доступность привели к тому, что теперь крупная часть населения имеет возможность обладать транспортным средством, удовлетворяющим самым высоким стандартам.
Значительное повышение спроса на автомобили привело к ряду проблем. Высокое количество выбросов вредных веществ, активное использование невозобновляемых ресурсов и, конечно, коллапсы транспортной системы существенно влияют на жизнь современного человека в негативном ключе.
Дорожные пробки ведут к экономическим потерям, ухудшению экологической ситуации, оказывают негативное воздействие на психическое и физическое здоровье человека. Крупные временные затраты и дискомфорт, вызванные дорожными заторами, противоречат начальным целям использования автомобиля. Главными причинами возникновения коллапсов являются: высокий спрос, низкие пропускные способности дорог, отсутствие достаточного количества различных маршрутов, неграмотная градостроительная политика, ремонтные работы в неподходящее время, долгий процесс оформления ДТП и ликвидации последствий.
Для решения данной проблемы было предложено много способов. Дорожно-строительные: увеличение габаритов проезжей части, наём больших бригад, строительство дополнительных магистралей. Требуют высоких затрат, при неграмотном планировании могут привести даже к ухудшению ситуации. Административные: изменение разметки, установка знаков, настройка светофоров. Самые дешёвые, однако при некоторых условиях их значение может быть несущественным. Социальные: пропаганда ЗОЖ, призывы к более уважительному стилю вождения, просьбы не ездить в одиночку и пользоваться общественным транспортом. Существуют и противодействующие силы, такие как личный выигрыш во времени, уровне комфорта, при этом поведение водителей является значимым фактором только при высоком уровне развития транспортной системы.
Одним из методов, не требующих большого количества материальных затрат, однако обещающего достаточно высокую эффективность, является управление сигналами светофора.
Используемые определения
Фаза светофора - промежуток времени, в течение которого движение на перекрёстке разрешено только одному из направлений.
Цикл светофора - совокупность всех фаз светофора.
Разбиением цикла светофора называется набор длительностей его фаз. Если на перекрёстке имеются всего два направления, то разбиением называется отношение длительности одной из фаз к длине всего цикла.
Смещение фазы - число, которое показывает, насколько должен быть смещён момент начала зелёной фазы относительно некоторого главного светофора на этой улице.
Матрица корреспонденций - матрица, элементами которой являются объёмы перемещений между районами отправления и прибытия за некоторый промежуток времени.
В ходе работы:
1. исследованы различные подходы к управлению сигналами светофоров, положение дел в данной области на текущий момент
2. изучены рандомизированные алгоритмы стохастической аппроксимации
3. проведено ознакомление с подходом управления, не требующего моделирования подконтрольной системы
4. рассмотрена схема применения SPSA для прямого обучения нейронной сети
5. разработана программная реализация алгоритма оптимизации режима работы светофоров для предложенной транспортной сети.
[1] A.Yu. Krylatov, A.P. Shirokolobova. Projection approach versus gradient descent for network’s flows assignment problem // Lecture Notes in Computer Science. 2017. 10556. 345-350.
[2] Cheng X. J., Chang Q. S., Yang Z. X. A traffic control system method based on Q-Learning // Syst. Eng. Theory Practice. 2006. 8. 136-140.
[3] Chin D.C., Smith R.H. A traffic simulation for mid-Manhattan with model-free adaptive signal control. 1994. 296—-301.
[4] Chin D.C, Spall J.C., Smith R.H. Evaluation of system-wide traffic signal control using stochastic optimization and neural network. San Diego, California, 1999. 2188—2194.
[5] Cristion J.A., Spall J.C. Nonlinear adaptive control using neural networks: estimation with a smoothed form of simultaneous perturbation gradient // Statistica Sinica. 1994. 4. 1-27.
[6] D.I. Robertson. TRANSYT: A traffic network study tool // RRL Report. 1969.
[7] Dell’Olmo P., Mirchandani P. An approach for real-time coordination of traffic flows on networks // Transportation Research Board Annual Meeting. 1981. 950837.
[8] Hockaday S. L., J. Martin P. SCOOT—an update // ITE Journal. 1995. 65, 1. 44—-48.
[9] Hunt P.B., Robertson D.I., Bretherton R.D., Winton R.I. SCOOT-A traffic responsive method of coordinating signals // Transport and Road Research Laboratory. 1981.
[10] Kalman R.E. A new approach to linear filtering and prediction problems // Transactions of the ASME-Journal of Basic Engineering. 1960. 82. 35-45.
[11] Kiefer J., Wolfowitz J. Statistical estimation on the maximum of a regression function // Ann. Math. Statist. 1952. 23. 462-466.
[12] Robbins H., Monro S. A stochastic approximation method // Ann. Math. Statist. 1951. 22. 400-407.
[13] Sadegh P., Spall J.C. Optimal random perturbations for stochastic approximation using a simultaneous perturbation gradient approximation // IEEE Transactions on Automatic Control. 1998. 43, 10. 1480-1484.
[14] Sims A. G. The Sydney coordinated adaptive traffic system // Engineering Foundation Conference on Research Directions in Computer Control of Urban Traffic Systems, Pacific Grove, California, USA. 1979.
[15] Spall J. C. Accelerated second-order stochastic optimization using only function measurements // Proceedings of the 36th IEEE Conference on Decision and Control. 1997. 2. 1417-1424.
...