🔍 Поиск готовых работ

🔍 Поиск работ

Алгоритм обучения с подкреплением для решения задачи движения робота

Работа №202200

Тип работы

Дипломные работы, ВКР

Предмет

прикладная информатика

Объем работы62
Год сдачи2019
Стоимость4620 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
15
Не подходит работа?

Узнай цену на написание


АННОТАЦИЯ 2
ВВЕДЕНИЕ 6
1 АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 8
1.1 Исследование объекта управления 8
1.2 Обзор существующих алгоритмов движения 13
1.3 Обзор алгоритмов обучения с подкреплением 17
1.4 Выводы по разделу 27
2 РАЗРАБОТКА АЛГОРИТМА УПРАВЛЕНИЯ РОБОТОМ 29
2.1 Модель объекта управления 29
2.2 Модель среды и взаимодействия с роботом 31
2.3 Модель процесса обучения 33
2.4 Функция вознаграждения 35
2.5 Выводы по разделу 36
3 ВЫЧИСЛИТЕЛЬНЫЙ ЭКСПЕРИМЕНТ 37
3.1 Интерфейс взаимодействия 37
3.2 Реализация среды 38
3.3 Реализация агента 40
3.4 Организация вычислительного эксперимента 41
3.5 Результаты обучения 43
3.6 Выводы по разделу 47
ЗАКЛЮЧЕНИЕ 49
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 50
ПРИЛОЖЕНИЕ 1 Листинг программы 53


Окружающий нас мир очень сложная открытая система, развивающа¬яся и меняющаяся во времени и пространстве. Автоматизация и роботизация встречается на каждом шагу. Автоматические устройства выполняют рутинные, сложные, рискованные и другие задачи, подстраиваясь и адаптируясь к существующему миру для достижения наилучших резуль¬татов. Адаптивность информационной системы - это ее способность изме¬няться для сохранения своих эксплуатационных показателей в заданных пре¬делах при изменениях внешней среды, также - это одно из качеств, которые уменьшают разрыв между понятием информационной системой и понятием живого организма. Адаптивность информационной системы сегодня - это залог успеха системы, завтра это - необходимое условие выживаемости. В информационной среде уже проходит отбор систем по критерию адап¬тивности, какая система быстрее сможет приспособиться к новым условиям существования. Современные способы построения адаптивных информаци¬онных систем в совокупности с системным подходом позволяют создать ин¬формационную систему, удовлетворяющую критерию адаптивности.
Робототехника - прикладная наука, занимающаяся разработкой автома-тизированных технических систем. Робот действует по заранее заложенной программе, получая информацию о внешнем мире от датчиков, он самостоятельно осуществляет производственные и иные операции, обычно выполняемые человеком (либо животными). При этом робот может, как иметь связь с оператором (получать от него команды), так и действовать автономно. Робототехника опирается на такие дисциплины, как электроника, механика, информатика, радиотехника, электротехника и другие. Выделяют основные виды робототехники: строительная, промышленная, бытовая, авиационная, военная, космическая и подводная. Практически в каждом виде роботов выделяют задачу движения, которая является одной из главных подзадач, требуемых для реализации проекта.
Для решения задач на стыке машинного обучения и оптимального управления была создана область обучения с подкреплением. В системах обучения с подкреплением выделяют важную проблему выбора между эксплуатацией текущих знаний для получения наибольшей награды и исследованием окружения с целью получения знаний о структуре окружения. В данной работе ставилась задача получения стратегия исследования окружений с непрерывными пространствами состояний. В качестве основы системы обучения с подкреплением была выбрана модель глубокого - обучения. Была предложена модификации существующей стратегии исследования в рамках задачи движения робота.
Существует множество готовых конфигураций роботов, механизмов и исполнителей, в основе которых лежат различные датчики, позволяющие осуществлять навигацию и передвижение в пространстве. А также существуют конструкторы, которые позволяют создавать макеты и прототипы роботов, используя практически любые конфигурации и формы исполнителей.
Цель работы: разработать и реализовать на языке высокого уровня алгоритм обучения с подкреплением для решения задачи движения робота по заданной линии.
Таким образом, для достижения цели были поставлены следующие задачи.
1. Провести анализ предметной области движения робота.
2. Изучить алгоритмы обучения с подкреплением.
3. Выполнить программную реализацию алгоритма обучения с подкреплением для решения задачи движения робота по линии.
4. Провести тестирование работы алгоритма в виртуальной среде. 


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Для решения задачи движения робота по линии с помощью алгоритма обучения с подкреплением был проведен обзор методов обучения с подкреплением, а также проанализирована предметная область движения роботов.
Была разработана модель робота и системы обучения, а также виртуальная среда выполнения и тестирования стратегий. Был реализован алгоритм обучения и предложены критерии оценки.
В ходе выполнения работы был создан фреймворк для обучения различных моделей. Выполнена настройка параметров агента - матрица Q в алгоритме обучения Q-learning, для получения наилучших результатов. Были выбраны количество эпох обучения. Разработана программа на языке высокого уровня Python. Результатами работы программы являются коэффициенты матрицы . С помощью нее были получены результаты работы на контрольных картах. Результаты работы говорят о том, что алгоритм обучения работает лучше, чем тривиальный алгоритм.
Самые лучшие результаты получены при 10000 эпох обучения агента. При меньшем количестве агент обучается недостаточно и теряет управление в некоторых ситуациях на крутых поворотах. При увеличении числа эпох агент подвергается переобучению и заучиванию тренировочных трасс, теряет обобщающую способность и показывает по некоторым тестам худшие результаты, чем тривиальный алгоритм обучения. Полученные результаты обучения можно считать приемлемыми, если сравнивать с работой тривиального алгоритма.
Важным заключением данной работы является то, что удалось получить довольно точную модель, используя минимальное количество входной информации и затратив минимальное количество средств для моделирования объекта физической природы. Имеется в виду то, что как описывалось ранее, мы используем виртуальную модель, а не натурную.



1 Филиппов, С.А. Уроки робототехники / С.А. Филиппов, В.А. Воробь-ев. - Москва: Лаборатория знаний, 2018. - 252 с.
2 Омельченко, Е. Я. Краткий обзор и перспективы применения микропроцессорной платформы Arduino / Е.Я. Омельченко, В.О. Маклаков // ЭС и К. 2013. №21. - С. 129-133.
3 Адамян, А.А. Управление шаговым двигателем на базе одноплатного компьютера Raspberry Pi 2 в среде codesysv3.5 / А.А. Адамян, В.Х Аль-Тиб¬би // Молодой исследователь Дона. 2018. №4 (13). - С. 19-29.
4 Intel «Обучение для будущего» [Электронный ресурс]: учебное посо-бие. - Электрон. дан. - Москва: 2016. - 425 с. - Режим доступа: https://e. lanbook.com/book/100605. - Загл. с экрана.
5 Неустроев, А.В. Начало программирования в Lego Mindstorms EV3 с использованием языка Java / А.В. Неустроев // Academy. 2016. №1 (4). - С. 29-53.
6 Черноножкин, В.А. Система локальной навигации для наземных
мобильных роботов / В.А. Черноножкин, С.А. Половка // Научнотехнический вестник информационных технологий, механики и оптики. 2008. №57. URL: https://cyberleninka.rU/article/n/sistema-lokalnoy-navigatsii-dlya-nazemnyh-mobil nyh-robotov (дата обращения: 10.06.2019). URL: https://cyberleni
nka.ru/article/n/sistema-lokalnoy-navigatsii-dlya-nazemnyh-mobilnyh-robotov
7 Ачкасов, О.Р. Темпы развития робототехники в России и мире / О.Р. Ачкасов, Д.К. Синяков // Актуальные проблемы авиации и космонавтики. 2016. №12. URL: https://cyberleninka.ru/article/n/rates-of- development-of-robotics-in-russia (дата обращения: 10.06.2019).
8 Ставров, А.А. Импульсные лазерные дальномеры для оптико¬
локационных систем / А.А. Ставров, М.Г. Поздняков // Доклады БГУИР. 2003. №2 (2). URL: https://cyberleninka.rU/article/n/impulsnye-lazernye-dalno
mery-dlya-optiko-lokatsionnyh-sistem (дата обращения: 10.06.2019).
9 Власов, С.М. Бесконтактные средства локальной ориентации робо-тов: учебно-методическое пособие / С.М. Власов - Санкт-Петербург: НИУ ИТМО, 2017. - 120 с.
10 Булгаков, А.Г. Промышленные роботы. Кинематика, динамика, кон-троль и управление: монография / А.Г. Булгаков, В.А. Воробьев. - Москва: СОЛОН-Пресс, 2008. - 245 с.
11 Регламент соревнований открытого робототехнического турнира // Электронный ресурс. - Режим доступа: http://www.railab.ru/tekushchie-regla menty/line.html
12 Большаков, А.А. Планирование траектории движения мобильного робота / А.А. Большаков, М.Ф. Степанов // Вестник СГТУ. - 2010. - №3с. URL: https://cyberleninka.rU/article/n/planirovanie-traektorii-dvizheniya-mobilnog o-robota (дата обращения: 10.06.2019).
13 Сотникова, М.В. Алгоритм автоматического удержания колесного
робота на визуально заданной линии // Вестник СПбГУ. Серия 10. Прикладная математика. Информатика. Процессы управления. - 2016. - №1. URL: https://cyberleninka.ru/article/n/algoritm-avtomaticheskogo-uderzhaniya-
kolesnogo-robota-na-vizualno-zadannoy-linii (дата обращения: 10.06.2019).
14 International Robotic Competition: Робот для траектории на основе LEGO EV3 // Электронный ресурс. - Режим доступа: https: //wroboto .ru/rules /RobotExample
15 Робототехника для всех: Движение по линии с двумя датчиками // Электронный ресурс. - Режим доступа: http://studrobots.ru..23


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ