ГЛАВА 1. ТЕОРИЯ НЕЙРОННЫХ СЕТЕЙ И ЗАДАЧИ АНАЛИЗА ДАННЫХ 7
1.1. Понятие нейронной сети 7
1.2. Применение нейронных сетей 9
1.3. Виды архитектур нейронных сетей 11
1.5. Функции активации нейронных сетей 16
1.6. Анализ данных 18
1.7. Предпочтение языка программирования Python для машинного обучения и
искусственного интеллекта 19
ГЛАВА 2. РАЗРАБОТКА АЛГОРИТМА 25
2.1. Разработка индивидуальной базы данных человека 25
2.2. Составление обучающей и тестовой выборки 29
2.3. Обучение нейронных сетей и выбор оптимальной модели 33
ЗАКЛЮЧЕНИЕ 36
БИБЛИОГРАФИЧЕСКИЙ СПИСОК 38
ПРИЛОЖЕНИЕ 40
РЕФЕРАТ
Тема выпускной квалификационной работы: «Регулирование режима дня на основе данных со смарт-часов».
Цель работы - разработка алгоритма, который на основе показателей со смарт-часов будет выстраивать оптимальный режим дня для человека.
Объект исследования - индивидуальная база данных человека - данные (пульс, количество шагов, минуты активности), которые получены со смарт- часов.
Предмет исследования - выявление закономерности в указанных данных, позволяющие рекомендовать человеку оптимальный режим работы и отдыха.
В процессе работы была разработана индивидуальная база данных человека, содержащая данные относительно физической активности человека на определенный период времени. На основе опытного набора данных был проведен анализ и сравнение эффективности применения нейронных сетей различной структуры для диагностики текущей активности человека и выбора рекомендации относительно дальнейшей деятельности субъекта. Разработан алгоритм и реализована программа на языке Python, который на основе данных со смарт-часов, будет выстраивать оптимальный режим работы и отдыха для человека.
Выпускная работа состоит из введения, двух глав, заключения, списка использованной литературы, содержащей 24 источника и приложения. Работа изложена на 44 страницах печатного текста, включает 4 таблицы, 15 рисунков и 1 приложение.
Ключевые слова: режим дня, база данных, работа, отдых, нейронная сеть, моделирование, закономерность, смарт-часы, нейрон, многослойная структура нейронной сети, прямое распространение, функция активации, обучение, функция потерь, градиентный спуск, выборка.
Многие используют смарт-часы, чтобы отслеживать результаты своих тренировок и физическую нагрузку. Подобные устройства помогают измерять активность в течение дня, количество потраченных калорий, пройденную дистанцию, сердечный ритм и другие показатели [10]. Но смарт- часы никак не отслеживают работоспособность/продуктивность человека в определенные моменты времени. Проблема отсутствия такой функции в смарт-часах стала целью исследовательской работы.
Отметим, в первую очередь, раньше не было возможности создавать подобный алгоритм, поскольку не было технических возможностей для автоматического сбора необходимых данных. С другой стороны, мало кто задумывался о том, что было бы удобно разработать такой алгоритм для увеличения своей продуктивности. Но когда в мире случилась острая эпидемиологическая ситуация, все оказались дома и учились или работали дистанционно. При этом у многих был нарушен привычный режим работы [21].
На данный момент пандемия коронавируса не закончилась, и большинство людей по разным причинам находятся на дистанционном обучении, удалённой работе или карантине. Соответственно, не у всех людей выстроен режим дня. В результате можно не успеть выполнить план на день, а также могут усугубиться проблемы со здоровьем.
Цель работы - разработка алгоритма, который на основе показателей со смарт-часов будет выстраивать оптимальный режим работы и отдыха для человека.
Объект исследования - индивидуальная база данных человека - данные (пульс, количество шагов, минуты активности), которые получены со смарт-часов.
Предмет исследования - выявление закономерности в указанных данных, позволяющие рекомендовать человеку оптимальный режим работы и
отдыха.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Изучение теории нейронных сетей.
2. Обработка данных и разработка индивидуальной базы данных человека.
3. Обучение нескольких нейронных сетей разной структуры и выбор оптимальной модели.
Для реализации программного кода был выбран язык программирования Python как самый высокоуровневый и понятный язык, с которым удобно работать. Одна из основных причин, почему Python используется для машинного обучения, состоит в том, что у него есть множество фреймворков, которые упрощают процесс написания кода и сокращают время на разработку. Фреймворк - это набор инструментов и стандартных реализаций для обеспечения более быстрой разработки какого-либо программного продукта. При работе с Python не нужно уделять много внимания непосредственно написанию кода. Всё внимание может быть сосредоточено на решении более сложных задач, связанных с машинным обучением. Простой синтаксис языка Python помогает тестировать сложные алгоритмы с минимальной тратой времени на их реализацию.
Апробация результатов работы:
1) Участие в конференции «Мой выбор - наука!», Барнаул, 20-24 апреля 2021 г.:
- секция «Прикладная математика и информационные технологии»;
- междисциплинарная секция «Цифровые технологии в прикладной математике и информатике».
2) Участие в конкурсе для молодёжи «Фабрика бизнес-идей», Барнаул, с 1 ноября по 4 декабря 2020 г.
Выпускная квалификационная работа состоит из введения, 2 глав, заключения, списка библиографических источников 24 наименований. Работа изложена на 44 страницах машинописного текста. В первой главе «Теория нейронных сетей и задача анализа данных» рассмотрены основные понятия нейронных сетей, их архитектуры и область применения, а также функции активаций, проведён анализ данных. Во второй главе «Разработка алгоритма» приводятся разработка индивидуальной базы данных человека, составление обучающей и тестовой выборки, обучение нейронных сетей и выбор оптимальной модели. В заключении приводятся итоговые выводы и обобщены результаты работы.
На данный момент пандемия коронавируса продолжается, и актуальность в алгоритме оптимального режима отдыха и работы резко повысилась. Большинство людей из-за ограничений находятся на дистанционном обучении, удалённой работе или карантине, вследствие чего нарушается режим отдыха и работы в течение дня.
По результатам исследования компании Vega Factor о мотивации сотрудников во время удалённой работы оказалось, что вовлеченность и результативность снижается. Связано это с тем, что переход на удалённый режим осуществляется принудительно, а не по инициативе сотрудников. Именно поэтому необходима дополнительная мотивация. Нами разработанная технология поможет большинству людей грамотно управлять своим временем.
Для достижения поставленной цели были решены следующие задачи:
1. Изучена теория нейронных сетей.
2. Проведена обработка данных и разработана индивидуальная база данных человека.
3. Обучены три нейронные сети разной структуры и выбрана оптимальная модель.
При изучении теории нейронных сетей мы ознакомились с множеством видов архитектур нейронных сетей, изучили области их применения, рассмотрели подходы к обучению нейронных сетей. Можно сделать вывод, что на данный момент во многих областях основные задачи решаются с помощью нейронных сетей.
При разработке индивидуальной базы данных были собраны необходимые показатели со смарт-часов у различных людей с разным родом деятельности и режимом дня. На основе этих данных была разработана база данных.
Обучены три нейронные сети разной структуры. Полученные результаты были проанализированы. Важным выводом можно отметить, что ни каждая нейронная сеть может использоваться в разных задачах. Так как в нашем случае нейронные сети Хопфилда и Кохонена предназначены для обработки изображений, выбранные нейронные сети в условиях исследования показали плохие результаты.
Результаты исследования будут применены в разработке мобильного приложения для регулирования режима дня на основе данных со смарт-часов.
Недостатком разработанного алгоритма является недостаточная точность около 60%. В дальнейшем нужно добавить дополнительные показатели, увеличить объём данных для обучения.
По итогам исследования можно отметить, что алгоритм удовлетворяет поставленной цели. Он обладает хорошей стабильностью, а также маленькую ресурсоёмкость.
1. Бринк Х., Ричардс Дж., Феверолф М. Машинное обучение. - СПб.: Питер, 2018. - 336 с.: ил.
2. Воронцов К.В. Лекции по алгоритмам кластеризации и многомерного шкалирования - Новосибирск, 2007. - 38 с.
3. Загоруйко Н.Г. Прикладные методы анализа данных и знаний - Новосибирск: Изд. ИМ СО РАН. - 1999. - 273 с.
4. Круглов В.В., Борисов В.В. Искусственные нейронные сети. Теория и практика. - Москва, 2002. - 382 с.: ил.
5. Мюллер А., Гвидо С. Введение в машинное обучение с помощью языка программирования Python. - Москва, 2016-2017. - 325 с.
6. Плас Дж. Вандер. Python для сложных задач: наука о данных и машинное обучение. - СПб.: Питер, 2018. - 576 с.: ил.
7. Чанышев О.Г. Курс лекций. Введение в искусственный интеллект - М.: Таксономия, 2004.-67 с.
8. Annalyn Ng, Kenneth Soo. Теоретический минимум по Big Data. Всё, что нужно знать о больших данных. - СПб.: Питер, 2019. - 208 с.: ил.
9. Виды нейронных сетей. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://otus.ru/nest/post/1263/
10. Исследование мотивации сотрудников на удалённой работе. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://tsqconsulting.rU/blog/remote_motivation#2
11. Классификация данных при помощи нейронных сетей. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://loginom.ru/blog/neural- classification
12. Метрики в задаче машинного обучения. [Электронный ресурс]. -
Заглавие с экрана. Режим доступа: https://habr.com/ru/company/ods/
blog/328372/
13. Нейронная сеть Хопфилда. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://microtechnics.ru/nejronnaya-set-xopfilda/
14. Нейронная сеть Кохонена. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://microtechnics.ru/nejronnaya-set-xopfilda/
15. Обучение и архитектура нейронной сети Хопфилда. [Электронный
ресурс]. - Заглавие с экрана. Режим доступа:
https://cybernetics.wikia.org/ru/wiki/Нейронная_сеть_Хопфилда
16. Обучение и архитектура нейронной сети Кохоненна. [Электронный
ресурс]. - Заглавие с экрана. Режим доступа:
https://cybernetics.wikia.org/ru/wiki/Нейронная_сеть_Кохонена
17. Основные проблемные области. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://www.osp.ru/os/1997/04/179189
18. Оценка классификатора. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: http://bazhenov.me/blog/2012/07/21/classification-performance- evaluation.html
19. Оценка качества классификатора. F-мера. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://neerc.ifmo.ru/wiki/index.php?title
20. Предпочтение языка программирования Python для машинного
обучения и искусственного интеллекта. [Электронный ресурс]. - Заглавие с экрана. Режим доступа: https://pythonist.ru/top-8-bibliotek-python-dlya-
mashinnogo-obucheniya-i-iskusstvennogo-intellekta/
...