Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА ПРОГРАММНОГО ОБЕСПЕЧЕНИЯ РЕАЛИЗАЦИИ АЛГОРИТМОВ ВЫЯВЛЕНИЯ ПРИЧИННО-СЛЕДСТВЕННЫХ ОТНОШЕНИЙ В ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Работа №74463

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы75
Год сдачи2017
Стоимость4770 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
204
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1. ОБЗОР И АНАЛИЗ ПРЕДМЕТНОЙ ОБЛАСТИ 7
1.1. Исследуемые данные 7
1.2. Анализ данных 8
1.2.1. Понятие анализа данных 8
1.2.2. Основные методы статистического анализа данных 11
1.2.3. Машинное обучение 19
1.2.4. ДСМ метод 22
1.3. Постановка задачи 28
2. ПРОЕКТНАЯ ЧАСТЬ 30
2.1. Обоснование проектных решений 30
2.2. Описание алгоритма программы 32
2.2.1. Математическая структура программы 32
2.2.2. Структурная схема программы 39
2.3. Разработка программы 41
2.3.1. Создание модуля «aqjsm» 42
2.3.2. Создание модуля «aq» 42
2.3.3. Создание модуля «jsm» 43
2.3.4. Создание модуля «gui» 44
2.3.5. Создание модулей «loading», «data», «tests» 45
3. ТЕСТИРОВАНИЕ 46
3.1. Выбор тестовых данных 46
3.2. Конфигурация запуска программы 48
3.3. Анализ полученных результатов 49
3.3.1. Анализ примера «квадрат» 49
3.3.2. Анализ с использованием набора экспериментальных данных
психологического тестирования 52
ЗАКЛЮЧЕНИЕ 54
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 57
ПРИЛОЖЕНИЯ 59


В настоящее время объем данных, в частности информационных становится все больше и больше, что создает проблему обработки, анализа и представления этих данных. Анализ данных является важной задачей почти в любой сфере деятельности человека, в том числе в научных исследованиях. Таким образом основная задача анализа данных - это выбор самой важной и ключевой информации. Отбор важной информации определяется некоторым набором правил, условий или соответствий. При анализе человеком тысяч и даже миллионов строк данных есть такой человеческий фактор, когда человек может допустить ошибку в следствии усталости или невнимательности. Однако вычислительная техника, такая как компьютер лишен этого фактора, что позволяет избежать таких ошибок. В настоящее время повышается популярность и актуальность таких понятий как: машинное обучение, искусственный интеллект, нейронные сети. Эти технологии повышают эффективность обработки и анализа колоссальных объемов данных.
Актуальность данной выпускной квалификационной работы заключается в том, что представленный метод выявления причинно-следственных отношений в экспериментальных данных, позволяет провести анализ большого набора данных и выявляет самую важную информацию, затем идет процесс обработки полученных данных после чего результат представляется в виде графа, так как по данных некоторых исследователей человек легче всего воспринимает графическую информацию нежели обычный текст.
Главной целью данной дипломной работы является разработать математическое и программное обеспечение, позволяющее выявить причинно-следственные отношения в наборе экспериментальных данных большого объема.
Данная цель дипломной работы ставит следующие задачи:
• разработать программу для анализа экспериментальных данных;
• протестировать программу на известном наборе данных;
• исследовать экспериментальные данные;
• провести анализ полученных результатов.
При анализе данных часто требуется объяснить зависимость или независимость определенных свойств, признаков у группы исследуемых. Например, необходимо объяснить зависимость уровня подготовки спортсмена к соревнованиям от его личностных характеристик таких как: соперничество и агрессивность. В данном примере под фактом подразумевается уровень соперничества или агрессивности. С помощью которого описывается группа спортсменов. Следовательно, возникает основная задача описать каузальные отношения между значениями признаков или самими признаками. Важно отметить, что в данном примере прослеживается корреляция между признаками, как прямая зависимость, но это не значит, что изменение одной из характеристик с изменением другой будет давать точный ответ что является причиной, а что следствием. Точно также можно сказать о факторном анализе, в процессе выявления линейных комбинаций признаков, будут являться лишь факторами, по которым разделяются признаки. Проблемой интерпретации результатов статистического анализа является, что результаты можно использовать только для уровня достоверности уже выдвинутых гипотез о каузальной зависимости.
Отдельно следует отметить что имеет место случай, когда признак или совокупность признаков зависит от цело ряда признаков. Выделить такие зависимости с использованием только корреляции достаточно трудная задача.
Также кроме статистического анализа данных в машинном обучении часто применяется интеллектуальный метод анализа данных, в частности индуктивные методы, в частности ДСМ-метод. Данный метод является автоматическим методом порождения гипотез, формализующий схему правдоподобного и достоверного вывода, который называется ДСМ- рассуждение. ДСМ-рассуждение является синтезом познавательных процедур: индукции, аналогии и абдукции. ДСМ-метод был создан как средство автоматизированного построения формализации знаний о предметной области средствами называемых квазиаксиоматических теорий.
Важное место в анализе данных имеет представление полученных результатов. Для более наглядного понимания результатов в данной дипломной работе представлен метод генерирующий граф, который отображает важные свойства признаков. На вход графа поступают гипотезы в виде бинарных массивов, которые генерируются в процессе работы обучения и анализа данных. В качестве вершин выступают свойства признаков, а дуги (ребра) графа отображают связь (зависимость) свойств признаков.
Данная дипломная работа состоит из 3 глав, посвященных обзору и анализу предметной области, проектной части и тестированию программы, которые раскрывают основный смысл дипломной работы. Дипломная работа состоит из 16 рисунков, 3 таблиц, 12 литературных источников и 2 приложений.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящее время объем данных, в частности информационных становится все больше и больше, что создает проблему обработки, анализа и представления этих данных. Анализ данных является важной задачей почти в любой сфере деятельности человека, в том числе в научных исследованиях. Таким образом основная задача анализа данных - это выбор самой важной и ключевой информации. Отбор важной информации определяется некоторым набором правил, условий или соответствий. При анализе человеком тысяч и даже миллионов строк данных есть такой человеческий фактор, когда человек может допустить ошибку в следствии усталости или невнимательности. Однако вычислительная техника, такая как компьютер лишен этого фактора, что позволяет избежать таких ошибок. В настоящее время повышается популярность и актуальность таких понятий как: машинное обучение, искусственный интеллект, нейронные сети. Эти технологии повышают эффективность обработки и анализа колоссальных объемов данных.
Актуальность данной выпускной квалификационной работы заключается в том, что представленная программа выявления причинно-следственных отношений в экспериментальных данных, позволяет провести анализ большого набора данных и выявляет самую важную информацию, затем идет процесс обработки полученных данных после чего результат представляется в виде графа, так как по данных некоторых исследователей человек легче всего воспринимает графическую информацию нежели обычный текст.
Главной целью данной дипломной работы является разработка математического и программного обеспечения, позволяющего выявить причинно-следственные отношения в наборе экспериментальных данных большого объема.
Поставленная цель дипломной работы позволила выполнить следующие задачи:
• Разработать программу для анализа экспериментальных данных.
• Протестировать программу на известном наборе данных.
• Исследовать экспериментальные данные.
• Провести анализ полученных результатов.
При анализе данных часто требуется объяснить зависимость или независимость определенных свойств, признаков у группы исследуемых. Например, необходимо объяснить зависимость уровня подготовки спортсмена к соревнованиям от его личностных характеристик таких как: соперничество и агрессивность. В данном примере под фактом подразумевается уровень соперничества или агрессивности. С помощью которого описывается группа спортсменов. Следовательно, возникает основная задача описать каузальные отношения между значениями признаков или самими признаками. Важно отметить, что в данном примере прослеживается корреляция между признаками, как прямая зависимость, но это не значит, что изменение одной из характеристик с изменением другой будет давать точный ответ что является причиной, а что следствием. Точно также можно сказать о факторном анализе, в процессе выявления линейных комбинаций признаков, будут являться лишь факторами, по которым разделяются признаки. Проблема интерпретации результатов статистического анализа является, что результаты можно использовать для уровня достоверности уже выдвинутых гипотез о казуальной зависимости.
Отдельно следует отметить что имеет место случай, когда признак или совокупность признаков зависит от цело ряда признаков. Выделить такие зависимости с использованием только корреляции достаточно трудная задача.
Также кроме статистического анализа данных в машинном обучении часто применяется интеллектуальный метод анализа данных, в частности индуктивные методы, в частности ДСМ-метод. Данный метод является автоматическим методом порождения гипотез, формализующий схему правдоподобного и достоверного вывода, который называется ДСМ- рассуждение. ДСМ-рассуждение является синтезом познавательных процедур: индукции, аналогии и абдукции. ДСМ-метод был создан как средство автоматизированного построения формализации знаний о предметной области средствами называемых квазиаксиоматических теорий.
Важное место в анализе данных имеет представление полученных результатов. Для более наглядного понимания результатов в данной дипломной работе представлен метод генерирующий граф, который отображает важные свойства признаков. На вход графа поступают гипотезы в виде бинарных массивов, которые генерируются в процессе работы обучения и анализа данных. В качестве вершин выступают свойства признаков, а дуги (ребра) графа отображают связь (зависимость) свойств признаков.
В дипломной работе представлена программа разработанная на основе алгоритма, выявления причинно-следственных отношений в наборе экспериментальных данных на примере теста с использованием AQ обучения и ДСМ-метода, а также графопостроитель для более наглядного понимания каузальных зависимостей.
Проведенное исследование в ходе выполнения дипломной работы показало, что разработанная программа представляет удобный инструмент для анализа слабоструктурированных статистических данных в различных областях знаний.



1. Психологическое тестирование [электронный ресурс]. - Режим
доступа: http://www.psychologos.ru/articles/view/psihologicheskoe_testirovanie
2. Анализ данных [электронный ресурс]. - Режим доступа: http://cyberleninka.ru/article/n/kategoriya-dannye-ponyatie-suschnost-podhody-k- analizu
3. Малая советская энциклопедия. — М.: Советская энциклопедия, 1960. — Т. 8. — С. 1090.
4. Статистика [электронный ресурс]. - Режим доступа: http: //statlab.kubsu.ru/node/4
5. Мирошниченко А.С., Гурьянова И.В. Разработка и исследование нейронных сетей // Роль и значение современной науки и техники для развития общества, 28 апреля 2017г., г. Екатеринбург, ч.3 С. 85-90
6. Машинное обучение [электронный ресурс]. - Режим доступа: http: //www.machinelearning.ru/wiki/index.php?title=Машинное_обучение
7. Финн В.К. Правдоподобные рассуждения в интеллектуальных системах типа ДСМ // Итоги науки и техники. 1991. Т. 15. С. 54-101.
8. Мирошниченко А.С. Выявление причинно-следственных отношений в наборе экспериментальных данных // Инновационные механизмы решения проблем научного развития, 18 марта 2017г., г. Уфа, ч.2 67-72
9. ДСМ-метод [электронный ресурс]. - Режим доступа: https://ru.wikipedia.org/wiki/ДСМ-метод
10. Michalski R.S. AQVAL/1-Computer Implementation of Variable-Valued Logic System VL1 and Examples of its Application to Pattern Recognition // Proc. Of the First Int. Joint Conf, on Pattern Recognition. Washington, DS, 1973. P. 3-17. 3
11. The aq21 natural induction program for pattern discovery: Initial version and its novel features / Janusz Wojtusiak, Ryszard S. Michalski, Kenneth A. Kaufman, Jaroslaw Pietrzykowski // ICTAI. 2006. P. 523-526.
12. Панов А. И. Выявление причинно-следственных связей в данных психологического тестирования логическими методами // Искусственный интеллект и принятие решений. — 2013. — № 1. — С. 24-32.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ