📄Работа №214981

Тема: Применение лепестковых диаграмм для снижения размерности признакового пространства

📝
Тип работы Бакалаврская работа
📚
Предмет программирование
📄
Объем: 45 листов
📅
Год: 2020
👁️
Просмотров: 5
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

АННОТАЦИЯ
ВВЕДЕНИЕ 5
ГЛАВА 1 АНАЛИЗ ПЕРСПЕКТИВ РАЗВИТИЯ АЛГОРИТМОВ СНИЖЕНИЯ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА 6
ГЛАВА 2 РАЗРАБОТКА АЛГОРИТМА СНИЖЕНИЯ РАЗМЕРНОСТИ
ПРИЗНАКОВОГО ПРОСТРАНСТВА ДЛЯ ВРЕМЕННЫХ РЯДОВ 8
2.1 Математический аппарат алгоритма 8
2.2 Описание выборки данных для тестирования алгоритма 14
2.3 Результаты тестирования алгоритма 16
ГЛАВА 3 ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ПРЕДЛОЖЕННЫХ РЕШЕНИЙ 24
3.1 Особенности разработанного программного обеспечения 24
3.2 Описание программного кода 26
ЗАКЛЮЧЕНИЕ 39
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 41

📖 Введение

При статистическом анализе данных каждый объект описывается вектором его характеристик. Во многих случаях перед аналитиками возникает задача снижения размера этого вектора. Например, когда требуется улучшить результаты распознавания образов, большое количество простых признаков заменяют на их комбинированные аналоги меньшего количества. Кроме того, снижение размера вектора признаков приводит к снижению вычислительных затрат при анализе данных.
В машинном обучении снижение размерности признакового пространства приводит к значительному уменьшению размера обучающей выборки, используемой для установления определения зависимостей между входными и выходными параметрами.
Таким образом, актуальным вопросом остается разработка новых алгоритмов снижения размерности признакового пространства. В рамках данной работы рассматривается вопрос снижения размерности признакового пространства только для временных рядов.
Целью работы является разработка алгоритма снижения размерности признакового пространства временных рядов на основе параметров лепестковой диаграммы.
В работе предложен алгоритм снижения размерности признакового пространства временных рядов основанный на построении по набору данных лепестковой диаграммы и определении ее 5 характеристик: периметр диаграммы, площадь диаграммы, максимальное значение на диаграмме, координаты X и Y центра диаграммы. Таким образом, количество признаков временного ряда снижается до 5. Разработано программное обеспечение, реализующее предложенный алгоритм. Проведен вычислительный эксперимент на данных сервиса «UEA & UCR Time Series Classification Repository», доказывающий состоятельность предложенного подхода.

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В ходе выполнения бакалаврской работы были получены следующие результаты:
• Обзор литературных источников [1-25] показал, что
перспективным направлением в области анализа данных является развитие алгоритмов снижения размерности признакового пространства. Их использование совместно с алгоритмами машинного обучения позволяется частично решить необходимости наличия большой обучающей выборки при обучении моделей классификации данных.
• В работе предложен алгоритм снижения размерности признакового пространства временных рядов основанный на построении по набору данных лепестковой диаграммы и определении ее 5 характеристик: периметр диаграммы, площадь диаграммы, максимальное значение на диаграмме, координаты X и Y центра диаграммы. Таким образом, количество признаков временного ряда снижается до 5..
• Проведенный вычислительный эксперимент на данных сервиса «UEA & UCR Time Series Classification Repository» показал, что использование предложенного алгоритма снижения размерности признакового пространства практически не влияет на точность получаемого дерева классификации (90% - точность без снижения размерности, 80% - точность при использовании предложенного алгоритма). Однако классификационная модель получается более компактной, а правила в модели более общие.
• Снижение количества независимых переменных позволяет производить обучение моделей классификации на меньшем наборе данных в обучающей выборке.
• На языке программирования Python было разработано программное обеспечение, реализующее предложенный алгоритм снижения размерности признакового пространства временных рядов. В программном обеспечении реализован функционал для сравнения результатов построение деревьев классификации, как при использовании предложенного алгоритма и без его применения. Такой функционал позволяет проводить оценку целесообразности применения алгоритма (снижения размерности признакового пространства) для конкретных анализируемых данных.
В разработанном программном обеспечении присутствуют средства визуализации: построение лепестковых диаграмм для выбранного набора данных, графическое отображение деревьев классификации.
• Дальнейшее развитие предложенного подхода возможно за счет
использования дополнительных параметров лепестковой диаграммы при описании временного ряда. Кроме того открытым для обсуждения является разработка рекомендаций для подбора оптимального сочетания параметров при описании конкретного временного ряда.
Таким образом, все задачи бакалаврской работы выполнены, а поставленная цель достигнута.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Афонин, А. Реализация алгоритма grassman&stiefel eigenmaps на языке python / А. Афонин, Ю. Янович // Междисциплинарная школа- конференция иппи ран "информационные технологии и системы 2018" (ИТИС 2018). Казань, 25-30 сентября 2018 г. - Казань : Издатель Институт проблем передачи информации им. А.А. Харкевича РАН, Москва, 2017. - P. 52 - 59. - Текст : непосредственный.
2. Волков, К.В. Классификация радиолокационных объектов на основе выявления кластерной структуры данных поляризационной матрицы рассеяния / К.В. Волков, // Минцевские чтения. Москва, 30-31 января 2015 г. - Москва : Издатель Московский государственный технический университет имени н.Э. Баумана (национальный исследовательский университет), Москва, 2015. - P. 101 - 114. - Текст : непосредственный.
3. Киров, Е.А. Использование методов снижения размерности в задаче классификации ковариационных матриц ЭЭГ / Е.А. Киров, М.Г. Беляев, Р.Х. Люкманов // Информационные технологии и системы 2015. Сочи, 07-11 сентября, 2015 г. - Сочи : Издатель Институт проблем передачи информации им. А.А. Харкевича РАН, Москва, 2015. - P. 1113 - 1127. - Текст : непосредственный.
4. Дорофеюк, А.А. Методология структурно-классификационного
исследования сложно организованной информации в задачах интеллектуального анализа данных / А.А. Дорофеюк, А.Ю. Дорофеюк, // XII всероссийское совещание по проблемам управления ВСПУ-2014. Москва, 16-19 июля 2014 г. - Москва : Издатель Институт проблем управления им. В.А. Трапезникова РАН Москва, 2014. - P. 8369 - 8381. - Текст :
непосредственный.
5. Ильина, М.А. Универсальный алгоритм визуализации решений задачи классификации / М.А. Ильина, А.А. Тузовский // Современные проблемы естественных и технических наук. Новосибирск, 24 -25 мая 2016 г. - Новосибирск : Издатель Новосибирский государственный архитектурно-строительный университет Сибстрин, Новосибирск, 2016. - P. 46 - 50. - Текст : непосредственный.
6. Рыцарев, И.А. Применение метода главных компонент для выявления семантических различий и анализа изменения положения в пространстве при анализе информационного контента сетевых сообществ / И.А. Рыцарев, Р.А. Парингер, А.В. Куприянов // V международная конференция и молодежная школа "информационные технологии и нанотехнологии". Самара, 21-24 мая 2019 г. - Самара : Издатель Новая техника , Самара, 2019. - P. 780 - 787. - Текст : непосредственный.
7. Исаченко, Р.В. Снижение размерности с помощью проекции на скрытое пространство в задаче декодирования сигналов / Р.В. Исаченко, В.В. Стрижков // Интеллектуализация обработки информации. Москва, Россия - Гаэта, Италия, 08-12 октября 2018 г. - Москва : Издатель Общество с ограниченной ответственностью "ТОРУС ПРЕСС", Москва, 2018. - P. 86 - 87. - Текст : непосредственный.
8. Вельдяйкин, Н. Алгоритм laplacian eigenmaps для точек вне обучающей выборки / Н. Вельдяйкин, Ю. Янович // Информационные технологии и системы 2017 (ИТИС 2017)Уфа, 14-17 сентября 2017 г. - Уфа : Издатель Институт проблем передачи информации им. А.А. Харкевича РАН, Москва, 2017. - P. 74 - 80. - Текст : непосредственный.
9. Буланов, О. Тестирование гипотезы о многообразии / О. Буланов, Ю. Янович // Информационные технологии и системы 2017 (ИТИС 2017). Уфа, 14-17 сентября 2017 г. - Уфа : Издатель Институт проблем передачи информации им. А.А. Харкевича РАН, Москва, 2017. - P. 41 - 48. - Текст : непосредственный.
10. Сидорова, В.А. Выбор размерности и детальности данных дистанционного зондирования земли при кластеризации гистограммным иерархическим алгоритмом / В.А. Сидорова // Актуальные проблемы вычислительной и прикладной математики, Новосибирск, 19-23 октября 2015
г.- Новосибирск : Издатель Институт вычислительной математики и
математической геофизики СО РАН, Новосибирск, 2015. - P. 664 - 669. -
Текст : непосредственный.
11. Palumbo, F. Clustering and Dimensionality Reduction to Discover
Interesting Patterns in Binary Data / F. Palumbo, A.I. D’Enza // Advances in Data Analysis, Data Handling and Business Intelligence: Proceedings of the 32nd Annual Conference of the Gesellschaft fur Klassifikation e.V., Joint Conference with the British Classification Society (BCS) and the Dutch/Flemish Classification Society (VOC), Helmut-Schmidt-University, Hamburg, July 16-18, 2008. -
Hamburg : Springer-Verlag Berlin Heidelberg, 2009. - P. 45- 55. - Text : direct.
12. Lathauwer, D.R. Dimensionality Reduction in ICA and Rank- (R1,R2,...,RN) Reduction in Multilinear Algebra / D.R. Lathauwer, J.Vandewalle // International Conference on Latent Variable Analysis and Signal Separation, Independent Component Analysis and Blind Signal Separation: Fifth International Conference, ICA 2004, Granada, Spain, September 22-24, 2004. Proceedings. - Granada : Springer-Verlag Berlin Heidelberg, 2004. - P. 295- 302. - Text : direct.
13. Wenbin, Q. A Consistency-Based Dimensionality Reduction
Algorithm in Incomplete Data / Q. Wenbin, S. Wenhao, W. Yinglong // Asia- Pacific Web Conference, Web Technologies and Applications: 16th Asia-Pacific Web Conference, APWeb 2014, Changsha, China, September 5-7, 2014.
Proceedings. - Changsha : Springer International Publishing Switzerland, 2014. - P. 576 - 583. - Text : direct.
14. Charu, V.V. Dimensionality Reduction Using PCA Algorithm for
Improving Accuracy in Prediction of Cardiac Ailments in Diabetic Patients / V.V. Charu, S. M. Ghosh // Proceedings of International Conference on Wireless
Communication 17 November 2019, Mumbai, India. - Mumbai : Springer Nature Singapore Pte Ltd. 2020. - P. 443 - 452. - Text : direct.
15. Watanabe, K. Simultaneous Clustering and Dimensionality Reduction Using Variational Bayesian Mixture Model / K. Watanabe, S. Akaho, S. Omachi, M. Okada // Classification as a Tool for Research: Proceedings of the 11th IFCS Biennial Conference and 33rd Annual Conference of the Gesellschaft fur Klassifikation e.V., Dresden, March 13-18, 2009. - Dresden : Springer-Verlag Berlin Heidelberg 2010. - P. 81 - 89. - Text : direct..25

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ