Тема: Применение лепестковых диаграмм для снижения размерности признакового пространства
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
ВВЕДЕНИЕ 5
ГЛАВА 1 АНАЛИЗ ПЕРСПЕКТИВ РАЗВИТИЯ АЛГОРИТМОВ СНИЖЕНИЯ РАЗМЕРНОСТИ ПРИЗНАКОВОГО ПРОСТРАНСТВА 6
ГЛАВА 2 РАЗРАБОТКА АЛГОРИТМА СНИЖЕНИЯ РАЗМЕРНОСТИ
ПРИЗНАКОВОГО ПРОСТРАНСТВА ДЛЯ ВРЕМЕННЫХ РЯДОВ 8
2.1 Математический аппарат алгоритма 8
2.2 Описание выборки данных для тестирования алгоритма 14
2.3 Результаты тестирования алгоритма 16
ГЛАВА 3 ПРОГРАММНАЯ РЕАЛИЗАЦИЯ ПРЕДЛОЖЕННЫХ РЕШЕНИЙ 24
3.1 Особенности разработанного программного обеспечения 24
3.2 Описание программного кода 26
ЗАКЛЮЧЕНИЕ 39
СПИСОК ИСПОЛЬЗУЕМОЙ ЛИТЕРАТУРЫ 41
📖 Введение
В машинном обучении снижение размерности признакового пространства приводит к значительному уменьшению размера обучающей выборки, используемой для установления определения зависимостей между входными и выходными параметрами.
Таким образом, актуальным вопросом остается разработка новых алгоритмов снижения размерности признакового пространства. В рамках данной работы рассматривается вопрос снижения размерности признакового пространства только для временных рядов.
Целью работы является разработка алгоритма снижения размерности признакового пространства временных рядов на основе параметров лепестковой диаграммы.
В работе предложен алгоритм снижения размерности признакового пространства временных рядов основанный на построении по набору данных лепестковой диаграммы и определении ее 5 характеристик: периметр диаграммы, площадь диаграммы, максимальное значение на диаграмме, координаты X и Y центра диаграммы. Таким образом, количество признаков временного ряда снижается до 5. Разработано программное обеспечение, реализующее предложенный алгоритм. Проведен вычислительный эксперимент на данных сервиса «UEA & UCR Time Series Classification Repository», доказывающий состоятельность предложенного подхода.
✅ Заключение
• Обзор литературных источников [1-25] показал, что
перспективным направлением в области анализа данных является развитие алгоритмов снижения размерности признакового пространства. Их использование совместно с алгоритмами машинного обучения позволяется частично решить необходимости наличия большой обучающей выборки при обучении моделей классификации данных.
• В работе предложен алгоритм снижения размерности признакового пространства временных рядов основанный на построении по набору данных лепестковой диаграммы и определении ее 5 характеристик: периметр диаграммы, площадь диаграммы, максимальное значение на диаграмме, координаты X и Y центра диаграммы. Таким образом, количество признаков временного ряда снижается до 5..
• Проведенный вычислительный эксперимент на данных сервиса «UEA & UCR Time Series Classification Repository» показал, что использование предложенного алгоритма снижения размерности признакового пространства практически не влияет на точность получаемого дерева классификации (90% - точность без снижения размерности, 80% - точность при использовании предложенного алгоритма). Однако классификационная модель получается более компактной, а правила в модели более общие.
• Снижение количества независимых переменных позволяет производить обучение моделей классификации на меньшем наборе данных в обучающей выборке.
• На языке программирования Python было разработано программное обеспечение, реализующее предложенный алгоритм снижения размерности признакового пространства временных рядов. В программном обеспечении реализован функционал для сравнения результатов построение деревьев классификации, как при использовании предложенного алгоритма и без его применения. Такой функционал позволяет проводить оценку целесообразности применения алгоритма (снижения размерности признакового пространства) для конкретных анализируемых данных.
В разработанном программном обеспечении присутствуют средства визуализации: построение лепестковых диаграмм для выбранного набора данных, графическое отображение деревьев классификации.
• Дальнейшее развитие предложенного подхода возможно за счет
использования дополнительных параметров лепестковой диаграммы при описании временного ряда. Кроме того открытым для обсуждения является разработка рекомендаций для подбора оптимального сочетания параметров при описании конкретного временного ряда.
Таким образом, все задачи бакалаврской работы выполнены, а поставленная цель достигнута.



