Тема: КЛАСТЕРИЗАЦИЯ ТОЧЕК, ЗАДАЮЩИХ РАЗЛИЧНЫЕ ТИПЫ МОНОТОННЫХ КРИВЫХ
Характеристики работы
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. Цель работы 5
2. Понятие отношения частичного порядка на множестве точек 6
3. Алгоритмы кластеризации точек 8
3.1. Квадратичный алгоритм 8
3.1.1. Описание алгоритма 8
3.1.2. Реализация алгоритма на языке С# 10
3.1.3. Тестирование работы алгоритма 14
3.2. Линейно-логарифмический алгоритм 17
3.2.1. Описание алгоритма 17
3.2.2. Реализация алгоритма на языке С# 20
3.2.3. Тестирование работы алгоритма 30
4. Сравнение работы двух алгоритмов 31
5. Заключение 32
6. Список литературы 33
7. Приложение. Листинг программы
📖 Введение
Кластеризация - объединение в группы схожих объектов - является одной из фундаментальных задач в области анализа данных и Data Mining. Под кластером понимается объединение множества однородных объектов, обладающих определенными свойствами. Задачей кластеризации является выделение в исходном множестве некоторой, заранее неизвестной, структуры кластеров. Особенность данной задачи заключается в том, что число кластеров заранее неизвестно. Оно определяется в процессе работы алгоритма. Кластеризация широко используется как в качестве отдельного инструмента анализа, так и как один из этапов предварительной обработки данных перед использованием других аналитических методов. Аналитику часто легче выделить группы схожих объектов, изучить их особенности и построить для каждой группы отдельную модель, чем создавать одну общую модель на всех данных. Список прикладных областей, где она применяется, широк: сегментация изображений, маркетинг, борьба с мошенничеством, прогнозирование, анализ текстов и многие другие. На современном этапе кластеризация часто выступает первым шагом при анализе данных. После выделения схожих групп применяются другие методы, для каждой группы строится отдельная модель.
В данной работе рассматривается частный случай, когда кластерами являются монотонные кривые, то есть кластеризируемые точки будут разбиваться на кривые, которые возрастают или убывают.
1. Цель работы
Целью выпускной работы является исследование двух алгоритмов разбиения частично упорядоченного множества точек на антицепи(ломанные), соединяющие точки. Эти ломанные должны быть монотонными функциями. Исследование заключается в сравнении времени работы двух алгоритмов в зависимости от размерности(объема) точек. На основании исследования времени работы можно будет сделать вывод относительно целесообразности применения того или иного алгоритма для различной размерности данных.
Существуют следующие варианты ломанных, соединяющих точки на плоскости:
1) Строго возрастающая;
2) Возрастающая с горизонтальными отрезками;
3) Возрастающая с вертикальными отрезками;
4) Возрастающая с горизонтальными и вертикальными отрезками;
5) Строго убывающая;
6) Убывающая с горизонтальными отрезками;
7) Убывающая с вертикальными отрезками;
8) Убывающая с горизонтальными и вертикальными отрезками.



