Введение 3
Постановка задачи 4
Глава 1. Аппроксимационно-оценочные критерии 5
1.1. Основные определения 5
1.2. Аппроксимационно-оценочные критерии 7
1.3. Приёмы при построении критериев 8
Глава 2. Вычисление критериев 9
2.1. Линейная функция 9
2.1.1 Построение для трёх точек 9
2.1.2 Построение для четырёх точек 10
2.2. Экспоненциальная функция 10
2.2.1 Построение для трёх точек 11
2.2.2 Построение для четырёх точек 12
2.3. Кубическая функция 13
2.3.1 Построение для трёх точек 13
2.3.2 Построение для четырёх точек 14
2.4. Биквадратная функция 14
2.4.1 Построение для трёх точек 14
2.4.2 Построение для четырёх точек 15
2.5. Построение аппроксимационно-оценочных критериев ... 15
Глава 3. Кластеризация 17
3.1. Основные определения 17
3.2. Метод одиночной связи 17
3.3. Марковский момент остановки 18
Глава 4. Эксперимент 20
Выводы 26
Заключение 27
Список литературы 28
ПРИЛОЖЕНИЕ А 29
В работе исследуются критерии, с помощью которых можно определить момент, когда характер монотонного возрастания числовой последовательности меняется с линейного на нелинейный. Эти критерии называются “аппроксимационно-оценочными[1]”, в работе исследуется их применение в задачах кластерного анализа, а именно для определения момента остановки агломеративного процесса. Но область применения включает в себя не только кластерный анализ, но и другие прикладные задачи, в которых для таблично заданных функций необходимо найти точку перехода от линейного возрастания к нелинейному. В главе 2 вычислены экспоненциальный, кубический и биквадратный критерии (параболический взят из работы[1]). В приложении А приведена программная реализация алгоритма остановки процесса кластеризации с использованием критериев.
Постановка задачи
Задана монотонно возрастающая числовая последовательность yiто¬чек числовой прямой. Последовательность аппроксимируется по нескольким идущим подряд точкам, начиная с некоторого номера j. Узлами аппроксимации являются упорядоченные пары (i, yi), i >j. Необходимо определить узел j, начиная с которого погрешность линейной аппроксимации будет выше, чем нелинейной.
Цель работы: вычисление и исследование некоторых критериев, позволяющих найти узел, начиная с которого погрешность линейной аппроксимации будет выше, чем нелинейной. Нахождение номера итерации агломеративного процесса кластеризации методом одиночной связи, на которой, на основании вычисленных критериев, процесс кластеризации должен быть завершён. Формулировка вывода о целесообразности использования тех или иных критериев для задач кластерного анализа.
Для достижения поставленной цели были сформулированы следующие задачи:
1.Описать аппроксимационно-оценочные критерии, позволяющие найти узел, начиная с которого погрешность линейной аппроксимации будет выше, чем нелинейной.
2. Вычислить параболический, кубический, биквадратный, экспоненциальный критерии для трёх и четырёх точек.
3. Програмно реализовать агломеративный процесс методом одиночной связи с вычисленными критериями остановки.
4. Проанализировать полученные результаты, устойчивость кластеризации
Выведенные критерии можно применять для таблично заданных функций с целью определения момента, когда таблично заданная монотонно возрастающая величина лучше приближается параболической (кубической, биквадратной, экспоненциальной) функцией, чем линейной.
[1] Orekhov A. V. «Approximation-evaluation tests for a stress-strain state of deformable solids.»Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2018, vol. 14, iss. 3, pp. 230-242
[2] Орехов А.В. «ПАРАБОЛИЧЕСКИЙ, ЛОГАРИФМИЧЕСКИЙ И ЭКСПОНЕНЦИАЛЬНЫЙ АППРОКСИМАЦИОННО-ОЦЕНОЧНЫЕ КРИТЕРИИ». Восьмые Уткинские чтения Труды Общероссийской научно-технической конференции. Сер. "Библиотека журнала "Военмех. Вестник БГТУ". 2019. 252-257.
[3] Orekhov A. V. «Markov moment for the agglomerative method of clustering in Euclidean space.»Vestnik of Saint Petersburg University. Applied Mathematics. Computer Science. Control Processes, 2019, vol. 15, iss. 1, pp. 00-00.