Метод идентификации веществ по их спектрам
|
Введение
Постановка задачи 5
Обзор литературы 8
Глава 1. Предобработка данных 12
1.1. Метод главных компонент 12
1.2. Линейный дискриминантный анализ 17
Глава 2. Нейронная сеть 21
2.1. Описание нейронной сети 21
2.2. Обучение нейронной сети 23
2.3. Перекрёстная проверка 25
Глава 3. Оценка эффективности применения PCA, LDA и нейронной сети для обработки и идентификации спектров 27
3.1. Выбор количества главных компонент 27
3.2. Выбор количества нейронов скрытого слоя 28
3.3. Оценка результатов 28
Выводы 30
Заключение 31
Список литературы 32
Приложения 34
Приложение 1. Реализация LDA в MATLAB 34
Приложение 2. Графики величин собственных чисел 37
Приложение 3. Реализация процесса кроссвалидации 38
Приложение 4. Реализация структуры нейронной сети и её процесса обучения
Постановка задачи 5
Обзор литературы 8
Глава 1. Предобработка данных 12
1.1. Метод главных компонент 12
1.2. Линейный дискриминантный анализ 17
Глава 2. Нейронная сеть 21
2.1. Описание нейронной сети 21
2.2. Обучение нейронной сети 23
2.3. Перекрёстная проверка 25
Глава 3. Оценка эффективности применения PCA, LDA и нейронной сети для обработки и идентификации спектров 27
3.1. Выбор количества главных компонент 27
3.2. Выбор количества нейронов скрытого слоя 28
3.3. Оценка результатов 28
Выводы 30
Заключение 31
Список литературы 32
Приложения 34
Приложение 1. Реализация LDA в MATLAB 34
Приложение 2. Графики величин собственных чисел 37
Приложение 3. Реализация процесса кроссвалидации 38
Приложение 4. Реализация структуры нейронной сети и её процесса обучения
Автоматизированный анализ данных имеет множество достоинств, в связи с чем используется практически во всех областях, которыми занимается человек. Объем данных становится слишком большим для целостного восприятия человеком, потому разработка и внедрение алгоритмов, анализирующих данные или упрощающих их восприятие, становятся актуальной задачей повсеместно.
Спектральный анализ (или спектроскопия) — это набор методов, применяемых с целью обнаружения и определения количества элементов, радикалов и соединений, которые входят в состав объекта. Эти методы основываются на изучении спектров воздействия излучения на материю.
Спектроскопия довольно давно и широко используется в химии, физике и астрономии, в большинстве случаев позволяя эффективно идентифицировать вещество или объект и его состав по результатам анализа графика спектра в различных световых диапазонах.
Из преимуществ спектрального анализа можно отметить:
• анализ небольшого количества материала (около 0,1 грамма);
• анализ без разрушения объекта;
• универсальность методов анализа;
• высокая точность;
• высокая производительность.
В данной работе решается задача поиска метода для идентификации породы образцов древесины по их спектрам, так как идентификация материала со сложным составом (например, древесины) является непростой задачей, и, в случае её успешного решения, данный метод можно распространить на другие объекты со сложным составом.
Существенной сложностью в задаче идентификации по спектрам являются проблемы в процессе непосредственного сбора спектров [2]:
• шумы и помехи, связанные с неидеальными компонентами прибора;
3
• воздействие внешних факторов, таких как температура, освещённость и пр.;
• гетерогенность образцов ввиду естественных причин и человеческого фактора.
Классифицируемые множества обрабатываемых данных не являются линейно сепарабельными, в связи с чем стандартные методы классификации, такие как к ближайших соседей(k-nearest neighbors) или к взвешенных ближайших соседей, не дают хорошего результата. Для решения этой задачи была использована нейронная сеть, устроенная по типу многослойного персептрона(multilayer perceptron) (также в русскоязычной литературе встречается «перцептрон») [3], для предварительной подготовки данных применялся метод главных компонент(Principal Component Analysis, PCA) [4] и линейный дискриминантный анализ(Linear Discriminant Analysis, LDA) [5].
В начале работы осуществляется постановка задачи и оценка существующих методов спектрального анализа.
В первой главе описываются использованные методы предварительной обработки данных.
Вторая глава посвящена описанию и практической реализации нейронной сети по типу многослойного персептрона, а также методу её обучения.
Третья глава, которая является последней, посвящена подбору оптимальных параметров и оценке полученных результатов.
Спектральный анализ (или спектроскопия) — это набор методов, применяемых с целью обнаружения и определения количества элементов, радикалов и соединений, которые входят в состав объекта. Эти методы основываются на изучении спектров воздействия излучения на материю.
Спектроскопия довольно давно и широко используется в химии, физике и астрономии, в большинстве случаев позволяя эффективно идентифицировать вещество или объект и его состав по результатам анализа графика спектра в различных световых диапазонах.
Из преимуществ спектрального анализа можно отметить:
• анализ небольшого количества материала (около 0,1 грамма);
• анализ без разрушения объекта;
• универсальность методов анализа;
• высокая точность;
• высокая производительность.
В данной работе решается задача поиска метода для идентификации породы образцов древесины по их спектрам, так как идентификация материала со сложным составом (например, древесины) является непростой задачей, и, в случае её успешного решения, данный метод можно распространить на другие объекты со сложным составом.
Существенной сложностью в задаче идентификации по спектрам являются проблемы в процессе непосредственного сбора спектров [2]:
• шумы и помехи, связанные с неидеальными компонентами прибора;
3
• воздействие внешних факторов, таких как температура, освещённость и пр.;
• гетерогенность образцов ввиду естественных причин и человеческого фактора.
Классифицируемые множества обрабатываемых данных не являются линейно сепарабельными, в связи с чем стандартные методы классификации, такие как к ближайших соседей(k-nearest neighbors) или к взвешенных ближайших соседей, не дают хорошего результата. Для решения этой задачи была использована нейронная сеть, устроенная по типу многослойного персептрона(multilayer perceptron) (также в русскоязычной литературе встречается «перцептрон») [3], для предварительной подготовки данных применялся метод главных компонент(Principal Component Analysis, PCA) [4] и линейный дискриминантный анализ(Linear Discriminant Analysis, LDA) [5].
В начале работы осуществляется постановка задачи и оценка существующих методов спектрального анализа.
В первой главе описываются использованные методы предварительной обработки данных.
Вторая глава посвящена описанию и практической реализации нейронной сети по типу многослойного персептрона, а также методу её обучения.
Третья глава, которая является последней, посвящена подбору оптимальных параметров и оценке полученных результатов.
Полученный набор методов является универсальным для задачи классификации и не ограничивается идентификацией породы древесины по спектрам образцов. В целом, он может быть применён не только для задач классификации, так как нейронная сеть по типу многослойного персептрона имеет широкий круг потенциального использования, а PCA и LDA также достаточно универсальные методы.
Методы, описанные в данной работе, изначально были опробованы и протестированы в среде MATLAB, так как эта среда имеет большое количество встроенных функций и широкие возможности визуализации результатов. Когда подходящий стек методов для решения задачи был найден, код был переписан на C++, что сделало его бесплатным. Это было сделано для того, чтобы использовать данное решение на компьютерах, на которых нет MATLAB, принимая во внимание, что стандартная лицензия на MATLAB очень дорога: 2650$, что равно 170483₽ за одну копию.
Методы, описанные в данной работе, изначально были опробованы и протестированы в среде MATLAB, так как эта среда имеет большое количество встроенных функций и широкие возможности визуализации результатов. Когда подходящий стек методов для решения задачи был найден, код был переписан на C++, что сделало его бесплатным. Это было сделано для того, чтобы использовать данное решение на компьютерах, на которых нет MATLAB, принимая во внимание, что стандартная лицензия на MATLAB очень дорога: 2650$, что равно 170483₽ за одну копию.
Подобные работы
- Метод идентификации веществ по их спектрам
Бакалаврская работа, математика и информатика. Язык работы: Русский. Цена: 4850 р. Год сдачи: 2016 - ИДЕНТИФИКАЦИЯ ЧЕЛОВЕКА: ПРОБЛЕМЫ И ПЕРСПЕКТИВЫ
Дипломные работы, ВКР, криминалистика. Язык работы: Русский. Цена: 4215 р. Год сдачи: 2018 - Идентификация личности по объектам биологического происхождения
Бакалаврская работа, криминалистика. Язык работы: Русский. Цена: 4770 р. Год сдачи: 2016 - Изучение углеводородного топлива методом инфракрасной спектроскопии в целях пожарно-технической экспертизы
Дипломные работы, ВКР, безопасность жизнедеятельности (БЖД). Язык работы: Русский. Цена: 4900 р. Год сдачи: 2017 - Разработка ИК-спектроскопического метода
идентификации смеси «бензин - моторное масло»
Дипломные работы, ВКР, безопасность жизнедеятельности (БЖД). Язык работы: Русский. Цена: 4900 р. Год сдачи: 2017 - Классификация следов и методов их исследования в трасологии
Бакалаврская работа, юриспруденция. Язык работы: Русский. Цена: 4245 р. Год сдачи: 2021 - Вариативная идентификация природных соединений по масс-спектрам
Бакалаврская работа, математика. Язык работы: Русский. Цена: 4650 р. Год сдачи: 2023 - Вариативная идентификация природных соединений по масс-спектрам
Дипломные работы, ВКР, математика. Язык работы: Русский. Цена: 4600 р. Год сдачи: 2023 - ИЗУЧЕНИЕ СПЕКТРОВ МОЛЕКУЛЫ РНЗ В ДИАПАЗОНЕ 2800-5000 СМ-1
Дипломные работы, ВКР, физика. Язык работы: Русский. Цена: 4450 р. Год сдачи: 2016



