ОБОЗНАЧЕНИЯ И СОКРАЩЕНИЯ 5
ВВЕДЕНИЕ 6
1 Анализ состояния проблем и постановка задачи исследования 8
1.1 Анализ рынка лекарственных препаратов 8
1.2 Анализ состояния оборота фальсифицированных средств 10
1.3 Государственное регулирование фармацевтической отрасли 13
1.4 Постановка задачи 18
2 Методы и модели распознавания текстовой информации 20
2.1 Классические методы распознавания образов 20
2.2 Нейросетевые методы распознания информации 31
2.3 Выбор и обоснование архитектуры и алгоритма обучения искусственной
нейронной сети 38
2.3.1 Анализ архитектур сверточных нейронных сетей 38
2.3.2 Выбор алгоритма сегментации изображения 39
2.3.3 Выбор алгоритма обучения 43
3 Программная реализация нейросетевой архитектуры 48
3.1 Формирование сверточной архитектуры искусственной нейронной сети 48
3.2 Алгоритмы и технология решения задач 49
3.4 Процесс обучения полученной нейросети 51
3.5 Правила пользования разработкой конечным пользователем 52
4 Тестирование нейросетевой архитектуры 60
4.1 Характеристики исходных данных 60
4.3 Результаты эксперимента 62
ЗАКЛЮЧЕНИЕ 64
СПИСОК ИСПОЛЬЗУЕМЫЗ ИСТОЧНИКОВ 66
ПРИЛОЖЕНИЕ А
Интеллектуальные методы распознавания образов представляют собой наиболее математически направленный раздел теории искусственного интеллекта, в котором решаются проблемы, связанные с классификацией объектов различных форм и оттенков. Распознавание образов одна из тех задач, которые без особого труда решаются «естественным» интеллектом. Благодаря этому многие ученные стали заниматься разработкой методов и алгоритмов автоматизированного решения этой задачи. В частном случае, когда образы легко определяются конечным набором признаков, границы классов точно описываются, а сами классы не пересекаются, степень неопределенности можно считать минимальной, и задачу классификации можно решать, не учитывая неопределенность данных. [9,11]
Одними из таких интеллектуальных методов распознавания текстовой информации является искусственные нейронные сети (ИНС). ИНС представляют собой математическую модель функционирования биологических нейронных сетей - сетей нервных клеток живого организма. Как и в биологической нейронной сети, основным элементом искусственной нейросети является нейрон. Соединенные между собой нейроны образуют слои, количество которых может варьироваться в зависимости от сложности нейросети и решаемых ею задач. Кроме того, нейронные сети не программируются в привычном смысле этого слова, они обучаются. Технически обучение заключается в нахождении коэффициентов связей между нейронами. В процессе обучения нейронная сеть способна выявлять сложные зависимости между входными данными и выходными, а также выполнять обобщение. Это значит, что в случае успешного обучения сеть сможет вернуть верный результат на основании данных, которые отсутствовали в обучающей выборке, а также неполных и/или «зашумленных», частично искаженных данных. [8,16]
Актуальность данного метода обусловлена необходимостью распознания текста на упаковках товаров. Исходя из того, что рынок подпольных фармацевтических фабрик продолжает расти, несмотря на предпринимаемые меры по ужесточению контроля за производством и сертификацией лекарственных товаров. Поддельная продукция наносит колоссальный ущерб фармацевтическим компаниям и здоровью пациентов. К сожалению, среди поддельных лекарств нередко встречаются опасные, угрожающие жизни аналоги брендовых препаратов. Для того чтобы снизить риск поступления некачественных или просроченных фирменных товаров на прилавки аптек и аптечных киосков, рентабельно, с помощью искусственной нейронной сети распознать серию и дату на упаковке и сравнить полученные результаты с введенными ранее сведениями о препарате в базу данных.
Целью создания и использования метода нейронной сети является: сокращения времени на сортировку и дальнейшую обработку упаковок, изъять из товарооборота некачественные лекарственные препараты, выявить точные нормативные инструменты для оперативной корректировки и переформирования документооборота в связи с изменением производственных ситуациях.
В результате выполнения заданий магистерской диссертации исследована проблема фальсификата лекарственных средств на Российском фармакологическом рынке. Целью данной работы разработка интеллектуального метода, основанного на искусственной нейронной сети для распознавания текстовой информации с упаковок товаров, для выявления, просроченного и фальсифицированного лекарственного средства.
В ходе магистерского исследования решены следующие задачи:
- Анализ методов распознавания образов;
- Исследование архитектуры нейросети;
- Проектирование и разработка нейросети.
- Обучение выбранной искусственной нейросети;
- Тестирование нейросети.
На основании поставленных задач и требований был разработан интеллектуальный метод, на основе искусственной нейронной сети, архитектура которого - сверточные нейронные сети. Так как, для реализации проблемы она подходит лучше, чем многослойный персептрон и радиально-базисная сеть. СНС состоит из входного слоя двух сверточных, 1 субдитезированного и 2х нейросетевых слоев. Такая архитектура показала себя наиболее подходящей для поставленной задачи.
Также, был выбран пороговый метод сегментации. В дальнейшем принято решение обучить нейронную сеть методом обратного распространения ошибки. Обучалась нейронная сеть на 870 изображений. Сначала приближенных к идеалу фотографий, затем на реальных. Это позволило качественней обучить сверточную нейронную сеть.
На основании вышеперечисленного был разработан алгоритм и программное средство, представленное с экранными формами. Также проведено тестирование на обучающей выборке, состоящей из 1000 тестерах, которые были сформированы самостоятельно в процессе исследования магистерской диссертации
Как показала практика, реализованная искусственная нейронная сеть сумела распознать не все представленные тестеры. В основном это изображения низкого качества, где даже человеческий глаз не смог с точностью определить информацию на изображении. После тестирования был построен график, где четко показана ошибка распознания, которая составила 3%. С уверенностью можно сказать, что реализованный интеллектуальный метод в полной мере решает поставленные задачи, а, следовательно, и цель.
В процессе исследования магистерской диссертации, была опубликована статьи на тему График отгрузки стан 700 в издательстве «ВЕСТНИК СНО НИУ «БЕЛГУ»-2016», ВЫПУСК XX» в сборнике.