Актуальность темы исследования. В современных условиях для управления бизнес-процессами каждого современного промышленного производства используют различные информационные системы (ИС), которые призваны решать, как задачи управления технологическим оборудованием, используемого для производства продукции, так и задачи сбора, хранения и анализа разнородной информации. Как правило, промышленные ИС по укрупненной классификации (Е.П. Стефани) разделяются на: АСУ ТП (автоматизированные системы управления технологическими процессами), MES-системы (Manufacturing Execution System) - автоматизированные системы управления производственной деятельностью предприятия в режиме реального времени, ERP-системы (Enterprise Resource Planning), обеспечивающие автоматизацию планирования, учета, контроля и анализа каждого бизнес- процесса промышленного предприятия. При этом оказывается, что каждая из данных типов ИС имеет собственные, уникальные источники информации, а также скорость генерации информации и структуру информации.
В результате информация о жизненном цикле одной и той же единицы продукции (ЕП) промышленного производства, которая необходима для решения задач управления, оптимизации бизнес-процессов, выявления и устранения причин брака, оказывается размещенной в нескольких автономных хранилищах данных (ХД).
{Договор] - совокупность параметров бизнес-процессов, относящихся к заключенным договорам о производстве ГП;
{Заказ] - совокупность параметров бизнес-процессов, относящихся к заказам, выданным производственным службам, на основании заключенных договоров о производстве ГП;
{План] - совокупность параметров плана производства ЕП, сформированного на
основании заключенных договоров и заказов на производство продукции;
{ЕП] - совокупность параметров ЕП, характеризующих состояние ЕП на каждом из этапов производственного процесса, а также, собственно, параметров технологических процессов.
С точки зрения распределения данных, относящихся к сущности «ГП», эта сущность интегрирует в себе множество разнородных данных, которые собираются в автономные БД АСУ ПТ, MES- и ERP-систем. Как следствие, возникает проблема поиска информации, релевантной решаемой задаче, которая находится в нескольких автономных ХД. При этом дополнительные трудности возникают в связи с тем, что в большинстве случаев информация, хранящаяся в ХД одной ИС, оказывается не синхронизованной во времени с информацией, хранящейся в ХД в другой ИС.
В полной мере перечисленные выше проблемы, связанные с вынужденным распределением технологической информации по нескольким автономным ХД, и необходимости организации в этой связи информационного взаимодействия между различными ИС, присущи современному металлургическому производству (МП), на котором реализуется полный жизненный цикл продукции: руда-чугун-сталь-металлопрокат, а также, при необходимости, утилизация продукции МП, что, закономерно, приводит к динамическому изменению структуры технологической информации, соответствующей ее текущему состоянию, на каждом из этапов жизненного цикла (ЖЦ) продукции МП.
Выход из сложившейся ситуации достаточно очевиден - перейти от использования автономных ХД к использованию единого ХД, пригодное для хранения всей информации, создающейся в процессе производства продукции промышленного предприятия, что позволит хранить, извлекать и анализировать информацию, структура которой принципиально разнородна и может изменяться с течением времени.
Для создания единого ХД промышленного производства требуется решить многочисленные проблемы интеграции разнородных и, зачастую, несогласованных друг с другом, создаваемых разнородными источниками, работающими на различных физических принципах и обеспечивающим различный темпы генерации информации, которые далее мы будем называть гетерогенными данными (ГД), соответственно единое ХД - хранилищем гетерогенных данных (ХГД).
Степень проработанности темы. Анализ работ, посвященных различным аспектам разработки ХД и проблемам интеграции разнородных данных, показал, что сегодня создана теоретическая база для разработки моделей данных, в том числе:
- реляционные модели данных (E. F. Codd, S. B. Codd and C. T. Salley, В.И. Халимон, Г.А. Мамаева, А.Ю. Рогов, В.Н. Чепикова; В.И. Швецов, А.Н. Визгунов, И.Б. Мееров, Ю.П. Парфенов, Т.С. Карпова и др.);
- объектно-ориентированные модели данных (Г. Буч, Beynon-Davies, А. В. Сиха Багуи Зафиевский, А. А. Короткин, А. Н. Лататуев, В.И. Швецов, А.Н. Визгунов, И.Б. Мееров, И.А. Микляев и др.);
- темпоральные модели данных (А.В. Балдин, Д.В. Елисеев, К.Г. Агаян, Д.В Елисеев и др.).
Существуют технологии, предназначенные для создания ХД различных типов, в том числе:
- технология транзакционной организации записи OLTP (Online Transaction Processing); предназначенная для ХД с заранее выбранной и далее не модифицируемой структурой хранения данных (А. В. Зафиевский, А. А. Короткин, А. Н. Лататуев, В.И.Швецов, А.Н. Визгунов, И.Б. Мееров, Ю.П. Парфенов, Т.С. Карпова, И. Афанасьев и др.);
- технология OLAP (Online Analytical Processing), ориентированная на хранение большого объема структурированных данных, относящихся к определенной предметной области (Э. Спирли, Сураджит Чаудхури, Умешвар Дайал, Венкатеш Ганти, С. Федечкин, С. Архипенков, Д. Голубев, О. Максименко; А.М. Бородин, А. Барсегян, М. С. Куприянов, В. В. Степаненко, И. И. Холод., А.Б. Бергер и др.);
- технология Oracle Streams (см. https://oracle-patches.com/oracle/prof), предназначенная для интеграции данных, обмена данными и сообщениями с помощью механизма Advanced Queuing (см: https://www.oracle.com/database/technologies/advanced-queuing.html) в однородной среде и гетерогенных средах.
Также были поставлены задачи интеграции разнородных данных и разработаны подходы к их решению (David Taniar, Li Chen, D. Beneventano, S. Bergamaschi, B.E. Prasad, P.G. Reddy, Amar Gupta, Д. Бин, Г. Хоп, Б. Вульф, О.А. Морозова, Н. Игнатович Флориан Дениэль, Мариселла Матера, Ю. Джин, Булем Бенаталлах, Реджис Сен-Поль, Фабио Касати, Л. А. Калиниченко, И. А. Думченков, Л. Черняк, К. А. Аксенов и др.), которые, однако, не являются универсальными.
Также отметим, что сегодня в соответствующем сегменте рынка программного обеспечения представлено большое число систем управления базами данных (СУБД), например, Oracle (https://www.oracle.com/index.html), MS SQL (https://www.microsoft.com/ru- ru/sql-server/sql-server-downloads) и др.
Однако, несмотря на существенный прогресс, достигнутый в теории проектирования ХД и разработки методов интеграции неоднородных, по сути, гетерогенных данных (ГД), как показали результаты анализа опыта применения ИС и ХД на МП, на момент начала исследования не существовало ни одного единого ХГД МП.
Данная ситуация, с нашей точки зрения, обусловлена, в первую очередь, отсутствием методологии структурного синтеза единого ХГД, под которой мы понимаем совокупность моделей (структурные модели информационных потоков промышленного производства; информационные и онтологические модели источников информации) и технологии разработки ХГД, выбор которых должен базироваться на результатах системного анализа выбранного промышленного производства и соответствующих информационных потоков.
Основной целью исследования является разработка методологии структурного синтеза ХГД и ее апробация на примере МП.
Для достижения цели исследования требуется решить следующие задачи:
1. Проанализировать методы интеграции разнородных данных, технологий хранения и доступа к разнородным данным, их современное состояние, условия сознание единого хранилища разнородных данных.
2. Обосновать гетерогенную природу данных производственных процессов многоэтапного промышленного предприятия, анализ которых позволит решать задачи управления качеством продукции.
3. Разработать универсальную методологию структурного синтеза единого ХГД, провести системный анализ технологических процессов, обосновать применение информационных сущностей «План производства», «Г отовая продукция», «Единица продукции», привести их онтологическое описание, разработать логическую структуру единого ХГД и обосновать выбор технологии создания единого ХГД, которая обеспечит реализацию логической структуры ХГД.
4. Разработать и провести тестирование модуля ХГД МП, как части Автоматизированной системы выпуска металлургической продукции (АС ВМП).
Объект исследования - методы интеграции ГД, создаваемых в процессе промышленного производства.
Предмет исследования - Информационные и онтологические модели источников данных МП.
Научная новизна:
1. Обоснована сущность ГП МП, которая состоит из двух сущностей <ИИ, ЕП>.
2. Разработана структурная схема сущностей ГП, ПП, ЕП, а также информационная и онтологическая модели источников данных, что обеспечивает возможность структурного синтеза ХГД МП.
3. Разработана научно обоснованная методология структурного синтеза ХГД промышленных предприятий.
Теоретическая значимость диссертационного исследования заключаются в: разработке методологии структурного синтеза единого ХГД МП, включающей в себя структурные модели информационных потоков МП; информационные и онтологические модели источников информации МП; синтезированную логическую структуру ХГД МП и обоснованно выбранную технологию разработки ХГД, которую можно тиражировать на других промышленных предприятиях.
Практическая значимость диссертационного исследования заключаются в: разработке на основе созданной методологии синтеза ХГД МП программного модуля «ХГД МП», как составной части системы выпуска металлургической продукции, и подтверждение его работоспособности результатами тестовых испытаний.
Результаты диссертационного исследования были получены и использованы в ходе выполнения договора № 02.G25.31.0055 (проект 2012-218-03-167) на разработку АС ВМП.
Методология и методы исследования. В работе использованы методы системного анализа и структурного синтеза, информационного и онтологического моделирования.
Основные положения, выносимые на защиту:
1. Разработанная информационная модель ГП МП позволяет решить задачу структурного синтеза ХГД МП.
2. Разработанная методология структурного синтеза ХГД МП является универсальной и может быть использована на других промышленных предприятиях .
3. Разработанные программные инструменты управления ХГД МП, обеспечивают его функционирование в составе АСВМП и работоспособность системы в целом
Достоверность результатов исследования подтверждается использованием математических методов, адекватным задачам исследования, а также результатами тестовых испытаний модуля «ХГД МП».
Внедрение результатов диссертационного исследования. Результаты диссертационного исследования используются в Уральском федеральном университете имени первого Президента России Б.Н. Ельцина, Екатеринбург, Россия (акт об использовании результатов от 20.08.2021); в АО «Ай-Теко», Москва, Россия (акт об использовании результатов от 01.09.2021); в ООО «Октоника», Екатеринбург, Россия (акт об использовании результатов от 10.09.2021).
Апробация работы. Результаты работы докладывались и обсуждались на научно-практических конференциях: Международные научно-технические конференция «Динамика Систем, Механизмов и Машин» (Омск, 2016, 2017); Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology - USBEREIT (Екатеринбург, 2018¬2020); Новые Информационные Технологии в Исследовании Сложных Структур (Томск, 2018); International Conference on Applied Mathematics and Computational Science - ICAMCS (Budapest, Hungary, 2018); International Multi-Conference on Industrial Engineering and Modern Technologies - FarEastCon (Владивосток, 2019); Межвузовская конференция «Задачи Системного Анализа, Управления и Обработки Информации» (Москва, онлайн, 26 октября 2020), III международная студенческая научная конференция «Инновационные механизмы управления цифровой и региональной экономикой» (Москва, онлайн, 17-18 июня 2021).
Диссертационное исследование выполнено при финансовой поддержке гранта РФФИ № 19-37-90049 «Разработка методов интеграции и доступа к гетерогенным данным металлургического производства».
Личный вклад автора состоит в проведении системного анализ информационных потоков МП, разработке информационных и онтологических моделей ГД МП, логической структуры ХГД МП, методологии структурного синтеза ХГД, участие в разработке методики тестирования модуля ХГД МП и его проведении.
Публикации. По теме диссертации опубликовано 12 научных работ, в том числе 11 статей опубликованы в рецензируемых научных журналах и изданиях, определенных ВАК РФ и Аттестационным советом УрФУ, включая 9 статей в изданиях, индексируемых в международных цитатно-аналитических базах Scopus и Web of Science.
Структура и объем диссертации Диссертация состоит из введения, четырех глав, заключения, списка литературы из 102 наименований, содержит 57 рисунка и 24 таблиц. Основной текст работы составляет 131 страницу, приложения составляют 49 страниц. Общий объем - 180 страниц.
1. Проведен анализ проблем интеграции разнородных данных, методов интеграции, технологий хранения и доступа к разнородным данным показал, что их современное состояние потенциально позволяет создавать хранилища разнородных данных, однако, для этого необходима разработка методологии структурного синтеза хранилищ гетерогенных данных.
2. Общей проблемой для каждого многоэтапного промышленного предприятия является гетерогенность данных производственных процессов, для анализа которых и решения задач управления качеством продукции необходимо разместить эти данные в едином ХГД.
3. Разработана универсальная методология структурного синтеза единого ХГД, предусматривающая системный анализ технологических процессов с целью разработки информационных сущностей «План производства», «Готовая продукция», «Единица продукции», их онтологического описания, разработки логической структуры единого ХГД и обоснования выбора технологии разработки единого ХГД, которая обеспечит реализацию логической структуры ХГД.
4. На основе методологии структурного синтеза ХГД разработан модуль «ХГД МП», являющийся неотъемлемой частью АС ВИП, и соответствующие программное обеспечение единого ХГД МП, работоспособность которого подтверждена результатами тестовых испытаний.
Рекомендуется дальнейшее развитие темы в направлении применения предложенной в диссертации методологии структурного синтеза ХГД для разработки единых ХГД промышленных предприятий других отраслей и их использование для повышения качества выпускаемой продукции и оптимизации бизнес-процессов предприятия.
1. Porshnev S. The Development of a Heterogeneous MP Data Model Based on the Ontological Approach / S. Porshnev, A. Borodin, O. Ponomareva, S. Mirvoda and O. Chernova // Symmetry. - 2021. - Vol. 13(5). - No. 813 (1,2 п.л./ 0,24 п.л.) (Scopus, Web of Science)
2. Ponomareva O.A. Date preparation module of automated metallurgical products production system / O.A. Ponomareva, S. Porshnev, A. Borodin, & S. Mirvoda // IOP Conference Series: Materials Science and Engineering. - 2021. - Vol. 1047(1). - No. 012003 (0,26 п.л./ 0,06 п.л.) (Scopus)
3. Porshnev S.V. A Mathematical Model for the Description of Metallurgical Production on the Basis of Heterogeneous Data / S. Porshnev, O. Ponomareva, S. Trofimov and O. Anchugova // 2020 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology, USBEREIT 2020. - 2020. - No. 9117711. - pp. 496-498 (0,24 п.л./ 0,06 п.л.) (Scopus)
4. Porshnev S. Problems and Methods for Integrating Heterogeneous Data (on Example, Metallurgical Production). / S. Porshnev, O. Ponomareva, A. Borodin, S. Mirvoda // International Multi-Conference on Industrial Engineering and Modern Technologies, FarEastCon 2019. - 2019. - No. 8934336 (0,49 п.л./ 0,12 п.л.) (Scopus)
5. Borodin A. Design of DSQLM Language Extensions. / A. Borodin, S. Mirvoda, S. Porshnev, O.A. Ponomareva // 2019 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology, USBEREIT 2019. - 2019. - No. 8736644. - pp. 295-298 (0,24 п.л./ 0,06 п.л.) (Scopus)
6. Поршнев С.В. Автоматизированная система выпуска металлургической продукции: от разнородных баз данных к созданию единого хранилища данных / С.В. Поршнев, О.А Пономарева, А.М. Бородин, С.Г. Мирвода // Автоматизация. Современные технологии.
- 2018. - Т. 72(10). - С.435-440 (0,45 п.л. /0,11 п.л.)
7. Поршнев С.В. Модификация функции penalty R-дерева над обобщенным деревом поиска индексов для повышения производительности модуля CUBE POSTGRESQL / С.В. Поршнев, О.А Пономарева, А.М. Бородин, С.Г. Мирвода // Программная инженерия. - 2018. - Т. 9(1). - С.22-28 (0,6 п.л. /0,15 п.л.)
8. Porshnev S. The Concupt of Automated System of Steel Production Storage Data Structure. /
S. Porshnev, A. Borodin, A. Kovaleva, O.A. Ponomareva / International Conference on Applied Mathematics and Computational Science, ICAMCS.NET 2018. - 2018. -
No. 8955775. - pp. 19-22 (0.35 п.л./ 0,09 п.л.) (Scopus, Web of Science)
9. Borodin A. Improving generalized inverted index lock wait times. / A. Borodin, S. Mirvoda, S. Porshnev, O.A. Ponomareva // Journal of Physics: Conference Series. - 2018. - Vol. 944(1).
- No. 012022. (0,38 п.л./ 0,09 п.л.) (Scopus, Web of Science)
10. Porshnev S. Computer-Aided system for metallurgy production output: From heterogeneous data bases to unified data warehouse. / S. Porshnev, A. Borodin, E.Dymova, O.A. Ponomareva // 2018 Ural Symposium on Biomedical Engineering, Radioelectronics and Information Technology, USBEREIT 2018. - 2018. - No. 8384571. - pp. 140-143 (0,24 п.л./ 0,06 п.л.) (Scopus)
11. Trofimov S. Data formalization by algebra of sets in multi-dimension space. / S.Trofimov &O.A. Ponomareva // 2016 Dynamics of Systems, Mechanisms and Machines, Dynamics. - 2016. - No. 7819099. (0,37 п.л./ 0,19 п.л.) (Scopus, Web of Science)
В других изданиях:
12. Поршнев С.В. Обоснование структуры хранения данных АИС ВМП / С.В. Поршнев, А.М. Бородин, О.А Пономарева, С.Г. Мирвода // Новые информационные технологии в исследовании сложных структур: Материалы 12 конференции. - 2018. - С. 40 (0,69 п.л. /0,17 п.л.)