ВВЕДЕНИЕ 4
1. ПОСТАНОВКА ЦЕЛИ И ЗАДАЧ 5
2. ОБЩЕЕ ОПИСАНИЕ ПРЕДМЕТНОЙ ОБЛАСТИ 6
3. ЗАИМСТВОВАНИЯ В СФЕРЕ МАТЕМАТИКИ 8
3.1 Копирование - Вставка 8
3.2 Изменение символов 9
3.3 Изменение буквенных идентификаторов 11
3.4 Изменение способа представления содержимого 12
3.5 Введение или сокращение промежуточных шагов 13
3.6 Преобразование выражений 14
4. ПОДХОДЫ К ОБНАРУЖЕНИЮ ЗАИМСТВОВАНИЙ В НАУЧНЫХ
СТАТЬЯХ ПО МАТЕМАТИКЕ 15
4.1 Синтаксические подходы 15
4.2 Структурные подходы 17
4.3 Смешанные подходы 18
4.4 Семантические подходы 18
5. СОВМЕСТИМОСТЬ ПОДХОДОВ ПОИСКА ЗАИМСТВОВАНИЙ С ИХ
ВИДАМИ 20
6. РУССКОЯЗЫЧНЫЕ СИСТЕМЫ ПРОВЕРКИ ТЕКСТОВ НА
ЗАИМСТВОВАНИЯ 21
7. РАЗРАБОТКА СИСТЕМЫ ПОИСКА ЗАИМСТВОВАНИЙ В
МАТЕМАТИЧЕСКИХ СТАТЬЯХ 25
ЗАКЛЮЧЕНИЕ
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 27
ПРИЛОЖЕНИЕ
В эпоху информации и коммуникации людям стало гораздо проще делиться любыми видами информации. Сейчас с помощью пары щелчков мыши легко получить доступ к интересующим данным. Почвой для заимствований является мгновенная доступность информации, которую легко идентифицировать и копировать в личных или коммерческих целях.
Заимствование - в широком смысле, намеренная или непреднамеренная выдача чужой работы или ее часть за свою в целях доведения до других лиц ложную информацию о себе как о действительном авторе.
В современном мире производители систем проверки документов на плагиат разрабатывают все более совершенные решения для обеспечения обнаружения плагиата. Проблема соблюдения авторских прав как никогда остро стоит в сфере образования и науке. На рынке существует множество коммерческих решений, доступных как частным пользователям, так и корпоративным клиентам.
Но не каждое программное средство адаптировано под конкретные направления науки, в каждом из которых есть свои отличительные черты и особенности. В частности, многие статьи по математике опираются на уже существующие теоремы, леммы, определения и формулы.
Актуальность сравнительного анализа программных средств, широко используемых на сегодняшний день, обуславливается трудностью выбора системы проверки на заимствования для конкретной сферы деятельности.
Несмотря на усилия, которые прилагаются для выявления заимствований, данная проблема продолжает оставаться повсеместной во всех сферах деятельности человека. К настоящему моменту уже разработано большое количество ПО, которое автоматически идентифицирует подозрительные документы, считает процент уникальности научно-исследовательских работ. Но, насколько мне известно, в настоящее время ни один из уже представленных на рынке инструментов не предназначены конкретно для одной сферы деятельности, в частности - математики. Это создает угрозу нашему поколению, ведь математические материалы составляют значительную часть научного вклада в академические работы.
В результате выполнения выпускной квалификационной работы были выполнены практически все поставленные задачи, а именно: были выявлены особенности заимствований в сфере математики и изучены алгоритмы их поиска, были также протестированы уже существующие решения на рынке на предмет обнаружения факта заимствования в формулах. Также, был разработан алгоритм поиска заимствований.
1. Информационно-аналитический журнал «Университетская книга».
Проблема плагиата в научных произведениях // [Электронный ресурс] / Режим доступа: http://www.unkniga.ru/copvright/copyrightcom/7830-
problema-plagiata-v-nauchnvh-proizvedenivah.html
2. Университет МГИМО. Плагиат vs. Заимствование // [Электронный ресурс] / Режим доступа: https://mgimo.ru/about/news/experts/240689/
3. Maurice-Roman Isele. Analyzing Similarity in Mathematical Content to Enhance the Detection of Academic Plagiarism. 2018
4. Norman Meuschke, Moritz Schubotz, Felix Hamborg, Tomas Skopal, Bela Gipp. Analyzing Mathematical Content to Detect Academic Plagiarism
5. Bruce Miller, Abdou Youseff. Technical Aspects of the digital library of mathematical functions. 2003
6. Michael Kohlhase, loan Sucan. A search engine for mathematical formulae. 2006
7. Qun Zhang, Abdou Youseff. An approach to math-similarity search. 2014
8. Moritz Schubotz, Alexey Grigorev, Marcus Leich, Howard S Cohl, Norman Meuschke, Bela Gipp, Abdou S Youssef, Volker Markl. Semantification of identifiers in mathematics for better math information retrieval. 2016