Тип работы:
Предмет:
Язык работы:


ПРИМЕНЕНИЕ МАШИННОГО ОБУЧЕНИЯ ДЛЯ ОБРАБОТКИ ПОЛНЫХ ДАННЫХ И АНАЛИЗА ТЕНДЕНЦИЙ НА ОСНОВЕ УПОМИНАНИЙ НАУЧНЫХ РАБОТ В ВИРТУАЛЬНОЙ СРЕДЕ

Работа №47762

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы43
Год сдачи2018
Стоимость4310 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
120
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
1. ПОСТАНОВКА ЗАДАЧИ 5
2. АНАЛИТИЧЕСКАЯ ЧАСТЬ 6
2.1. Обзор предметной области 6
2.1.1. Обзор приложений анализа научных данных 6
2.1.2. Обзор платформ альтметрии 8
2.2. Методы определения и идентификации данных 12
2.2.1. Неструктурированные данные 12
2.2.2. Интеллектуальный анализ или Data Mining 13
2.2.3. Извлечение информации 14
3. РЕЗУЛЬТАТ ПРАКТИЧЕСКОЙ РАБОТЫ 16
3.1. Алгоритм оценки эффективности научной деятельности 16
3.1.1. Существующие методы ранжирования и оценки научных статей 16
3.1.2. Разработка нового алгоритма оценки эффективности научной
деятельности 18
3.2. Проектирование программного продукта 20
3.2.1. Архитектура приложения 20
3.2.2. Структура базы данных 23
3.3. Техническая реализация 24
3.3.1. Обзор технологий 24
3.3.2. Подключение библиотек 25
3.3.3. Реализация автоматизированной обработки данных 26
3.3.4. Реализация веб-сервера 27
3.3.5. Реализация пользовательского интерфейса 28
ЗАКЛЮЧЕНИЕ 31
БИБЛИОГРАФИЯ 32
ПРИЛОЖЕНИЕ 1 35
ПРИЛОЖЕНИЕ 2


За последние годы получила широкое развитие научная виртуальная среда, в рамках которой происходит полноценное обсуждение научных статей, исследований, и совместная работа над ними. Научной виртуальной средой могут выступать не только широко известные и многопрофильные блоги, микроблоги (Twitter и т.д.) и социальные сети (Facebook, Вконтакте, Google+ и т.д.), но и узкопрофильные, специализированные социальные научные сети (ResearchGate, Social Science, Computer Science Student Network, Academia.eduи др.). Подобные инструменты помогают ученым более эффективно вести научные коммуникации, вступать в дискуссии в режиме онлайн, что, в свою очередь, плодотворно влияет на дальнейшую научную деятельность [1].
Общеизвестно, что основными показателями научной работы являются библиометрические показатели, такие как импакт-фактор, индекс цитируемости, индекс Хирша, индекс оперативности и т.д. Библиометрический анализ основан на различных исходных данных и производится специальными программами по заданным алгоритмам. Вышеуказанные наукометрические показатели активно используются при расчете эффективности научной деятельности, выбора научных приоритетов, оценке научного потенциала страны, исследования закономерностей функционирования научных систем, но данные метрики не дают полного представления, так как не рассматривают внимание общества к работе в виртуальной среде и не включают анализ результатов научной деятельности, проведенной в сети Интернет.
Однако, существуют инструменты и системы, отражающие альтернативные показатели, которые позволяют оценить обсуждаемость тем в научной виртуальной среде, и отражают влияние научной деятельности исследователя или организации на общественность.
Из этого можно сделать вывод о том, что существует проблема неполного оценивания эффективности научной деятельности учёного и организации.
Таким образом создание автоматизированной системы, которая бы вела анализ библиометрических и альтернативных показателей научных статей, а также ранжирование (установление отношения линейного порядка) этих данных, поможет отразить действительно актуальные темы, тренды в научной среде.
Исходя из этого сформировалась проблема работы: “Нет инструмента, позволяющего производить поиск актуальной научной литературы по категориям научной среды за малое время, основанный не только на библиометрических, но и на альтметрических показателях”.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения данной работы были изучены наукометрические показатели и рассмотрены существующие приложения.
Выявлено, что реализованное приложение должно рассматривать, как теоретические знания по наукометриям, так и теорию интеллектуального анализа данных.
Выделена проблема неполного оценивания эффективности научной деятельности учёного и организации. Выявлен алгоритм, который выводит по убыванию наиболее релевантные поисковому запросу, качественные и наиболее обсуждаемые и/или просматриваемые в медиа-ресурсах научные работы.
Спроектировано и реализовано приложение, обеспечивающее полный процесс от сбора данных до визуализации в автоматическом режиме и реализующее алгоритм совмещающий альтернативные и библиометрические метрики.
Приложение является актуальным в данное время, так как может быть использовано учеными для автоматизированного получения новых сведений в нескольких областях их исследований, что сократит время поиска релевантной литературы для научных работ.



1. Бусыгина Т. В. Альтметрия как комплекс новых инструментов для оценки продуктов научной деятельности // Идеи и идеалы. - 2016. - Т. 2. - №. 2. - С. 79-87.
2. ImpactStory [Электронный ресурс] / Режим доступа: https://impactstory.org/, свободный
3. Altmetric.com[Электронный ресурс] / Режим доступа: https://www.altmetric.com/, свободный
4. PlumAnalytics [Электронный ресурс] / Режим доступа: https://plumanalytics.com/, свободный
5. CrowdoMeter [Электронный ресурс] / Режим
доступа: https://github.com/mfenner/crowdometer, свободный
6. Методы интеллектуального анализа данных [Электронный ресурс] / Режим доступа:www.ibm.com/developerworks/ru/library/ba-data-mining-techniques/index.html, свободный
7. Найдич А. Большие данные: насколько они большие? // Компьютер Пресс. - 2012. - № 12. - С. 22-29.
8. Черняк Л. Большие Данные - новая теория и практика // Открытые системы. - № 10. - 2011.
9. IBM Watson [Электронный ресурс] / Режим доступа: https://www.ibm.com/watson/, свободный
10. Редькина Н.С. Библиометрия: история и современность //Молодые в библиотечном деле. - 2003. - № 2. - С.76-86
11. Павловска Е.Ю. Информационные методы оценки тенденций развития научных направлений // Павловска Е.Ю. - М.: ВИНИТИ, 1990. - Т. 17. - С.
3 :120. - (Итоги науки и техники. Сер. Информатика; Т. 17).
12. Гуреев В. Н., Мазов Н. А., Шрайберг Я. Л. Анализ тематики и цитирования публикаций в применении к формированию подписки на журналы // Библиосфера. - 2012. - № 4. - С. 57-66.
13. Техническая документация Altmetric.com[Электронный ресурс] / Режим доступа:
https://docs.google.Com/spreadsheets/d/1ndVY8Q2LOaZO P HDmSQulagjeUrS 250mAL2N5V8GvY, свободный
14. How is the Altmetric Attention Score calculated? [Электронный ресурс] / Режим доступа: https://help.altmetric.com/support/solutions/articles/6000060969-how-is-the- altmetric-score-calculated-, свободный
15. PubMed [Электронный ресурс] / Режим
доступа: https://www.ncbi.nlm.nih.gov/pmc/, свободный
16.IBM Watson [Электронный ресурс] / Режим доступа: https://www.ibm.com/watson/,свободный
17. ElasticSearch [Электронный ресурс] / Режим
доступа: https://www.elastic.co/products/elasticsearch, свободный
18. Java [Электронный ресурс] / Режим
доступа:http://www.oracle.com/technetwork/java/index.html, свободный
19.Spring [Электронный ресурс] / Режим доступа: https://spring.io/, свободный
20. Gradle [Электронный ресурс] / Режим доступа: https://gradle.org/, свободный
21. MySQL [Электронный ресурс] / Режим доступа: https://www.mysql .com/, свободный
22. FasterXML [Электронный ресурс] / Режим
доступа: https://github.com/FasterXML/jackson, свободный
23. React Redux [Электронный ресурс] / Режим
доступа: https://redux.js. org/basics/usage-with-react,свободный
24.IntelliJ IDEA [Электронный ресурс] / Режим
доступа: https://www.j etbrains.com/idea/, свободный
25. Guava: Google Core Libraries for Java [Электронный ресурс] / Режим
доступа: https://github.com/google/guava, свободный
26. Apache Commons Lang [Электронный ресурс] / Режим
доступа: https://commons.apache.org/proper/commons-lang/, свободный
27. Hibernate [Электронный ресурс] / Режим доступа:http://hibernate. org/,свободный
28. Springfox Swagger [Электронный ресурс] / Режим
доступа: https://springfox.github.io/springfox/docs/current/, свободный
29. Apache Commons IO [Электронный ресурс] / Режим
доступа: https://commons.apache.org/proper/commons-io/, свободный
30. Ruaschig Jarchive [Электронный ресурс] / Режим
доступа: https://github.com/monya/jarchive, свободный
31. Apache PDFBox - A Java PDF Library [Электронный ресурс] / Режим доступа: https://pdfbox.apache.org/, свободный
32. Junit. The new major version of the programmer-friendly testing framework for
Java 8 and beyond [Электронный ресурс] / Режим
доступа: https://junit.org/junit5/, свободный
33. React Tagcloud [Электронный ресурс] / Режим
доступа: https://github.com/IjzerenHein/react-tag-cloud, свободный
34. React Simple Maps [Электронный ресурс] / Режим
доступа: https://www.react-simple-maps. io/, свободный
35. Извлечение, преобразование и загрузка (ETL) [Электронный ресурс] /
Режим доступа: https://docs.microsoft.com/ru-ru/azure/architecture/data- guide/relational-data/etl, свободный


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ