Тип работы:
Предмет:
Язык работы:


Реализация функции поискового робота по сбору информации в наукометрических системах

Работа №45136

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы53
Год сдачи2019
Стоимость4770 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
293
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
ГЛАВА 1 5
1.1. Что такое поисковый робот. Основные понятия 5
1.2. Как работают поисковые роботы 9
1.3. Веб-скрапинг 16
1.4. Индекс Хирша. Scopus 29
ГЛАВА 2. Разработка программы для автоматического сбора индекса Хирша 34
Заключение 47
Литература 48
Приложения 50
Приложения. 50

В настоящее время бурно развивается Всемирная паутина и с каждым днем все более актуальной становится проблема автоматизированного сбора и анализа информации, размещаемой на различных веб-ресурсах. В 90-х годах прошлого столетия Всемирная паутина представляла собой огромное количество слабо структурированной информации, производить поиск в которой человеку было сложно. Именно тогда стали появляться первые разработки в сфере автоматизированных агентов, облегчающих задачу поиска необходимой информации в паутине. Основной частью таких систем является поисковый робот — программный комплекс, осуществляющий навигацию по веб-ресурсам и сбор информации для базы данных приложения-агент.
Сегодня уже практически невозможно представить Интернет без информационно-поисковых систем: поисковый робот, парсер, скрапер, граббер. Названий много, но цель одна - сбор информации.
В Казанском (Приволжском) Федеральном университете ежемесячно составляется рейтинг научно-педагогических работников (НИР) на основе данных, размещённых в личных кабинетах сотрудников в системе «Электронный университет». Целью рейтингового оценивания является создание системы мотивации НИР к качественной и эффективной деятельности, развитию инициативы, достижению ключевых показателей Программы развития Университета; повышение уровня объективности в оценке вклада каждого НИР в образовательный процесс и научную деятельность.
Для построения рейтинга используются такие показатели, как количество и качество публикаций, проиндексированных в базе Web of Science и Scopus за отчётный период, промежуток времени, за который составляется рейтинг. Принадлежность статьи к отчётному периоду определяется по дате её добавления в личный кабинет сотрудника.
Одним из показателей для построения рейтинга является индекс Хирша, который служит оценкой активности ученого в плане публикаций.
Актуальность работы заключается в том, что появилась необходимость отойти от ручного заполнения индекса Хирша в личном кабинете сотрудниками КФУ, чтобы избежать некорректного заполнения данных и проверки достоверности введённой информации Центром перспективного развития. Для всех преподавателей индекс Хирша должен заполняться по базе данных Scopus автоматическим считыванием соответствующих данных с профильных страниц сотрудников.
Целью работы являлась автоматизация процесса заполнения индекса Хирша для подсчёта рейтинга НПР.
Задачи:
• изучение методов разработки программного обеспечения и перспективных методик разработки веб-приложений;
• разработка программы автоматического определения индекса
Хирша сотрудников КФУ;
• тестирование разработанный программы в режиме дополнительного индекса Хирша сотрудников КФУ (добавление дополнительного столбца, содержащего индекс, полученный автоматическим образом);
• написание процедуры для обработки данных на стороне
информационно-аналитической системы;
• опытная эксплуатация, формирование технической документации по проекту, техническое сопровождение проекта.
Методы исследования: анализ литературы, статей и интернет ресурсов.
Структура выпускной квалификационной работы: введение, две главы, заключение, список литературы. Работа содержит приложения, графики, таблицу, диаграммы.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Поисковый робот - это не какая-то страшная и загадочная вещь как могло показаться на первый взгляд. Поисковые роботы в настоящее время могут облегчить работу человеку любой профессии в поиске необходимой информации. Работа поискового робота достаточно проста и человеку- специалисту написать свою программу для получения информации достаточно просто.
В данной работе мы узнали, что собой представляют поисковые роботы, как они классифицируются, как они видят веб-страницу и как они работают. Изучая функцию поискового робота по сбору информации в наукометрических системах, мы разработали программу своего робота, собирающего информацию с персональных страниц авторов-сотрудников КФУ в системе Scopus и позволяющего определить Индекс Хирша.
Автоматизированное определение Индекса Хирша облегчает работу по рейтинговому оцениванию достижений ключевых показателей сотрудников Университета; повышение уровня объективности в оценке вклада каждого НИР в образовательный процесс и научную деятельность.
Составленная нами программа по автоматическому сбору индекса Хирша сотрудников КФУ была протестирована на сервисе КФУ. Программа работает, были получены индексы Хирша для всех сотрудников КФУ, указавших ссылку на профиль в системе Scopus. Также был проведен сравнительный анализ индекса Хирша, полученного в результате автоматизированной программы и заполненного сотрудниками вручную.
Чтобы избежать некорректного заполнения данных и проверки достоверности введённой информации сотрудниками КФУ на своих личных страницах составленная нами программа рекомендуется для использования.
В ходе выпускной квалификационной работы были выполнены все поставленные задачи и достигнута поставленная цель.


1. Поисковый робот. https://ru.vikipedia.org/viki/noHCKQBbiH робот
2. Что такое поисковый робот. https://wiki.rookee.ru/poiskovyi-robot/
3. Поисковый робот. https://www.seonews.ru/glossarv/poiskovviv-robot/
4. Бот (программа). https://щ.wikipedia.org/wiki/Бoт (программа)
5. Поисковый робот что это такое и как он работает. http://seo- dnevnik.ru/blogosfera/poiskovviv-robot-robotvi-poiskovvih-sistem.html
6. Роботы поисковых систем. 2006, https://www.seonews.ru/masterclasses/robotvi-poiskovvih-sistem/
7. Адаптивные краулер для поиска и сбора внешних гиперссылок Печников А.А, Чернобровкин Д.И. 2012
https://cvberleninka.ru/article/v/adaptivnvv-krauler-dlva-poiska-i-sbora-
vneshnih-giperssvlok
8. Индекс. 2015, https: //apanshin.ru/blog/indeks/
9. Поисковый запрос. 2018, https://ru■wikipedia■org/wiki/Пoискoвый запрос
10. Поисковые роботы. Маркова Т.И., Захарова К.В. 2009 https://cvberleninka.ru/article/v/poiskovve-robotv
11. Поисковые роботы. 2010, http: //wiki.webimho .ru/поисковый-робот
12. Коды ответа HTTP. 2019,
https: //developer. mozilla. org/ru/docs/Web/HTTP/Status
13. HTML. 2019, https: //ru.wikipedia.org/wiki/HTML
14. Индекс Хирша. https://ru.wikipedia.org/wiki/Индекс Хирша
15. Что такое индекс Хирша и как его повысить. Алекс Званский, 2017 https://wos-scopus.com/chto-takoe-indeks-hirsha/
16. Методика поиска в базе данных Scopus. Дудникова О.В., Бондаренко С.А., 2011
https://librarv■sfedu■ru/media/upload/%20Материалы%20ДПО%20/Учебн о-методическое%20пособие Scopus2.pdf 17.Scopus. 2018 https: //ru.wikipedia. org/wiki/Scopus
18. Web Scraping with Python. Ryan Mitchell, 2015 https://vanfei.site/docs/dpsa/references/PvWebScrapingBook.pdf
19. Requests Documentation Release 2.21.0. Kenneth Reitz, 2019 https://buildmedia.readthedocs.org/media/pdf/requests/master/requests.pdf
20.Official documentation for python library Beautiful Soup.
https: //www.crummv .com/software/Beautiful Soup/bs4/doc/
21. Скрапинг веб-страниц в Python с Beautiful Soup: основы. Monty
Shokeen. 2017, https://code.tutsplus.com/ru/tutorials/scraping-webpages-in- python-with-beautiful-soup-the-basics--cms-28211 22.Introduction to Oracle9i: SQL. Student Guide, Volume 1. Nancy Greenberg, Priya Nathan, 2001 http://index-of.es/Rdbms/Oracle9i%20SQL- Slide%20&%20Guide-I.pdf
23.Introduction to Oracle9i: PL/SQL. Student Guide, Volume 1. Nancy Greenberg, Priya Nathan, 2001
https://www.academia.edu/15586166/Introduction to Oracle9i PL SOL 24.Introduction to Threads Programming with Python. Norman Matloff, 2003 http://slav0nic.org.ua/static/books/python/net thread/PyThreads.pdf

Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ