Тип работы:
Предмет:
Язык работы:


Исследование рынка труда с применением современных методов анализа данных

Работа №143056

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы55
Год сдачи2017
Стоимость5500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
38
Не подходит работа?

Узнай цену на написание


Введение 5
Постановка задачи 7
Обзор литературы 8
Глава 1. Рекомендательные системы 11
1.1 Подходы к построению рекомендательных систем 12
1.1.1 Фильтрация на основе содержания 13
1.1.2 Коллаборативная фильтрация 15
1.1.3 Рекомендательные системы, основанные на знаниях 17
1.2 Рекомендательные системы для рынка труда 18
1.3 Примеры реализаций рекомендательных систем для рынка труда 19
Глава 2. Формализация задачи 22
2.1 Формализация задачи разработки рекомендательной системы для рынка труда 22
2.2 Требования к программному комплексу 24
2.3 Архитектура программного комплекса 27
Глава 3. Сбор данных 29
3.1 Выбор информационного источника 29
3.2 Процедура сбора данных 31
Глава 4. Подготовка данных 34
4.1 Первичная подготовка данных 34
4.2 Векторная модель представления документов 36
4.3 Построение онтологии 37
4.4 Процедура создания словаря ключевых слов 39
4.5 Перенос вакансий в in-memory базу данных 41
Глава 5. Разработка рекомендательной системы 43
5.1 Обработка резюме пользователя 43
5.2 Метрика подобия резюме и вакансии 44
Выводы 46
Заключение 49
Дальнейшая работа 51
Список литературы 53



Ни для кого не секрет, что мы проживаем в эпоху так называемой информационной перегрузки. Под понятием информационной перегрузки понимается проблема переизбытка информационного пространства, что влечет за собой определенные трудности при принятии решений в выборе того или иного предмета. По мере того, как растет объем данных в сети, увеличивается сложность поиска релевантной информации. Иными словами, отыскать необходимую информацию в сети Интернет становится достаточно трудоемкой задачей.
Следовательно, возникает потребность в программных системах, которые фильтровали бы большой поток информации и выдавали конечному пользователю наиболее релевантный список результатов. Современный человек нуждается в подсказке о том, какие товары могут быть ему в наибольшей степени интересны среди всех прочих. И именно для решения этой непростой задачи были придуманы рекомендательные системы.
Итак, рекомендательная система – это программное средство, которое генерирует рекомендацию товара или услуги для пользователя, основываясь на сведения о его профиле. По методам конструирования рекомендаций, можно выделить несколько основных подвидов рекомендательных систем: системы на основе совместной фильтрации, на основе анализа содержимого профилей и гибридные системы.
В частности, рекомендательные системы подходят и для сферы рынка труда. Стремительный рост современных цифровых технологий и методов обработки данных значительно сократил время, которое требуется кандидату для того, чтобы ознакомиться с размещенными объявлениями о работе и установить связь с работодателем. Однако с ростом популярности интернет-сервисов по онлайн-рекрутменту увеличилось также количество вакансий и резюме. Это создает определенные трудности как для соискателей работы, так и для рекрутеров. Работа рекрутеров стала более сложной, поскольку из-за развития информационных технологий они стали получать намного больше резюме на каждую из открытых вакансий. Стало практически невозможно произвести ручную обработку резюме и отобрать те, которые соответствуют требованиям компании. Фильтрация и методы поиска отбирают из сотни резюме только те, которые подходят под нужные критерии. Большинство известных подходов базируются на разборе текста резюме, чтобы получить полезную информацию, и отфильтровать полученную информацию. Кроме того, резюме различаются по формату и стилю, что добавляет трудностей при анализе данных и выделению структурных зависимостей. В тоже самое время перед соискателем работы возникают не меньшие трудности. Соискателю приходится пройти через длительную и утомительную процедуру отбора результатов поиска, чтобы проверить каждое из описаний должностных обязанностей, что часто приводит к информационной перегрузке.
Предлагаемая работа рассматривает проблему построения эффективной рекомендательной системы для соискателя работы. Принимаются во внимание все основные недостатки уже существующих аналогичных систем, такие как проблема синонимии и скорость генерации рекомендации. Предлагаемые подход нацелен на выявление наиболее актуальных и важных объявлений о работе, тем самым экономя огромное количество времени и усилий ищущего работу человека.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе была представлена рекомендательная система для рынка труда, которая подбирает наиболее подходящие вакансии для пользователя, на основе информации, извлеченной из его резюме.
В процессе проведения исследования предметной области, были изучены существующие стратегии решения подобной задачи и выявлены критические недостатки и пробелы в альтернативных научных исследованиях. Помимо этого, в предлагаемом исследовании представлен краткий обзор современных подходов к построению рекомендательных систем, а также указаны достоинства и недостатки для каждого из них. Исходя из полученных знаний на этапе проектирования был сделан вывод использовать метод фильтрации на основе содержимого (CBRs) для построения рекомендательной системы.
Поскольку для проверки работы программного комплекса требуются тестовые данные, то были рассмотрены несколько вариантов источника таких данных. В результате, на основе ряда критериев в качестве ресурса с тестовыми данными (вакансии и резюме) был выбран сайт по онлайн-рекрутингу hh.ru.
Так как полученные из источника данные имеют слабоструктурированную форму, в представленной работе была решена задача приведения их в вид, удобный для последующего анализа с помощью программных средств. В итоге, каждая скачанная вакансия из набора, а также резюме пользователя, прошли процедуру первичной обработки и были преобразованы в векторное представление.
Учитывая приятое решение относительно формата представления данных, а именно векторное представление документов, возникла задача уменьшения размерности вектора. Для этой цели в приведенной работе введен дополнительный этап – создание словаря ключевых слов.
Один из серьезных изъянов существующих рекомендательных система для области рынка труда, это проблема определения терминов, имеющих родственный смысл, но отличающихся своим написанием. Для решения этой задачи была предложена и реализована подсистема онтологии. Таким образом, после того, как был получен словарь из наиболее значимых слов для каждой из профессиональных отраслей, он был расширен родственными терминами с помощью разработанной подсистемы онтологии.
При построении рекомендации не менее важным является фактор быстродействия системы в целом. Принимая во внимание количество собранных вакансий и частоту обращения к ним на этапе генерации рекомендации, было принято решение использовать в качестве хранилища in-memory базу данных, тем самым уменьшив время, требуемое для получения атрибутов вакансии при обращении к базе данных.
Основываясь на изученной литературе, для построения ранжированного списка подходящих пользователю вакансий была предложена наиболее эффективная мера оценки сходства документов.
В результате для функционирования предлагаемой рекомендательной системы были спроектированы и реализованы следующие программные компоненты:
 Система сбора вакансий;
 Система обработки вакансий;
 Система обработки резюме;
 Система построения онтологии;
 Система генерации рекомендаций;
Дальнейшая работа
Несмотря на то, что предложенная стратегия построения рекомендательной системы улучшает качество результатов, несколько вопросов, выходящие за рамки этого исследования, остаются нерешенными и требуют дальнейшего изучения.
В данной работе было представлено лишь ядро рекомендательной системы, в то время как конечный пользователь привык работать с удобным графическим интерфейсом. Поэтому для удобства использования предлагаемый программный комплекс необходимо снабдить графическим интерфейсом пользователя. Это может быть мобильное приложение, приложение для рабочего стола, интегрированный виджет или полноценный сайт.
Более того, в настоящей реализации не обрабатывается образование соискателя работы, что, возможно, могло бы улучшить качество рекомендации.
В дополнение к этому, стоит отметить, что рекомендательные системы по-прежнему остаются областью с широким простором для исследования. Следует ожидать того, что в обозримом будущем могут появиться новые алгоритмы и подходы для выдачи рекомендаций пользователю. По этой причине, область исследования рекомендательных систем следует рассматривать как незавершенную задачу, решение которой может быть улучшено с появлением новых технологий.



1. Charul Saxena. “Enhancing Productivity of Recruitment Process Using Data mining & Text Mining Tools”, 2011.
2. Yas A. Alsultanny, “Labor Market Forecasting by Using Data Mining”, 2013
3. W. Hong, L. Li, T. Li, and W. Pan, “ihr: An online recruiting system for xiamen talent service center,” in Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, ser. KDD’13. New York, NY, USA: ACM, pp. 1177–1185, 2013.
4. W. Hong, S. Zheng, H. Wang, and J. Shi, “A job recommender system based on user clustering,” Journal of Computers, vol. 8, no. 8, pp. 1960– 1967, 2013.
5. Yu, K. , Guan, G. , & Zhou, M. (2005). Resume information extraction with cascaded hybrid model. In Proceedings of the 43rd annual meeting on association for com- putational linguistics (pp. 499–506). Association for Computational Linguistics.
6. Cunningham, H. , Maynard, D. , Bontcheva, K. , & Tablan, V. (2002). A framework and graphical development environment for robust nlp tools and applications. In ACL (pp. 168–175)
7. Chang, A. X. , & Manning, C. D. (2014). TOKENSREGEX: Defining cascaded regular ex- pressions over tokens. Technical Report CSTR 2014-02 . Department of Computer Science, Stanford University
8. Nikolaos D. Almalis, Prof. George A. Tsihrintzis and Nikolaos Karagiannis “A Content Based Approach for Recommending Personnel for Job Positions”, The 5th IEEE International Conference on Information, Intelligence, Systems and Applications, Bijing china, pp. 45 – 49, 27-29 june 2014.
9. Salton, G., Wong, A., Yang, C.S.: A vector space model for automatic indexing. Communications of ACM, Vol. 18, No. 11, pp. 613 – 620, 1975.
10. G. Shani and A. Gunawardana, "Evaluating Recommendation Systems," Springer, pp. 257–298, 2011.
11. G. Adomavicius and A. Tuzhilin, “Toward the next generation of recommender systems: A survey of the state-of-the-art and possible extensions,” IEEE Trans. on Knowl. and Data Eng., vol. 17, pp. 734–749, June 2005
12. X. Su and T. M. Khoshgoftaar, “A survey of collaborative filtering techniques,” Adv. in Artif. Intell., vol. 2009, pp. 4:2–4:2, Jan. 2009.
13. A. Singh, C. Rose, K. Visweswariah, V. Chenthamarakshan, and N. Kambhatla,“Prospect: A system for screening candidates for recruitment,” in Proceedings of the 19th ACM International Conference on Information and Knowledge Management, ser. CIKM ’10. New York, NY, USA: ACM, pp. 659–668, 2010.
14. Keith Bradley, Rachael Rafter, and Barry Smyth. Case-based user profiling for content personalisation. In Proceedings of the International Conference on Adaptive Hypermedia and Adaptive Web-based Systems, pages 62–72. Springer-Verlag, 2000.
15. Danielle H. Lee and Peter Brusilovsky. Fighting information overflow with personalized comprehensive information access: A proactive job recommender. In Proceedings of the Third International Conference on Autonomic and Autonomous Systems, pages 21–, Washington, DC, USA, 2007. IEEE Computer Society.
16. Jochen Malinowski, Tobias Keim, Oliver Wendt, and Tim Weitzel. Matching people and jobs: A bilateral recommendation approach. In Proceedings of the 39th Annual Hawaii International Conference on System Sciences - Volume 06, page 137c, Washington, DC, USA, 2006. IEEE Computer Society.
17. Gerard Salton and Chris Buckley. Technical report.//Term weighting approaches in automatic text
retrieval, 1987



Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ