Тип работы:
Предмет:
Язык работы:


Моделирование системы HR-аналитики на основе анализа данных сайтов вакансий

Работа №105985

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы63
Год сдачи2022
Стоимость4215 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
66
Не подходит работа?

Узнай цену на написание


Введение 5
1 Основные понятия статистического анализа 7
1.1 Описательная статистика 7
1.2 Типы данных в описательной статистике 11
1.3 Анализ нормальности распределения данных 13
2 Анализ статистических совокупностей и выбор статического критерия 22
2.1 Алгоритм выбора статистического критерия для проверки гипотез 22
2.2 Корреляция Пирсона, Спирмена 23
2.3 U-критерий Манна-Уитни для независимых выборок 26
2.4 Критерий Хи-квадрат Пирсона 27
3 Программная разработка и тестирование системы HR-аналитики 30
3.1 Обзор существующих инструментов и распределение данных для
реализации модели 30
3.2 Моделирование функции разреза по вакансиям 37
3.3 Моделирование и тестирование функции разреза по регионам 41
3.4 Моделирование функций нормальности распределения для
количественных величин 43
3.5 Моделирование и тестирование U-критерий Манна-Уитни на примере
влияния гендерного признака на опыт работы 47
3.6 Моделирование и тестирование критерия Хи-квадрат Пирсона на
примере влияния отклика работодателя на образование. 52
3.7 Моделирование и тестирование корреляции Пирсона, Спирмена на
примере влияния уровня зарплат на опыт работы 55
Заключение 60
Список используемой литературы 61


HR-аналитика - относительно новый термин, который впервые появился в академической литературе в 2004 году. Это систематическая идентификация и количественная оценка факторов бизнес-результатов. Аналитика определяется как пересечение информатики, принятия решений и количественных методов для организации, анализа и объяснения растущего объема данных, генерируемых современным обществом.
HR-аналитика, также называемая аналитикой людей, рабочей силы или талантов, включает в себя сбор, анализ и отчетность кадровых данных. Это позволяет вашей организации измерять влияние ряда показателей на общую эффективность бизнеса и принимать решения на основе данных.
Существует два направления HR-аналитики:
- Внутренняя - управление процессами и персоналом для достижение максимального эффекта
- Внешняя - понимание общих аспектов рынка труда
На сегодняшний день именно внутреннее направление проходит скоростной путь эволюции, пренебрегая внешней аналитикой из-за чего компании сталкиваются с проблемой получения недостаточного количества данных, необходимых для анализа соотношения предложений и спроса на рынке труда, уровня зарплат, конкуренции и общей демографической ситуации.
Цель работы: моделирование системы HR-аналитики на основе анализа статистической совокупности данных сайта вакансий, опираясь на выбор статистической стратегии.
Объект исследования: анализ статистических совокупностей.
Предмет исследования: система HR - аналитик.
Для достижения цели работы необходимо решить следующие задачи:
- Рассмотреть основные понятия математической статистики.
- Научиться пользоваться выбором статистического критерия по алгоритму.
- Собрать данные и агрегировать их с помощью Python.
- Выдвинуть гипотезы и проанализировать данные с помощью Python.
Данная работа содержит в себе введение, три раздела, заключение и список используемой литературы.
В первой главе представлены основные определения и методы статистического анализа.
Во второй главе описан алгоритм выбора статистического критерия, а также их описания.
В третьей главе проводится разработка и тестирование системы HR- аналитики.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной пояснительной записке к выпускной квалификационной работе, были рассмотрены основные определения описательной статистики, был смоделирован анализ статистических совокупностей путем выбора статического критерия на примере собранных данных сайтов вакансий. Также были разработаны алгоритмы формирования агрегированных таблиц по требуемым аргументам. Реализация производилось на языке программирования Python с использованием библиотек указанных в подразделе 3.1.
В ходе исследования предметной области были указаны материалы, позволяющие ознакомиться с теоретическими данными и реализацией системы HR - аналитики, а также приложены иные материалы, способствующие пониманию того, как работает программная часть модуля, такие как блок-схема и рисунки, отображающий возможности взаимодействия программных компонентов продукта.
Одним из достоинств данной программы является наглядность (все вычисления представляются на графиках). Среди минусов можно отметить, что программа содержит не все статистические стратегии. Данные недостатки можно исправить в последующих версиях программы. Кроме того, в перспективах развития программы можно воссоздать общую базу данных и реализовать Web - приложение.
Подводя итог, можно сделать вывод, что разработанное программное обеспечение успешно функционирует и позволяет анализировать данные сайтов вакансий путем постановки гипотез.



1. Афанасьев, В. В. Теория вероятностей [Текст] / В. В. Афанасьев. - М.: ВЛАДОС, 2007. - 350 с.
2. Валеев С.Г., Клячкин В.Н. Практикум по прикладной статистике. Учебное пособие. - Ульяновск: УлГТУ, 2008. - 130 с.: ил.
3. Васильев, А. Н. Python на примерах. Практический курс по программированию / А.Н. Васильев. - М.: Наука и техника, 2016. - 432 с.
4. Гмурман В.Е. Теория вероятностей и математическая статистика. М.: Высшая школа, 1998.
5. Горяинова, Е. Р., Панков, А. Р., Платонов, Е. Н. Прикладные методы анализа статистических данных [Текст] : учеб. пособие / Е. Р. Горяинова, А. Р. Панков, Е. Н. Платонов ; Нац. исслед. ун-т «Высшая школа экономики». — М.: Изд. дом Высшей школы экономики, 2012. — 310, [2] с. — 1000 экз. — 978-5 7598-0866-4 (в обл.).
6. Изучаем Python. Программирование игр, визуализация данных, веб- прило - жения. — СПб.: Питер, 2017. — 496 с.: ил. — (Серия «Библиотека программиста»).
7 . Крамер Г. Математические методы статистики. - М.: Мир, 1975.
8. Математическая статистика: учеб. пособие /Д.К. Агишева, С.А. Зотова, Т.А. Матвеева, В.Б. Светличная; ВПИ (филиал) ВолгГТУ. - Волгоград, 2010. - 159 с.: ил.
9. Наследов, А. Д. Математические методы психологического исследования. Анализ и интерпретация данных [Текст] / А. Д. Наследов. - СПб.: Речь, 2004. - 392 с.
10. Никитин, О. Р. Методы измерения статистических параметров радиосигналов : учеб. пособие / О. Р. Никитин, Н. Н. Корнеева ; Владим. гос. ун-т им. А. Г. и Н. Г. Столетовых. - Владимир : Изд-во ВлГУ. - Владимир, 2020. - 227 с.
11. Нуньес-Иглесиас Х., Уолт ван дер Ш., Дэшноу Х. Элегантный SciPy/ пер. с англ. А. В. Логунова. - М.: ДМК Пресс, 2018. - 266 с.: ил.
12. Общая теория статистики: учебное пособие: в 2 частях - Ч.1. Описательная статистика / Татьяна Борисовна Ершова. - Комсомольск- наАмуре: Изд-во АмГПГУ, 2012.-120 с.
13. Основы теории статистики : [учеб. пособие] / В. В. Полякова, Н. В. Шаброва ; М-во образования и науки Рос. Федерации, Урал. федер. ун-т. - 2¬е изд., испр. и доп. - Екатеринбург : Изд-во Урал. ун-та, 2015. - 148 с.
14. Практикум по общей теории статистики: учеб. пособие / И.И. Елисеева, Н.А. Флуд, М.М. Юзбашев; под ред. И.И. Ели- сеевой. - М.: Финансы и статистика, 2008. - 512 с.: ил.
15. Справочник по прикладной статистике. - М.: Финансы и статистика. 1989. Т.1.
16. Тест Шапиро-Уилка URL:https://translated.turbopages.org/proxy_u/enru.ru.46c1ad93629661100584c65674722d776562/https/en.wikipedia.org/wiki/Wilk%E2%80%93Shapiro_test.
17. Тюрин Ю.Н., Макаров А.А. Статистический анализ данных на компьютере/ Под ред. В.Э.Фигурнова. - М.: ИНФРА-М, 1998. - 528 с.
18. Чубинский А.Н. Методы и средства научных исследований.
Методы планирования и обработки результатов экспериментов: учебное пособие для студентов, обучающихся по направлениям 35.03.02 и 35.04.02 «Технология лесозаготовительных и деревоперерабатывающих
производств», профиль «Технология деревообработки» / А.Н. Чубинский, Д.С. Русаков, И.М. Батырева, Г.С. Варанкина - СПб.: СПбГЛТУ, 2018.- 109 с.
19. Devpractice Team. Библиотека Matplotlib. - devpractice.ru. 2019. - 100 с.: ил.
20. Gregory W. Corder, Dale I. Foreman. Nonparametric Statistics. URL: https://faculty.ksu.edu.sa/sites/default/files/nonparametric_statistics_a_step-by- step_approach.pdf
21. NumPy User Guide. URL: https://numpy.org/doc/stable/numpy-user.pdf
22. Pearson's chi-squared test. URL:
https://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test
23. Python для сложных задач: наука о данных и машинное обучение. — СПб.: Питер, 2018. — 576 с.: ил. — (Серия «Бестселлеры O’Reilly»).
24. Timothy J.Barth, Michael Griebel, David E. Keyes, Risto M. Nieminen, Dirk Roose, Tamar Schlick. Programming for Computations - Python. URL: https://library.oapen.org/bitstream/handle/20.500.12657/27997/1002000.pdf7seque nce=1
25. Wes McKinney and the Pandas Development Team. pandas: powerful Python data analysis toolkit. URL: https://pandas.pydata.org/docs/pandas.pdf


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ