СОДЕРЖАНИЕ 4
ВВЕДЕНИЕ 6
1. АНАЛИТИЧЕСКАЯ ЧАСТЬ 9
1.1 Анализ преступности 9
1.1.1 Анализ региональной преступности и её аспекты 10
1.2 Формы преступности 12
1.2.1 Жестокое преступление 13
1.2.2 Имущественное преступление 16
1.2.3 Преступления белых воротничков 18
1.2.4 Организованная преступность 22
1.2.5 Согласованное преступление 24
1.3 Мировой уровень преступности 25
1.4 Данные для исследования 27
1.4.1 Методология сбора данных 28
1.4.2 fbi.gov и NIBRS 29
1.4.3 Обзор данных 31
2. ТЕОРЕТИЧЕСКАЯ ЧАСТЬ 34
2.1 Методы анализа больших данных 34
2.1.1 Анализ методик Big Data 34
2.1.2 Процессы Data Mining 38
2.1.3 Технологии больших данных 41
2.2 Python 51
2.2.1 Анализ конкурентных языков программирования 51
2.2.2 Средства Python 56
2.2.3 Jupyter Notebook 57
2.3 Подведение промежуточных итогов 58
3. ПРОЕКТНАЯ ЧАСТЬ 59
3.1 Подготовка данных исследования 59
3.2 Построение первоначальной модели 67
3.2.1 Анализ преступлений 67
3.2.2 Анализ преступности по годам 70
3.2.3 Анализ преступности по округам 73
3.2.4 Кросс-факторный анализ 78
3.2.5 Исходная модель 80
3.3 Итоговая модель 81
3.4 Практическая значимость модели 82
3.5 Прогнозирование дальнейших действий 82
ЗАКЛЮЧЕНИЕ 83
СПИСОК ИСПОЛЬЗУЕМЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 85
ПРИЛОЖЕНИЕ 1 90
ПРИЛОЖЕНИЕ 2 95
ПРИЛОЖЕНИЕ 3 96
ПРИЛОЖЕНИЕ 4 97
ПРИЛОЖЕНИЕ 5 98
ПРИЛОЖЕНИЕ 6 99
ПРИЛОЖЕНИЕ 7 100
ПРИЛОЖЕНИЕ 8 101
ПРИЛОЖЕНИЕ 9 102
ПРИЛОЖЕНИЕ 10 103
ПРИЛОЖЕНИЕ 11 104
ПРИЛОЖЕНИЕ 12 105
ПРИЛОЖЕНИЕ 13 106
ПРИЛОЖЕНИЕ 14 107
В соответствии законами любой человек и его имущество имеет все основания на защиту его прав и свобод, а также имеет право на полную свободу не опасаясь того, что может стать жертвой. Любое продвинутое государство оберегает своих граждан от любого посягательства на их здоровье, жизнь и имущество. Неприкосновенность имущества и личности это право предусмотренное законами и конституцией.
Преступления - это умышленное противоправное действие наносящие вред гражданам или государству которые защищены законом и конституцией. Преступления в некоторых случаях сопровождаются насилием и наносят не только материальный вред, но и физический, в каких-то случаях приводит к летальному исходу, хотя большинство преступлений и направлены на получение материальной выгоды.
Актуальность выпускной квалификационной работы (Далее - ВКР) заключается в следующем, что в наше время преступность является одной из главных проблем всего общества, касается почти всех сфер нашей жизни, выступает в роли вечной опасности для общества и личности. Широкое проявление преступности довольно важное значение оказывает, даже слишком значимое влияние на экономику, производство и финансовую деятельность, на нравственный и духовный устрой общества.
Актуальность темы ВКР можно объяснить довольно высоким уровнем противоправных действий и анализа совершенных преступлений с целью выявления основных факторов совершения преступлений в регионе и способов повышения безопасности граждан. Большую роль в решении данной задачи оказывает метод анализа данных.
Цель данной ВКР - это анализ открытых и больших данных на примере штата Колорадо. Считаем, что достижение данной цели поможет снизить количество совершаемых преступлений, научившись предсказывать будущие правонарушения и тем самым защитив граждан от преступлений, направленных на них.
В ВКР будут использоваться такие инструменты исследования, как методы класса Data Mining (чтобы обнаружить практические полезные и необходимые для принятия решения знания), статистический анализ (чтобы выявить закономерности в структуре, состоянии и динамике преступлений) и визуализация аналитических данных (чтобы представить информацию в виде графиков, диаграмм, рисунков).
По ходу к достижению поставленной ранее цели стоит решить данные задачи:
Выявить наиболее распространенное правонарушение, совершаемое преступниками.
Изучить тенденции по месту и времени совершения правонарушений.
Подобрать наиболее подходящие методы и средства обработки данных.
Проанализировать данные о совершенных преступлениях за несколько лет.
Разработать модель с тепловой картой для более наглядного понимания где чаще происходят преступления.
ВКР состоит из введения, трех глав и заключения.
Введение описывает актуальность выбранной темы исследования, определяет важность научной разработки темы, определяет важность практической и теоретической значимости данной работы и описывает цель исследования.
В первой главе описывается общая теория о преступности, рассматриваются различные формы ее, история разных видов преступлений, ставиться сама задача, рассматриваются используемые данные для анализа и методика сбора этих данных. Во второй главе производим анализ и сравниваем между собой методов и инструментов решения поставленных ранее задач. Третья глава посвящена решению поставленной задачи по снижению уровня преступности и повышению комфортной и спокойной жизни граждан, разработка и создания приложения.
В заключении подводятся итоге проведенного исследования, определяются окончательные выводы по данной теме, выдвигается решение по решению данной проблемы.
В первой главе была рассмотрена преступность в общем плане, ее влияние на общество, рассмотрены различные формы преступности, а также были рассмотрены данные для данной исследовательской работы и методы сбора данных которые были использованы в этой работе.
Во второй главе уже были рассмотрены методы анализа больших данных, провели сравнение и выбрали самые подходящие нам методики и технологии анализа данных, также были рассмотрены разные языки программирования, с помощью которых можно производить анализ данных и выбран самый оптимальный для нашего исследования.
И в заключительной главе провели исследование, рассмотрели данные уже более подробно, провели анализ данных и выявили проблемные области, связанные с преступностью на примере штата Колорадо.
Согласно проделанной работе, можно понять, что преступность довольно сильно распространена и в частотности преступления, направленные против человека, преступность хоть и снижается, но все так же является довольно важно проблемой нашего общества. Были выявлены самые распространенные виды правонарушений, так же было проанализировано наиболее популярное время для совершения преступлений, была рассмотрена статистика самых распространенных преступлений по округам, благодаря чему смогли понять, что в более больших округах происходит намного больше преступлений, а чем округ меньше, тем и меньше в нем правонарушений.
В процессе выполнения данной работы, нам удалось выполнить все поставленные ранее задачи, так же нам удалось раскрыть поставленную цель. Были проанализированы данные о преступности на примере штата Колорадо, благодаря этим данным получилось сравнить разные показатели и выяснить в каком направлении нужно больше работать, чтобы добиться более низкого
уровня преступности. Так же благодаря проделанной работе можно спрогнозировать развитие преступности в будущем, для того чтобы более эффективно проводить борьбу с этой остросоциальной проблемой.
1. Гельдибаев, М. Х. Уголовное право (общая часть) : учебное пособие / М. Х. Гельдибаев. — Санкт-Петербург : НИУ ИТМО, 2016. — 157 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https:ZZe.lanbook.com/book/91476
2. Серегина, Е. В. Криминология : 2019-08-23 / Е. В. Серегина, Е. Н. Москалева. — Москва : РГУП, 2018. — 232 с. — ISBN 978-5-93916-673¬7. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https:ZZe.lanbook.com/book/123209
3. Gallup - американский институт общественного мнения [Электронный
ресурс]. Режим доступа: https://news.gallup.com/poll/161180/back-
funding-sexual-violence-victims.aspx,свободный - (дата обращения: 20.06.2020).
4. Википедия — свободная энциклопедия [Электронный ресурс]. Режим доступа:https://en.wikipedia.org/wiki/Enron scandal,свободный - (дата обращения: 20.06.2020).
5. WebCite - систему архивирования [Электронный ресурс]. Режим доступа: https://www.webcitation.org/66eSiknD1?url=http://online.ceb.com/calcases/CA3/119CA3d757.htm,свободный - (дата обращения: 13.05.2020).
6. Numbeo - крупнейшая в мире база данных [Электронный ресурс]. Режим доступа:https ://www.numbeo. com/crime/rankings bv countrv.jsp, свободный - (дата обращения: 20.06.2020).
7. Данные для исследования. Colorado Information Marketplace [Открытые данные]. Режим доступа:https://data.colorado.gov/Public-Safetv/Crimes-in-Colorado/j6g4-gavk,свободный - (дата обращения: 13.02.2020).
8. FBI - сайт федерального бюро расследований [Электронный ресурс]. Режим доступа:https://ucr.fbi.gOv/crime-in-the-u.s/2016/crime-in-the-u.s.-2016/resource-pages/methodology,свободный - (дата обращения: 20.06.2020).
9. Чубукова, И. А. Data Mining : учебное пособие / И. А. Чубукова. — 2-е изд. — Москва : ИНТУИТ, 2016. — 470 с. — ISBN 978-5-94774-819-2. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https://eJanbook.com/book/100582
10. Zion market research - сайт предоставляющая отчеты и статистику
[Электронный ресурс]. Режим доступа:
https://www.zionmarketresearch.com/,свободный - (дата обращения: 25.06.2020).
11. AtScale - сайт с бизнес-аналитикой [Электронный ресурс]. Режим доступа:https://www.atscale.com/blog/,свободный - (дата обращения: 25.06.2020).
12. IEEE - международная некоммерческая ассоциация специалистов в
области техники [Электронный ресурс]. Режим доступа:
https://spectrum.ieee.org/computing/software/the-top-programming-languages-2019,свободный - (дата обращения: 25.06.2020).
13. MarketsandMarkets - предлагает отчеты об исследованиях рынка
[Электронный ресурс]. Режим доступа:
https://www.marketsandmarkets.com/Market-Reports/top-10-analytics-technologies-market-25097079.html,свободный - (дата обращения: 25.06.2020).
14. Allied Market Research - предоставляет специализированные и синдицированные отчеты [Электронный ресурс]. Режим доступа: https://www.alliedmarketresearch.com/nosql-market,свободный - (дата обращения: 25.06.2020).
15. Zion market research - сайт предоставляющая отчеты и статистику
[Электронный ресурс]. Режим доступа:
https://www.zionmarketresearch.com/report/healthcare-predictive-analytics-market,свободный - (дата обращения: 26.06.2020).
16. MarketsandMarkets - предлагает отчеты об исследованиях рынка
[Электронный ресурс]. Режим доступа:
https ://www.marketsandmarkets. com/Market-Reports/in-memory-database-market-226589254.html,свободный - (дата обращения: 26.06.2020).
17. IDG - сайт исследовательской компании [Электронный ресурс]. Режим
доступа: https://www.idg.com/our-solutions/data/,свободный - (дата
обращения: 27.06.2020).
18. NewVantage - пионеры лидерства в управлении данными [Электронный ресурс]. Режим доступа:https://newvantage.com/,свободный - (дата обращения: 27.06.2020).
19. Research and Markets - предоставляет тысячи отчетов [Электронный
ресурс]. Режим доступа:
https://www.researchandmarkets.com/reports/4602245/data-science-platform-market-growth-trends-and#pos-8,свободный - (дата обращения: 27.06.2020).
20. Gartner - исследовательский сайт [Электронный ресурс]. Режим доступа:https://www.gartner.com/en/documents/3817367,свободный - (дата обращения: 28.06.2020).
21. MarketsandMarkets - предлагает отчеты об исследованиях рынка
[Электронный ресурс]. Режим доступа: https://www.marketsandmarkets.com/Market-Reports/visual-analytics-market-147932448.html,свободный - (дата обращения: 13.05.2020).
22. Википедия — свободная энциклопедия [Электронный ресурс]. Режим
доступа: https://ru.wikipedia.org/wiki/Python,свободный - (дата
обращения: 28.06.2020).
23. GitHub - веб-сервис для хостинга IT-проектов [Электронный ресурс]. Режим доступа:https://github.com/jupyter/notebook,свободный - (дата обращения: 29.06.2020).
24. Уэс, М. Python и анализ данных / М. Уэс ; перевод с английского А. А. Слинкин. — Москва : ДМК Пресс, 2015. — 482 с. — ISBN 978-5-97060-315-4. — Текст : электронный // Лань: электронно-библиотечная система. — URL:https://e.lanbook.com/book/73074
25. Северенс, Ч. Введение в программирование на Python : учебное пособие / Ч. Северенс. — 2-е изд. — Москва : ИНТУИТ, 2016. — 231 с. — Текст : электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/100703
26. Коломейченко, А. С. Информационные технологии : учебное пособие /
A. С. Коломейченко, Н. В. Польшакова, О. В. Чеха. — Санкт-Петербург
: Лань, 2018. — 228 с. — ISBN 978-5-8114-2730-7. — Текст :
электронный // Лань : электронно-библиотечная система. — URL: https://e.lanbook.com/book/101862
27. Замятин, А. В. Интеллектуальный анализ данных : учебное пособие / А.
B. Замятин. — Томск : ТГУ, 2016. — 120 с. — ISBN 978-5-94621-531¬2. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https://e.lanbook.com/book/91942
28. Сурина, Е. Е. Методы анализа данных : учебное пособие / Е. Е. Сурина. — 2-е изд. — Москва : ФЛИНТА, 2015. — 130 с. — ISBN 978-5-9765- 2499-6. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https:ZZe.lanbook.com/book/72701
29. Агалаков, С. А. Статистические методы анализа данных : учебное пособие / С. А. Агалаков. — Омск : ОмГУ, 2017. — 92 с. — ISBN 978-5-7779-2187-1. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https:ZZe.lanbook.com/book/103047
30. Макшанов, А. В. Технологии интеллектуального анализа данных : учебное пособие / А. В. Макшанов, А. Е. Журавлев. — 2-е изд., стер. — Санкт-Петербург : Лань, 2019. — 212 с. — ISBN 978-5-8114-4493-9. — Текст : электронный // Лань : электронно-библиотечная система. — URL:https://e.lanbook.com/bookZ120063