Тип работы:
Предмет:
Язык работы:


Применение методов и средств технологии Business Intelligence для анализа данных о судебной практике в Томской области

Работа №11087

Тип работы

Главы к дипломным работам

Предмет

эвм

Объем работы88
Год сдачи2016
Стоимость5900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
478
Не подходит работа?

Узнай цену на написание


Введение 10
1 Анализ предметной области судопроизводства 12
1.1 Актуальность анализа данных судопроизводства 12
1.2 Анализ структуры данных судебных решений 13
1.3 Обзор аналогов 15
1.3.1 «Casebook» 15
1.3.2 «РосПравосудие» 17
1.4 Постановка задачи 18
2 Проектирование инструментов для обработки данных 20
2.1 Выбор инструментов разработки 20
2.2 Проектирование базы данных судопроизводства 21
2.3 Проектирование инструмента для извлечения атрибутов судебного
решения 23
2.4 Проектирование инструмента для наполнения базы данных 30
3 Разработка инструментов для обработки данных 33
3.1 Разработка инструмента для извлечения атрибутов судебного дела.. 33
3.2 Разработка инструмента для наполнения базы данных 34
4 Анализ данных с использованием технологии Data Mining 35
Заключение 76
Список использованных источников 77
Приложение А 80
Приложение Б 81
Приложение В 82


В наше время происходит интенсивное накопление огромных объёмов данных разного типа в различных предметных областях измеряемые в петабайтах, это в свою очередь даёт возможность решать задачи получения новых фактов, зависимостей и скрытых корреляций, а также позволяет решать некоторые аналитические задачи, такие как прогнозирование, проверка статистических гипотез, расчёт агрегатных показателей и т.д.
Объектом исследования является задача нахождения скрытых закономерностей, а предметом исследования - решения по судебным делам.
Цель работы - анализ записей, полученных в результате обработки документов и решений судов РФ с помощью методов и средств технологии Business Intelligence.
Анализ судопроизводства довольно актуален, поскольку результаты анализа будут интересны как большим организациям, таким как правоохранительные органы и правозащитные организации, так и отдельным лицам, таким как независимые юристы и люди, находящиеся под следствием. Для больших организаций будет более интересен глубокий анализ для поиска скрытых зависимостей и отклонений, а отдельным лицам анализ по конкретным судьям и адвокатам, который может помочь предсказать какое решение может быть вынесено определенным судьей или выбрать наиболее эффективного адвоката.
Значимость данной работы состоит в том, что разработанные инструменты позволят заинтересованным людям самостоятельно извлекать и анализировать данные.
В первом разделе данной работы проведен анализ предметной области, обоснована актуальность исследования и изложены результаты обзора аналогов.
Во втором разделе представлены проектирование и реализация базы данных, а также приведены результаты проектирования инструментов для извлечения атрибутов из текстов судебных дел и наполнения базы данных судопроизводства.
В третьем разделе представлены результаты разработки инструментов для извлечения атрибутов из текстов судебных дел и наполнения базы данных судопроизводства.
В четвертом разделе представлены результаты OLAP анализа данных, извлеченных из решений по судебным делам.
В пятом разделе рассмотрены вопросы финансового менеджмента, результаты расчетов и анализ ресурсоэффективности и ресурсосбережения.
В шестом разделе описаны основные требования социальной ответственности.
Извлечение данных выполнено в среде PyCharm, язык программирования - Pyton. Запись данных в БД выполнена в среде Visual Studio 2013, язык программирования - C#. Для создания БД использовалась среда Microsoft SQL Server 2014 Management Studio. OLAP и Data Mining анализ выполнен в среде Visual Studio 2013, с использованием Excel 2013. Пояснительная записка оформлена в Microsoft Word 2013.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В ходе выполнения данной работы были выполнены следующие задачи: анализ предметной области и текстов судебных решений, проектирование и реализация базы данных для хранения извлеченных параметров, проектирование и разработка инструментов для извлечения атрибутов судебных дел и наполнения базы данных, Data Mining анализ данных.
Изучение предметной области позволило выявить актуальность исследования, определить перечень атрибутов, которые возможно и необходимо извлечь из судебных решений, а также спроектировать структуру базы данных и инструментов для извлечения атрибутов судебных дел и наполнения базы данных. На основе спроектированного решения была выполнена программная реализация инструмента для извлечения атрибутов судебных дел в среде разработки Pycharm на языке программирования Python. А также выполнена программная реализация инструмента для анализа решений судов, хранимых в подготовленном виде.
Data Mining анализ данных проводился в среде Pycharm, а также с помощью библиотек nympy, sklearn, mathplot. Проведенный анализ позволил получить статистическую информацию и выявить некоторые закономерности между различными атрибутами решений. Так, например, основными атрибутами решений, влияющих на их сходимость являются имя судьи, название суда, тип решения, тип наказания и т.д.
В дальнейшем данное исследование можно развивать, увеличив объем анализируемых судебных решений и анализировать не только судебные дела Томской области, а дела всей Российской Федерации. Кроме того, можно увеличить объем параметров, извлекаемых из судебных решений.



1. Федеральный закон N 262-ФЗ от 22.12.2008 (ред. от 05.04.2016) «Об обеспечении доступа к информации о деятельности судов в Российской Федерации».
2. «Гражданский процессуальный кодекс Российской Федерации» от 14.11.2002 N 138-ФЗ (ред. от 02.03.2016).
3. Casebook [Электронный ресурс]. URL: http://caselook.ru/ (дата обращения: 28.05.2016).
4. РосПравосудие [Электронный ресурс]. URL: http://www.
rospravosudie.com/ (дата обращения: 28.05.2016).
5. Сравнительный анализ методов определения нечетких дубликатов
для WEB-документов / Ю. Г. Зеленков, И. В. Сегалович // Труды 9-ой Всероссийской научной конференции «Электронные библиотеки:
перспективные методы и технологии, электронные коллекции» RCDL 2007: Сборник работ участников конкурса. — Переславль-Залесский, Россия. — 2007.
6. Двоичные коды с исправлением выпадений, вставок и замещений символов / В. И. Левенштейн // Доклады Академий Наук СССР - 1965.
7. Регулярные выражения / Фридл, Дж. — СПб., 2001. — 352 с.
8. «An Introduction to MDS» Wickelmaier, Florian [Электронный
ресурс]. URL: https://homepages.uni-
tuebingen.de/florian.wickelmaier/pubs/Wickelmaier2003SQRU.pdf (дата
обращения: 10.05.2016).
9. Adaptive Neighborhood Graph for LTSA Learning Algorithm without Free-Parameter. Xianlin Zou, Qingsheng Zhu [Электронный ресурс]. URL: http://www.iicaonline.org/volume19/number4/pxc3873070.pdf (дата обращения:
11.05.2016)
10. Nonlinear Dimensionality Reduction I: Local Linear Embedding. Sam
T. Roweis [Электронный ресурс]. URL:
http://www.stat.cmu.edu/~cshalizi/350/lectures/14/lecture-14.pdf (дата обращения:
11.05.2016)
11. t-SNE. Laurens van der Maaten. [Электронный ресурс]. URL: https: //lvdmaaten. github. io/tsne/ (дата обращения 12.05.2016)
12. Влияние морфологического анализа на качество информационного поиска. М.В. Губин, А.Б. Морозов [Электронный документ]. URL: http://rcdl.ru/doc/2006/paper_67_v2.pdf (Дата обращения 09.04.2016).
13. СанПиН 2.2.2/2.4.1340 - 03. Санитарно - эпидемиологические
правила и нормативы «Г игиенические требования к персональным электронно - вычислительным машинам и организации работы». - М.:
Госкомсанэпиднадзор, 2003.
14. СНиП 23-05-95 от 20.05.1995. Строительные нормы и правила Российской Федерации «Естественное и искусственное освещение».
15. СанПиН 2.2.2/2.4.1340-03 Гигиенические требования к
персональным электронно-вычислительным машинам и организации работы: с изменениями от 25 апреля 2007 г. - М.: Информационно-издательский центр Минздрава России, 2003.
16. СанПиН 2.2.1/2.1.1.1200-03 Санитарно-защитные зоны и санитарная классификация предприятий, сооружений и иных объектов. - М.: Госкомсанэпиднадзор России, 2003.
17. Научно-информационный портал Винити. Экология [Электронный ресурс]: - Режим доступа: http://science.viniti.ru
18. Технический регламент о требованиях пожарной безопасности: Федеральный закон от 22 июля 2008 года N 123-ФЗ.
19. ГОСТ Р 22.3.03 - 94. Безопасность в чрезвычайных ситуациях. Защита населения.


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ