Тип работы:
Предмет:
Язык работы:


Разработка автоматизированной системы комплексного структурно - семантического и тематического анализа естественно языковых текстов

Работа №100845

Тип работы

Дипломные работы, ВКР

Предмет

информационные системы

Объем работы92
Год сдачи2020
Стоимость4370 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
129
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. ИССЛЕДОВАНИЕ ЧАСТЕЙ РЕЧИ С ТОЧКИ ЗРЕНИЯ
ПРИМЕНЕНИЯ ИНСТРУМЕНТАРИЯ ДЛЯ ИХ АНАЛИЗА 8
1.1 Части речи и их морфологические характеристики 8
1.2 Обзор инструментария для определения частей речи 23
1.3 Результаты и выводы первой главы 27
2. РАЗРАБОТКА ЛИНГВИСТИЧЕКСОГО АНАЛИЗАТОРА 29
2.1 Описание лингвистического анализатора 29
2.2 Выбор инструментария лингвистического анализатора 29
2.3 Алгоритм работы приложения 38
2.4 Результаты и выводы второй главы 40
3. ВНЕДРЕНИЕ ЛИНГВИСТИЧЕСКОГО АНАЛИЗАТОРА НА ПРЕДПРИЯТИИ 42
3.1 Общая характеристика организации 42
3.2 Полная модель предприятия 43
3.3 Формулировка и решение проблемы на предприятии 63
3.4 Результаты и выводы третьей главы 83
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 87


Определение психологического типа человека, а также выявление его потребностей является важной составляющей успеха компаний, ориентированных на предоставление услуг для общества. Именно с помощью определенного психологического типа можно выявить предпочтения человека, а также предугадать его поведение и реакцию на различные действия компании. Необходимо отметить, что грамотно выявленные потребности и предпочтения человека способствуют росту продаж, а также привлечению новых клиентов.
В современном мире информацию о человеке, его деятельности и предпочтениях легко получить из социальных сетей. Даже если человек оставляет разделы, предназначенные для заполнения информации о себе пустыми, его легко охарактеризовать по публикуем постам на стене. Стоит отметить, что для извлечения информации о психологическом типе и предпочтениях человека со стены, необходимо уметь грамотно строить психологические модели. Как правило, психологические модели, направленные на определение психологического типа и предпочтений, строятся на основе слов, а также их частоты употребления. Необходимо отметить, что при построении данных моделей в первую очередь важна частота употребляемых человеком видов частей речи, а также выделение их морфологических признаков.
Таким образом, для выявления предпочтений человека и его психологического типа необходим качественный анализатор, способный определить части речи вводимых слов, а также их морфологические характеристики.
Объектом магистерской диссертации является предприятие OOO Privacy Safeguard Co, которое оказывает услуги, направленные на привлечение клиентов для других компаний и помогает им выявить предпочтения своих клиентов. Так как на момент открытия компания не имела никаких продуктов, она нуждалась в разработке лингвистического анализатора, который стал бы основой всех разрабатываемых ею продуктов и предоставляемых услуг. Соответственно, предметом данной магистерской диссертации является русскоязычный лингвистический анализатор.
Стоит отметить, что целью данной работы является разработка эффективного русскоязычного лингвистического анализатора, способного безошибочно определять чисти речи и их морфологические характеристики, так как на момент создания компании Privacy Safeguard Co таковые отсутствовали на рынке. Для достижения поставленных целей были поставлены следующие задачи:
- изучить теоретические основы русскоязычных частей речи, а также их морфологические характеристик;
- выявить русскоязычные анализаторы, представленные на рынке;
- проанализировать их достоинства и недостатки;
- определить средства разработки, способные обойти проблемы, присутствующие в ранее разработанных лингвистических анализаторах;
- построить полную модель предприятия OOO Privacy Safeguard Co, тем самым проанализировать ее деятельность;
- описать бизнес - процесс рассматриваемой мной компании после внедрения анализатора;
- с помощью выбранной методологии описать план разработки проекта;
- исходя из выявленных средств разработки создать новый эффективный лингвистический анализатор;
- провести экономический анализ внедряемого проекта, а также написать его экономическое обоснование.
Необходимо отметить, что для описания данной магистерской диссертации был использован ряд следующих инструментов:
- MS Word;
- MS Excel;
- MS Visio;
- MS Project;
- Ramus;
- язык программирования python;
- среда разработки программного обеспечения IDLE;
- библиотека sqlite3.
Данная выпускная квалификационная работа включает в себя введение, заключение, список использованных источников и ряд следующих глав:
- исследование частей речи с точки зрения применения инструментария для их анализа;
- внедрение лингвистического анализатора на предприятии.
Стоит отметить, что в первой главе данной магистерской диссертации подробно рассмотрены все существующие части речи русского языка, а также их морфологические характеристики, выявлены и проанализированы популярные инструментарии для определения частей речи слов русского языка. Также в первой главе данной работы выявлены и подробно описаны средства необходимые для разработки нового эффективного лингвистического анализатора.
Во второй главе данной магистерской диссертации проведен тщательный анализ ООО Privacy Safeguard Co, а также построена полная модель данного предприятия. Создана модель TO-BE, наглядно демонстрирующая внедрение новой системы в компанию Privacy Safeguard Co. Также во второй главе магистерской диссертации разработан план внедрения разрабатываемого проекта, исходя из выбранной методологии, а также описана и проанализирована экономическая сторона разрабатываемой системы.
Необходимо отметить, что в качестве теоретической базы для написания данной работы были применена техническая литература, а также теоретическая российских и зарубежных авторов. Также стоит отметить, что в качестве информационной базы для данной работы были использованы различные электронные ресурсы, нормативные документы, ГОСТы и Федеральные Законы.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В современном мире психологический тип потребителя и его предпочтения играют важную роль для производителей, а также для компаний, предоставляемых услуги. Именно эти данные диктуют производителям, какие товары и услуги им производить и в каком количестве. Информация, расположенная у потребителей в социальных сетях, помогает производителям лучше понимать предпочтения своих клиентов. Стоит отметить, что данная информация является основой для построения психологических моделей, следовательно, для выявления предпочтений потенциальных потребителей.
Как было упомянуто ранее, компания OOO Privacy Safeguard Co специализируется на продуктах, способных определить психологический тип человека, его предпочтения и увлечения, а также его совместимости с другими людьми. Описанный ранее лингвистический анализатор, был разработан специально для компании Privacy Safeguard Co и послужил ядром для всех предоставляемых ею продуктов и услуг.
Стоит отметить, что в данной выпускной квалификационной работе все ранее поставленные задачи были выполнены, а цели достигнуты.
Необходимо отметить, что в первой главе данной магистерской диссертации были подробно рассмотрены, изучены и описаны существующие части речи русского языка, выявлены и рассмотрены их морфологические признаки. Также нельзя не отметить, что в первой части данной работы были описаны и проанализированы существующие инструменты, способные определить части речи введенных слов, а также выявлены и описаны найденные у них достоинства и недостатки. Также в первой части данной работы были найдены и описаны средства разработки для создания нового анализатора, удовлетворяющего требованиям компании ООО Privacy Safeguard Co.
Во второй части был подробно рассмотрен объект данной магистерской диссертации, которым является компания Privacy Safeguard Co. Были выявлена миссия, цели и задачи, рассматриваемой компании. Определена и найдена взаимосвязь стратегических целей и задач. Также были выявлены и определены ключевые факторы рассматриваемой компании для реализации ее стратегии. Стоит отметить, что также во второй части данной магистерской диссертации были определены и описаны бизнес - процессы компании Privacy Safeguard Co, а также взаимосвязь бизнес - процессов и выполняемых компанией функций. Необходимо отметить, что организационная структура компании, была тоже представлена во второй главе данной работы. Были выявлены продукты и услуги, предоставляемые компанией, а также описана и проанализирована ее ИТ - структура. Также стоит отметить, что используемые приложения в рассматриваемой компании были описаны тоже во второй главе данной магистерской диссертации. Алгоритм созданного приложения, также был описан во второй главе данной магистерской диссертации. Нельзя не отметить, что экономическая эффективность реализуемого проекта была описана и проанализирована во второй части магистерской диссертации, и было выявлено, что проект является прибыльным, и инвестиции, вложенные в него, будут в полной мере возвращены инвестору на 12 месяц работы русскоязычного лингвистического анализатора.



1. Бабаев, Ю. А. Теория бухгалтерского учета. [Текст]: учебник для экон. вузов и фак. Ю. А. Бабаев, А. М. Петров; под ред. Ю. А. Бабаева. - 5-е изд., перераб. и доп. - М.: Проспект, 2016. - 240 с.
2. Барахнин В.Б., Кожемякина О.Ю., Рычкова Е.В., Борзилова Ю.С. Автоматическое выделение словосочетаний из текстов славянского происхождения: сравнение подходов // Cloud of science. 2018. №4.
3. Батраева Инна Александровна, Нарцев Андрей Дмитриевич, Лезгян Артем Саркисович ИСПОЛЬЗОВАНИЕ АНАЛИЗА СЕМАНТИЧЕСКОЙ БЛИЗОСТИ СЛОВ ПРИ РЕШЕНИИ ЗАДАЧИ ОПРЕДЕЛЕНИЯ ЖАНРОВОЙ ПРИНАДЛЕЖНОСТИ ТЕКСТОВ МЕТОДАМИ ГЛУБОКОГО ОБУЧЕНИЯ // Вестн. Том. гос. ун-та. Управление, вычислительная техника и информатика. 2020. №50.
4. Бенвенист, Э. Общая лингвистика / Э.Бенвенист. [Текст]: - М.: УРСС, 2002.
5. Бондарко, А.В. Принципы функциональной грамматики и вопросы аспектологии / [Текст]: А.В. Бондарко. — Л., 1983.
6. Бондарко, А.В. Теория морфологических категорий / А.В. Бондарко. [Текст]: — Л., 1976.
7. Боронина, Людмила Николаевна. Основы проектного управления: [Текст]: учебное пособие / Л. Н. Боронина, З. В. Сенук; науч. ред. Ю. Р. Вишневский; Урал. федер. ун-т им. первого Президента России Б.Н. Ельцина. — Екатеринбург: УрФУ, 2011.
8. Боярский К.К., Каневский Е.А. Семантико-синтаксический парсер SemSin // Научно-технический вестник информационных технологий, механики и оптики. 2015. №5.
9. Буланин, Л.Л. Трудные вопросы морфологии [Текст]: / Л.Л. Буланин. — М., 1976.
10. Булатова, Л.Н. Еще о грамматическом статусе категории числа существительных в русском языке [Текст]: / Л.Н. Булатова // Проблемы структурной лингвистики. - М.: Наука, 1983. - С. 120 - 130. 

httpsV/ru.wikipedia.org/wiki/ABC-aHarm(дата обращения: 17.05.2018).
12. Голда Анна Анатольевна, Олейник Павел Петрович Объектная модель представления правил формирования составных частей речи, используемых при морфологическом анализе слов русского языка // Объектные системы. 2012. №1 (6).
13. Грамматический словарь русского языка. Словообразование. Зализняк А.А. - М.: [Текст]: «Аст-Пресс», 2008. - 794с.
14. Гращенков Павел Валерьевич Автоматический анализ русских сложных слов // Вестник Московского университета. Серия 9. Филология. 2016. №6.
15. Друри, К. Управленческий учет для бизнес-решений. [Текст]: учеб. для вузов К. Друри ; пер. с англ. В. Н. Егорова. - М.: ЮНИТИ-ДАНА, 2015. - 645 с.
16. Ерискина Е.В., Курушин Д.С., Яруллин Д.В., Корюкин Д.Ю. Объектно-ориентированная модель морфологического анализатора русскоязычного текста // ИВД. 2018. №4 (51).
17. Желтов Павел Валерианович Модели и алгоритмы в лингвопроцессорах // Вестник ЧГУ. 2005. №2.
18. Жердева М.В., Артюшенко В.М. Стемминг и лемматизация в lucene. Net // Вестник МГУЛ - Лесной вестник. 2016. №3.
19. ИНТУИТ национальный открытый университет [Электронный ресурс]
Внедрение ИС в различных методологиях - URL:
https: //www.intuit.ru/studies/courses/2196/267/lectur.. (дата обращения
05.04.2018)
20. Камынина, А. А. Современный русский язык. Морфология: учебное пособие / А.А. Камынина. — М.: [Текст]: Изд-во МГУ, 1999. — 240 с.
21. Касевич, В.Б. Семантика. Синтаксис. Морфология / В.Б. Касевич. - М.: [Текст]: Наука, 1988. - 309 с.
22. Каталог группы ИТ компаний. [Электронный ресурс] - URL: http://asp- 1c.ru/asp-catalog/catalog/?SECTION_ID=5648.. (дата обращения: 04.05.2018).
23. Козырева, Т.Г. Современный русский язык. Имя прилагательное. Имя числительное. Местоимение / Т.Г. Козырева, Е.С. Хмелевская. — Минск: [Текст]: Вышэйшая школа. 1982. — 166 с.
24. Колодезнев, В. М. Морфология русского языка: практический курс: [Текст]: учеб. пособие для студентов вузов / В.М. Колодезнев. — М.: ВЛАДОС, 1999. — 264 с.
25. Комендантов Анатолий Сергеевич, Матвеев Александр Георгиевич, Светлов Андрей Владимирович АВТОМАТИЗАЦИЯ МОРФОЛОГИЧЕСКОЙ РАЗМЕТКИ АРХИВНЫХ ДОКУМЕНТОВ // Вестник ВолГУ. Серия 1: Математика. Физика. 2019. №4.
26. Лапшин Сергей Владимирович, Лебедев Илья Сергеевич Метод повышения точности автоматического определения частей речи слов предложения в морфологических анализаторах DLP-систем // Научно-технический вестник информационных технологий, механики и оптики. 2013. №4 (86).
27. Лапшина С. Н. Архитектура предприятия [Текст]: Учебное электронное текстовое издание / С. Н. Лапшина - ФГАОУ ВО «УрФУ», 2012. с. 48.
28. Лекант, П.А. Современный русский язык / П.А. Лекант [и др.]; под общ. ред. П.А. Леканта. — М.: [Текст]: Высш. шк., 1982. — 399 с.
29. Морфология современного русского языка (имя существительное, имя прилагательное) / Мин-во образования РБ; Могилевский гос. пед. ин-т им. А.А.Кулешова; сост. Л.В.Шеболдина. — Могилев: [Текст]: Изд-во МГПИ, 1997. — 34 с.
30. Н. Н. Карабутов Информационные технологии в экономике. [Текст]: Издательство: Экономика; 208 стр., 2003 г.
31. Невдах Марина Михайловна Применение информационных технологий в исследовании текстов // Труды БГТУ. Серия 4: Принт- и медиатехнологии. 2009. №9.
32. Орфографический словарь русского языка. Букчина Б.В., Сазонова И.К., Чельцова Л.К. - М.: [Текст]: «Аст-Пресс», 2008. - 1288с.
33. Основы IDEF3 - Теория и практика финансового анализа. [Электронный
ресурс] - URL: http://citforum.ru/cfin/idef/idef3.shtml(дата обращения:
11.04.2018).
34. Павлов А. Н. Управление проектами на основе стандарта PMI PMBOK. [Текст]: А. Н. Павлов - 3-е изд., испр. и доп. - Москва: БИНОМ. Лаборатория знаний, 2014. с. 10.
35. Панов, М.В. Позиционная морфология русского языка / М.В. Панов. - М.: Наука: [Текст]: Школа «Языки русской культуры», 1999. - 275 с.
36. Плунгян, В.А. Общая морфология: [Текст]: Введение в проблематику / В.А. Плунгян. - М.: Едиториал УРСС, 2003. - 384 с.
37. Положение о выпускной квалификационной работе [Текст]: Рассмотрено и одобрено на заседании Учебно-методического совета Института «ВШЭМ» протокол №7 от 15.09.2017г. с. 39.
38. Приказ Минобрнауки России от 12.03.2015 N 207 "Об утверждении федерального государственного образовательного стандарта высшего образования по направлению подготовки 09.03.03 Прикладная информатика (уровень бакалавриата)". [Текст]: 11 с.
39. Райзберг Б.А., Лозовский Л.Ш., Стародубцева Е.Б.. Современный экономический словарь. [Текст]: — 2-е изд., испр. М.: ИНФРА-М. 479 с. 1999.
40. Розанов А.К. Быстрый алгоритм анализа словоформ естественного языка с трехуровневой моделью словаря начальных форм // Cloud of science. 2016. №1.
41. Розенталь, Д.Э. Современный русский язык. [Текст]: Учебное пособие для студентов-филологов заочного обучения / Д.Э. Розенталь, И.Б. Голуб, М.А. Теленкова. — М.: Высшая школа, 1991. — 559 с.
42. Руденко, А.А. Современный русский язык: УМК: [Текст]: в 2 ч. - Ч. 1. Словообразование. Имя существительное. Имя прилагательное. Имя числительное. Местоимение / А.А. Руденко. - Минск: БГУ, 2002.
43. Русский язык. Морфология: учебник для школ с углубленным изучением русского языка / под ред. П.П. Шуба. [Текст]: — Минск: Народная асвета, 1996. — 391с.
44. Рыбка Р.Б., Сбоев А.Г., Иванов И.И. Численное моделирование процедуры синтаксического разбора с использованием нейронных сетей // Вестник ВГУ. Серия: Лингвистика и межкультурная коммуникация. 2015. №3.
45. С. В. Маклаков Моделирование бизнес-процессов. [Текст]: Издательство: Диалог - МИФИ, 240 стр., 2003 г..
46. Сервис финансово-управленческого учета. [Электронный ресурс] - иРТ: https://smallerp.ru(дата обращения: 03.05.2018).
47. Системный анализ: лекции и учебные пособия. [Электронный ресурс] - иРТ:
http://victor-safronov.rU/systems-analysis/lectures/z.. (дата обращения:
9.04.2018).
48. Современный русский язык / Под ред. Л.А. Новикова. [Текст]: - СПб., 2001.
- 532 с.
49. Современный русский язык /под общ. ред. В.А. Белошапковой. [Текст]: — М. 1981.
50. Современный русский язык. Морфология / под общ. ред. И.А. Киселева. [Текст]: — Минск: Вышэйшая школа, 1992. — 335 с.
51. Современный русский язык: в 3 ч. — Ч.2. Словообразование. Морфонология. [Текст]: Морфология / П.П. Шуба [и др.]; под ред. П.П. Шуба. — 2-е изд., испр. и доп. — Минск: ООО "Плопресс", 1998. — 544 с.
52. Современный русский язык: теория, анализ языковых единиц: в 3-х ч. [Текст]:
— Ч.2: морфология: учебник /Л.Д.Чеснокова, В.С.Печникова; под ред. Е.И.Дибровой. — 2-е изд. доп. и перераб. — Ростов н/Д: Феникс, 1997. — 303 с.
53. Современный русский язык: фонетика, орфоэпия, графика, орфография, лексикология, фразеология, словообразование, морфология: учебное пособие / В.Д.Стариченок [и др.]; [Текст]: под общ. ред. В.Д.Стариченка. — Минск: Вышэйшая школа, 1999. — 430 с.
54. Сороковой Никита Константинович, Моторков Антон Александрович, Белоусов Роман Леонидович Обзор решений SDN/NFV зарубежных производителей // T-Comm. 2015. №9.
55. Тебайкина Н. И. CASE-средства [Текст]: Электронное учебно-методическое пособие / Тебайкина Н. И. Екатеринбург: УГТУ-УПИ, 2007. с.88.
56. Тебайкина Н. И. Управление проектами в MS PROJECT: учебник для студентов вузов, обучающихся по специальности 080801 «Прикладная информатика (по обл.)» и другим экономическим специальностям [Текст]: Н. И. Тебайкина; Урал. федер. ун -т им. первого Президента России Б. Н. Ельцина; науч. ред. А. В. Луценко. - 2-е изд. - Екатеринбург: УрФУ, 2010. с. 25.
57. Усталов Дмитрий Алексеевич, Гольдштейн Михаил Людвигович Распределенная инструментальная среда словарного морфологического анализа для обработки русского языка // Вестник ЮУрГУ. Серия: Математическое моделирование и программирование. 2012. №27.
58. Шанский, Н.М. Современный русский литературный язык. Учебное пособие для студентов педагогических институтов / Н.М. Шанский [и др.]; [Текст]: под ред. Н.М. Шанского. — Л.: Просвещение, 1981. — 584 с.
59. Энциклопедический словарь-справочник лингвистических терминов и понятий. Русский язык: в 2 т. Т. 1./ под общ. ред. А.Н. Тихонова, Р.И. Хашимова. - М.: [Текст]: Флинта: Наука, 2008. - 840 с.
60. Энциклопедический словарь-справочник лингвистических терминов и понятий. Русский язык: в 2 т. Т. 2./ под общ. ред. А.Н. Тихонова, Р.И. Хашимова. - М.: [Текст]: Флинта: Наука, 2008. - 840 с.
61. Якубовский К.И., Якубовская К.А. Обзор современных лингвистических технологий и систем // Вестник МГУП. 2015. №2.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ