Тема: Разработка автоматизированной системы комплексного структурно - семантического и тематического анализа естественно языковых текстов
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. ИССЛЕДОВАНИЕ ЧАСТЕЙ РЕЧИ С ТОЧКИ ЗРЕНИЯ
ПРИМЕНЕНИЯ ИНСТРУМЕНТАРИЯ ДЛЯ ИХ АНАЛИЗА 8
1.1 Части речи и их морфологические характеристики 8
1.2 Обзор инструментария для определения частей речи 23
1.3 Результаты и выводы первой главы 27
2. РАЗРАБОТКА ЛИНГВИСТИЧЕКСОГО АНАЛИЗАТОРА 29
2.1 Описание лингвистического анализатора 29
2.2 Выбор инструментария лингвистического анализатора 29
2.3 Алгоритм работы приложения 38
2.4 Результаты и выводы второй главы 40
3. ВНЕДРЕНИЕ ЛИНГВИСТИЧЕСКОГО АНАЛИЗАТОРА НА ПРЕДПРИЯТИИ 42
3.1 Общая характеристика организации 42
3.2 Полная модель предприятия 43
3.3 Формулировка и решение проблемы на предприятии 63
3.4 Результаты и выводы третьей главы 83
ЗАКЛЮЧЕНИЕ 85
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 87
📖 Введение
В современном мире информацию о человеке, его деятельности и предпочтениях легко получить из социальных сетей. Даже если человек оставляет разделы, предназначенные для заполнения информации о себе пустыми, его легко охарактеризовать по публикуем постам на стене. Стоит отметить, что для извлечения информации о психологическом типе и предпочтениях человека со стены, необходимо уметь грамотно строить психологические модели. Как правило, психологические модели, направленные на определение психологического типа и предпочтений, строятся на основе слов, а также их частоты употребления. Необходимо отметить, что при построении данных моделей в первую очередь важна частота употребляемых человеком видов частей речи, а также выделение их морфологических признаков.
Таким образом, для выявления предпочтений человека и его психологического типа необходим качественный анализатор, способный определить части речи вводимых слов, а также их морфологические характеристики.
Объектом магистерской диссертации является предприятие OOO Privacy Safeguard Co, которое оказывает услуги, направленные на привлечение клиентов для других компаний и помогает им выявить предпочтения своих клиентов. Так как на момент открытия компания не имела никаких продуктов, она нуждалась в разработке лингвистического анализатора, который стал бы основой всех разрабатываемых ею продуктов и предоставляемых услуг. Соответственно, предметом данной магистерской диссертации является русскоязычный лингвистический анализатор.
Стоит отметить, что целью данной работы является разработка эффективного русскоязычного лингвистического анализатора, способного безошибочно определять чисти речи и их морфологические характеристики, так как на момент создания компании Privacy Safeguard Co таковые отсутствовали на рынке. Для достижения поставленных целей были поставлены следующие задачи:
- изучить теоретические основы русскоязычных частей речи, а также их морфологические характеристик;
- выявить русскоязычные анализаторы, представленные на рынке;
- проанализировать их достоинства и недостатки;
- определить средства разработки, способные обойти проблемы, присутствующие в ранее разработанных лингвистических анализаторах;
- построить полную модель предприятия OOO Privacy Safeguard Co, тем самым проанализировать ее деятельность;
- описать бизнес - процесс рассматриваемой мной компании после внедрения анализатора;
- с помощью выбранной методологии описать план разработки проекта;
- исходя из выявленных средств разработки создать новый эффективный лингвистический анализатор;
- провести экономический анализ внедряемого проекта, а также написать его экономическое обоснование.
Необходимо отметить, что для описания данной магистерской диссертации был использован ряд следующих инструментов:
- MS Word;
- MS Excel;
- MS Visio;
- MS Project;
- Ramus;
- язык программирования python;
- среда разработки программного обеспечения IDLE;
- библиотека sqlite3.
Данная выпускная квалификационная работа включает в себя введение, заключение, список использованных источников и ряд следующих глав:
- исследование частей речи с точки зрения применения инструментария для их анализа;
- внедрение лингвистического анализатора на предприятии.
Стоит отметить, что в первой главе данной магистерской диссертации подробно рассмотрены все существующие части речи русского языка, а также их морфологические характеристики, выявлены и проанализированы популярные инструментарии для определения частей речи слов русского языка. Также в первой главе данной работы выявлены и подробно описаны средства необходимые для разработки нового эффективного лингвистического анализатора.
Во второй главе данной магистерской диссертации проведен тщательный анализ ООО Privacy Safeguard Co, а также построена полная модель данного предприятия. Создана модель TO-BE, наглядно демонстрирующая внедрение новой системы в компанию Privacy Safeguard Co. Также во второй главе магистерской диссертации разработан план внедрения разрабатываемого проекта, исходя из выбранной методологии, а также описана и проанализирована экономическая сторона разрабатываемой системы.
Необходимо отметить, что в качестве теоретической базы для написания данной работы были применена техническая литература, а также теоретическая российских и зарубежных авторов. Также стоит отметить, что в качестве информационной базы для данной работы были использованы различные электронные ресурсы, нормативные документы, ГОСТы и Федеральные Законы.
✅ Заключение
Как было упомянуто ранее, компания OOO Privacy Safeguard Co специализируется на продуктах, способных определить психологический тип человека, его предпочтения и увлечения, а также его совместимости с другими людьми. Описанный ранее лингвистический анализатор, был разработан специально для компании Privacy Safeguard Co и послужил ядром для всех предоставляемых ею продуктов и услуг.
Стоит отметить, что в данной выпускной квалификационной работе все ранее поставленные задачи были выполнены, а цели достигнуты.
Необходимо отметить, что в первой главе данной магистерской диссертации были подробно рассмотрены, изучены и описаны существующие части речи русского языка, выявлены и рассмотрены их морфологические признаки. Также нельзя не отметить, что в первой части данной работы были описаны и проанализированы существующие инструменты, способные определить части речи введенных слов, а также выявлены и описаны найденные у них достоинства и недостатки. Также в первой части данной работы были найдены и описаны средства разработки для создания нового анализатора, удовлетворяющего требованиям компании ООО Privacy Safeguard Co.
Во второй части был подробно рассмотрен объект данной магистерской диссертации, которым является компания Privacy Safeguard Co. Были выявлена миссия, цели и задачи, рассматриваемой компании. Определена и найдена взаимосвязь стратегических целей и задач. Также были выявлены и определены ключевые факторы рассматриваемой компании для реализации ее стратегии. Стоит отметить, что также во второй части данной магистерской диссертации были определены и описаны бизнес - процессы компании Privacy Safeguard Co, а также взаимосвязь бизнес - процессов и выполняемых компанией функций. Необходимо отметить, что организационная структура компании, была тоже представлена во второй главе данной работы. Были выявлены продукты и услуги, предоставляемые компанией, а также описана и проанализирована ее ИТ - структура. Также стоит отметить, что используемые приложения в рассматриваемой компании были описаны тоже во второй главе данной магистерской диссертации. Алгоритм созданного приложения, также был описан во второй главе данной магистерской диссертации. Нельзя не отметить, что экономическая эффективность реализуемого проекта была описана и проанализирована во второй части магистерской диссертации, и было выявлено, что проект является прибыльным, и инвестиции, вложенные в него, будут в полной мере возвращены инвестору на 12 месяц работы русскоязычного лингвистического анализатора.



