Тип работы:
Предмет:
Язык работы:


Разработка клиент-серверного приложения по поиску потерянных вещей на основе лингвистического анализа объявлений

Работа №80198

Тип работы

Дипломные работы, ВКР

Предмет

автоматика и управление

Объем работы42
Год сдачи2017
Стоимость4340 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
185
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 10
1 АНАЛИТИЧЕСКИЙ РАЗДЕЛ 12
1.1 Подходы разбора объявлений 12
1.2 Томита-парсер 12
1.3 Алгоритм работы парсера 14
1.4 Параметры совмещения объявлений. Модель данных 16
1.5 Нечёткий поиск в тексте и словаре. Расстояние Левенштейна 17
1.6 Авторизация. JWT 19
1.7 Общая архитектура приложения 20
1.8 REST-сервис 23
1.9 Django 24
Выводы 25
2 ПРАКТИЧЕСККИЙ РАЗДЕЛ 26
2.1 Постановка задачи разбора 26
2.2 Написание алгоритма разбора 26
2.3 Ложные срабатывания 29
2.4 Особые случаи 31
2.5 Проектирование базы данных 33
2.6 Реализация сервера 35
2.7 Клиентское приложение на платформе Android 36
2.7.1 Использование сторонних библиотек. Оптимизация 36
2.7.2 Разработка графической части 39
2.7.3 Основные этапы работы приложения 40
Выводы 42
Заключение 43
ПРИЛОЖЕНИЕ А. Список методов сервера 45

Клиент-серверное приложение по поиску потерянных вещей представляет собой систему, состоящую из трёх частей: парсер, сервер, клиент.
В настоящее время проблема поиска решается с помощью различных специализированных сервисов: различные бюро находок, сайты, множество сообществ в социальных сетях. Однако их разрозненность не позволяет эффективно решать задачу совмещения объявлений. Человек попросту не знает куда ему обратиться. Именно поэтому было приято решение разработать систему, которая будет объединять все (или какой-то круг) такого рода сервисов. Однако, у объявлений нет стандарта, поэтому в каждой системе они хранятся по-своему. В большинстве это никак не структурированное изложение проблемы на русском языке.
Главная проблема на пути понимания машинами естественных языков заключается в том, что их грамматика и семантика слабо поддаются формализации. Кроме того, от языков программирования их отличает присутствие многозначности.
Однако определенные результаты в этой области есть: машину можно научить находить нужные объекты в тексте на естественном языке, находить между ними связи и представлять необходимые данные в формализованном виде для дальнейшей обработки.
Данная дисциплина носит название “Извлечение именованных сущностей” (англ. - Named Entity Recognition) или в более широком смысле “Извлечение фактов”, когда между именованными сущностями анализируются взаимосвязи, и является одной из ключевых задач систем автоматической обработки текста.
Целью этой работы является разработка такого лингвистического парсера, а также клиентского, для работы с пользователями, и серверного приложения для обеспечения сбора, и анализа объявлений. Первой клиентской платформой выбран Android, так как имеет самую большую аудиторию пользователей. Для ускорения разработки в серверной части используется python с фреймворком django.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В результате выполнения данной работы был спроектирован и разработан программный комплекс для поиска потерянных вещей на основе лингвистического анализа объявлений.
Также были достигнуты следующие промежуточные результаты:
• проведён анализ предметной области и задачи разбора объявления на русском языке;
• разработаны правила лингвистического разбора и реализованы в программе на основе Томита-парсера;
• разработан сервер и база данных для сбора, хранения, анализа отдачи данных;
• разработано клиентское приложение на платформе Android.
Разработанный программный комплекс был протестирован и полностью соответствует требованиям технического задания.
Достоинства разработанного сервиса:
• принимает объявления в любом формате;
• клиент на платформе с самой большой аудиторией;
• надёжны и статичный разбор (система не обучается, правила не меняются)
В качестве направлений дальнейшего развития можно выделить увеличение эффективности правил разбора парсера, увеличение гибкости правил совмещения объявлений, разработка клиентских приложений для других платформ.



1. Антонова А.Ю., Соловьев А.Н. (2013) Использование метода условных случайных полей для обработки текстов на русском языке - Компьютерная лингвистика и интеллектуальные технологии
2. Пуксант А.С., Черняк Е.Л. (2016) Извлечение именованных сущностей из текстов на русском языке - Выпускная Квалификационная работа НИУ ВШЭ
3. Томита-парсер. Документация. URL: https://tech.yandex.ru/tomita/doc/dg/concept/about-docpage/ (дата обращения: 26.06.2017)
4. Как использовать Томита-парсер в своих проектах. Практический курс. URL: https://habrahabr.ru/company/yandex/blog/225723/ (дата обращения: 26.06.2017)
5. Извлечение фактов из текста. Томита-парсер Яндекса. URL: http://vas3k.ru/blog/354/ (дата обращения 26.06.2017)
6. Лингвистическое обеспечение САПР [Электронный курс] // База и Генератор Образовательных Ресурсов. МГТУ им. Н.Э. Баумана. 03.06.2008. URL: http://bigor.bmstu.ru/?cnt/?doc=LO-SAPR/base.cou (дата обращения 26.06.2017)
7. Package Index // Android Developers [Электронный ресурс]. URL: https://developer.android.com/reference/packages.html (дата обращения 26.06.2017)
8. VK SDK // Разработчикам [Электронный ресурс]. URL: https://vk.com/dev/SDK(дата обращения 26.06.201 )
9. SDK для Android // Facebook для разработчиков [Электронный ресурс]. URL: https://developers.facebook.com/docs/android(дата обращения 26.06.2017)
10. Шилдт Г. Java 8. Полное руководство. Вильямс, 2015


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ