Тип работы:
Предмет:
Язык работы:


ВИРТУАЛЬНЫЙ СОБЕСЕДНИК НА ОСНОВЕ НЕЙРОННЫХ И СЕМАНТИЧЕСКИХ СЕТЕЙ

Работа №77792

Тип работы

Бакалаврская работа

Предмет

информационные системы

Объем работы43
Год сдачи2017
Стоимость4260 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
43
Не подходит работа?

Узнай цену на написание


Введение 4
Глава 1. Теоретические основы обработки естественного языка и создания виртуальных собеседников 7
1.1. Обработка естественного языка 7
1.2. База лингвистических знаний и система управления 9
1.3. Структура диалоговой ИС и её компоненты 9
1.4. Векторное представление слов 11
1.5. Нейронные сети 13
1.5. Рекуррентные нейронные сети 16
1.6. Нейронные сети с долгой краткосрочной памятью 18
1.7. Функция Softmax 19
1.8. Модели представления знаний 20
1.9. Семантические сети 21
Глава 2. Проектирование виртуального собеседника 23
2.1. Определение возможностей разрабатываемой библиотеки классов
2.2. Принцип работы виртуального собеседника 24
2.3. Используемые средства для разработки проекта 26
2.3.1. Microsoft Visual Studio 2015 Community Edition 26
2.3.2. MyStem 3.0 27
2.3.3. LTSM-Language-Model 28
2.3.4. Word2Vec.Net 28
2.4. Интерпретация архитектуры диалоговой системы для разрабатываемой модели 29
Глава 3. Реализация виртуального собеседника 32
3.1. Структура разрабатываемой библиотеки 32
3.2. Класс Bot 34
3.3. Класс Lemmatisation 35
3.4. Класс SemanticNets 36
3.5. Класс Vectorization 38
Заключение 39
Список литературы 40

Приложения должны быть в работе, но в данный момент отсутствуют

Актуальность. Возможность общения человека с компьютером на естественном языке предполагалась задолго до существования современных технологий [1]. В наши дни решению данной задачи способствует множество факторов, таких как: быстрый доступ к информации, возможность её хранения в больших объемах, большая вычислительная мощность даже на портативных устройствах [2].
Сегодня всё больше появляются приложений и решений без использования графического пользовательского интерфейса, взамен стандартного решения приходит текстовый интерфейс [3]. Вследствие этого выросло и количество платформ, способствующих быстрому и лёгкому созданию, так называемых, ботов для социальных сетей и мессенджеров [4]. Причём пользование данными сервисами растёт не только среди пользователей, создающих такие приложения ради развлечения, но и среди коммерческих организаций, для быстрой и лёгкой коммуникации с клиентами [5].
Чаще всего такие приложения являются командными строками, где пользователям необходимо либо запоминать определённый набор команд, либо ограничиваться их малым количеством. Поэтому людям привычнее использовать естественный язык.
Также с развитием технологий распознавания речевых конструкций, широкое распространение получили голосовые помощники. Например, сегодня SpeechKit от компании Яндекс правильно распознаёт 95% адресов и географических объектов, максимально приблизившись к человеку, который понимает 96-98% услышанных слов. Полнота распознавания новой модели для диктовки различных текстов сейчас составляет 82% [6]. С таким уровнем существует возможность создать полноценное решение, распознающее естественный язык, для конечных пользователей. 
На примере голосового помощника Siri от компании Apple, изображённого на Рисунке 1, создаваемого на протяжении многих лет и имеющего большую базу знаний для обучения [7], можно убедиться, что данная проблема ещё не решена в полной мере и команды имеющие похожую семантику, однозначно понятные для человека, воспринимаются как разные информационной системой.
Цели работы:
1. Изучение современных методов обработки естественного языка.
2. Исследование методов применения искусственных нейронных сетей для обработки текста.
3. Освоение различных способов представления знаний.
4. Создание универсальной библиотеки для программ, разрабатываемых на платформе .NET Framework, способных обучаться на предоставленной им информации, отличать команды пользователя на естественном языке, имеющие схожий смысл, и отвечать на них, выбирая один из вариантов ответа предоставленных создателем программы.
Задачи работы:
1. Освоить весь необходимый теоретический материал в сфере искусственного интеллекта, необходимый для непосредственного создания требуемой информационной системы.
2. Создать библиотеку классов на языке программирования C#, с необходимым количеством классов, методов и свойств, для полного функционирования конечной программы, способной обрабатывать естественный язык.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В данной работе была создана библиотека классов для .NET Framework, выполняющая весь функционал виртуального собеседника и изучены различные способы пригодные для обработки естественного языка. Все поставленные цели были достигнуты, а задачи были успешно выполнены. Были изучены современные методы обработки текстов на естественном языке в области компьютерной лингвистики и искусственного интеллекта, возможности применения и способы создания искусственных нейронных сетей.
При условии дальнейшего развития данной работы возможно создание графического пользовательского интерфейса, то есть конечной программы, причём возможен как веб-интерфейс, так и боты под существующие социальные сети.
Так же существуют и другие перспективы развития проекта, такие как:
• Добавление новых отношений для семантических сетей.
• Дополнительное тестирование системы на других параметрах нейронных сетей, таких как количество скрытых слоев, для минимизации ошибок.
• Добавление речевых технологий, таких как распознавание
голосовых команд и генерация звуковых ответов.
• Создание блока графематического анализа в программе для нахождения устойчивых словосочетаний и других словесных конструкций, например, ФИО, электронной почты и т.д.



1. Тьюринг А. Может ли машина мыслить? Москва: Государственное издательство физико-математической литературы, 1960. 67 с.
2. Провотар А.И., Клочко К.А. Особенности и проблемы виртуального общения с помощью чат-ботов // Науков! пращ ВНТУ, № 3, 2013.
3. Чатботы: массовая истерия [Электронный ресурс] // Хабрахабр: [сайт]. [2016]. URL: https://habrahabr.ru/post/300872/(дата обращения: 2.05.2017).
4. 20 лучших инструментов для разработчиков ботов [Электронный ресурс] // AppTractor: [сайт]. [2016]. URL: http://apptractor.ru/info/articles/20- luchshih-instrumentov-dlya-razrabotchikov-botov.html(дата обращения: 3.05.2017).
5. Чат-боты для бизнеса: российский опыт [Электронный ресурс] // eMagnat: [сайт]. [2016]. URL: http://emagnat.ru/chat-boty-dlya-biznesa.html(дата обращения: 4.05.2017).
6. Интерактивное голосовое редактирование текста с помощью новых речевых технологий от Яндекса [Электронный ресурс] // Хабрахабр: [сайт]. [2014]. URL: https://habrahabr.ru/company/yandex/blog/198556/(дата обращения: 5.05.2017).
7. An exclusive inside look at how artificial intelligence and machine learning work at Apple. [Электронный ресурс] // Backchannel: [сайт]. [2016]. URL: https://backchannel.com/an-exclusive-look-at-how-ai-and-machine-learning- work-at-apple-8dbfb131932b(дата обращения: 4.05.2017).
8. Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие. Москва: МИЭМ, 2011. 272 с.
9. Deshmukh M.A., Kandalkar S., Choudhary D., Khairkar A., Shah A. Predicting Instructor Performance using Data Mining Techniques in Higher Education // IJESC, Т. 7, № 4, 2017.
10 Попов Э.В. Общение с ЭВМ на естественном языке. Москва: Наука, . 1982. 360 с.
11 Черкасова Г.А. Автоматизация построения баз лингвистических знаний
. диалоговых систем // В кн.: Материалы III Всесоюзной конференции по созданию Машинного фонда русского языка. Москва: МГУ, 1990. С. 41¬49.
12 Никонов В.О. Диалоговая интеллектуальная система с естественно¬
. языковым интерфейсом. Диссертация. 2007. 138 с.
13 Mikolov T., Chen K., Corrado G., Dean J. Efficient Estimation of Word
. Representations in Vector Space // arXiv preprint arXiv:1301.3781, Jan 2013.
14 Mikolov T., Sutskever I., Chen K., Corrado G.S., Dean J. Advances in neural
. information processing systems // Distributed representations of words and phrases and their compositionality. South Lake Tahoe, Nevada, United States. 2013. С. 3111-3119.
15 Veen F.V. The neural network zoo [Электронный ресурс] // The Asimov . Institute: [сайт]. [2016]. URL: http://www.asimovinstitute.org/author/
fjodorvanveen/ (дата обращения: 8.05.2017).
16 Lopez M.M., Kalita J. Deep Learning applied to NLP // arXiv:1703.03091,
. 2017.
17 Рекурентная нейронная сеть в 10 строчек кода оценила отзывы зрителей
. нового эпизода “Звездных войн” [Электронный ресурс] // Хабрахабр: [сайт]. [2016]. URL: https://habrahabr.ru/company/dca/blog/274027/(дата обращения: 17.05.2017).
18 Sepp Hochreiter J.S. Long Short-Term Memory // Neural Computation, Т. 9,
. № 8, Ноябрь 1997. С. 1735-1780.
19 Bridle J.S. Training Stochastic Model Recognition Algorithms as Networks
. can Lead to Maximum Mutual Information Estimation of Parameters // В кн.: Advances in neural information processing systems 2. San Francisco, CA, USA: Morgan Kaufmann Publishers, Inc, 1990. С. 211-217.
20 Модели представления знаний [Электронный ресурс] // Лекции.Орг:
. [сайт]. [2016]. URL: http://lektsii.org/5-43183.html(дата обращения: 20.05.2017).
21 Галяев В.С., Победа А.П. Учебное пособие по дисциплине
. «Интеллектуальные информационные системы». Махачкала: ДГИНХ, 2011.
22 Gentile A.L., Zhang Z., Xia L., Iria J. Cultural knowledge for named entity . disambiguation: a graph-based semantic relatedness approach // Serdica J.
Computing 4, 2010. С. 217-242.
23 Boender F. Weighted Random Distribution [Электронный ресурс] // electric
. monk: [сайт]. [2009]. URL: https://www.electricmonk.nl/docs/ weighted_random_distribution/weighted_random_distribution.pdf (дата обращения: 5.06.2017).
24 Лицензионное соглашение на использование программы MyStem
. [Электронный ресурс] // Яндекс: [сайт]. [2011]. URL: https://yandex.ru/ legal/mystem/ (дата обращения: 25.05.2017).
25 Segalovich I. A fast morphological algorithm with unknown word guessing
. induced by a dictionary for a web search engine [Электронный ресурс] // Яндекс: [сайт]. URL: http://cache-mskdataline08.cdn.yandex.net/ download.yandex.ru/company/iseg-las-vegas.pdf (дата обращения: 3.06.2017).
26 Generating Aesop's Fables One Character at a Time. [Электронный ресурс] // . Robosoup: [сайт]. [2016]. URL: http://www.robosoup.com/2016/11/
generating-aesops-fables-one-character.html (дата обращения: 27.05.2017).
27 Language Model using LSTM or RNN (C#) [Электронный ресурс] //
. GitHub: [сайт]. [2016]. URL: https://github.com/robosoup/LSTM-Language- Model(дата обращения: 28.05.2017).
28 MIT License [Электронный ресурс] // GitHub: [сайт]. [2016]. URL: https://
. github.com/robosoup/LSTM-Language-Model/blob/master/LICENSE(дата обращения: 28.05.2017).
29 word2vec [Электронный ресурс] // Google Code: [сайт]. [2013]. URL:
. https://code.google.com/archive/p/word2vec/(дата обращения: 29.05.2017).
30 implementation Word2Vec for.Net framework [Электронный ресурс] //
. GitHub: [сайт]. [2016]. URL: https://github.com/eabdullin/Word2Vec.Net(дата обращения: 01.06.2017).
31 Word2Vec.Net/LICENSE[Электронный ресурс] // GitHub: [сайт]. [2016].
. URL: https://github.com/eabdullin/Word2Vec.Net/blob/master/LICENSE(дата обращения: 30.05.2017).
32 Документация [Электронный ресурс] // Яндекс: [сайт]. URL: https:// . tech.yandex.ru/mystem/doc/(дата обращения: 2.06.2017).
33 API:Заглавная страница [Электронный ресурс] // MediaWiki.org: [сайт].
. [2017]. URL: https://www.mediawiki.org/wiki/API:Main_page/ru(дата
обращения: 1.06.2017).
34 API// Викисловарь: [сайт]. URL: https://ru.wiktionary.org/w/
. api.php?action=query&titles=собака&prop=revisions&rvprop=content&form at=xml (дата обращения: 1.06.2017).


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ