Введение..................................................................................3
Глава 1
1.1 Основные принципы работы вопросно-ответных систем......7
1.2 Виды вопросно-ответных систем....................................18
1.3 Языковые средства русского языка для описания
перемещения и изменения положения в пространстве.........................25
Глава 2
2.1 Создание базы данных для вопросно-ответной системы......35
2.2 Алгоритм вопросно-ответной системы навигации в
городской среде.........................................................................41
2.3 Алгоритм автоматического пополнения базы данных.........61
Заключение.............................................................................72
Библиография..........................................................................74
Приложение 1...........................................................................79
Приложение 2...........................................................................81
Приложение 3...........................................................................82
Приложение 4..........................................................................84
Приложение 5..........................................................................86
Приложение 6..........................................................................88
Построение вопросно-ответных систем имеет большое значение для
развития моделей отношений человека и компьютера. Моделирование
вопросно-ответных систем позволяет создать гораздо более широкое и
удобное взаимодействие человека с компьютером на естественном языке.
При использовании вопросно-ответных систем навигации у человека
появляется возможность получить ответ на вопрос о пути, который ему
предстоит преодолеть, в режиме реального времени на понятном и
привычном для него языке. Подача информации в более понятном формате
важна потому, что форма внутренних представлений, которая используется в
компьютерных системах, как правило, требует определенных знаний для
интерпретации. Поэтому появляется необходимость создания систем,
которые могут представлять данную информацию в понятной форме, то есть
на естественном языке. Чем более близок язык, используемый вопросно-
ответной системой, к разговорному языку, тем проще человеку использовать
данную систему и строить с ней диалог. Соответственно, построение
вопросно-ответных систем навигации имеет большое практическое значение,
особенно для людей, не имеющих представления о том, как устроены
компьютерные системы, которые прокладывают маршруты на картах. Для
таких людей наиболее важно получить ответ на естественном языке, который
может дать вопросно-ответная система навигации.
Целью работы является моделирование вопросно-ответной системы
навигации в городской среде на русском языке с использованием ориентиров
и различных глаголов перемещения.
Реализация данной цели предполагает решение следующих задач:
1. Исследование принципов работы и видов вопросно-ответных систем.
2. Исследование языковых конструкций для русского языка,
содержащих семантику перемещения и направления.
3. Создание базы данных, содержащей названия точек на местности
и ориентиров, а также описания возможных вариантов перемещения из этих точек.
4. Написание алгоритма вопросно-ответной системы навигации в
городской среде.
5. Написание алгоритма автоматического пополнения базы данных.
В задачи данной работы не входит написание полноценной программы.
А также не входит оценка алгоритма работы вопросно-ответной системы с
точки зрения его оптимизации для программирования.
В современных навигаторах типа Google Maps [Google Maps],
Яндекс.Карты [Яндекс.Карты] и т.д. описания маршрутов являются не очень
удобными для использования. Например, длина пути обозначаются
количеством метров или временем движения, что неудобно для понимания,
так как не каждый может определить на глаз, как выглядят двести метров, и
все ходят с разной скоростью. В свете этого становится очевидным, что
целесообразно было бы создать вопросно-ответную систему навигации с
описаниями ориентиров по ходу движения в маршрутах вместо описания
длины пути в метрах или во времени, что заметно облегчило бы поиск пункта
назначения и дало возможность выбрать наиболее подходящий маршрут.
Новизна данного исследования состоит в том, что разработанный в
ходе исследования прототип вопросно-ответной системы навигации,
учитывая лингвистические компоненты, делает свои описания маршрутов
более естественными и удобными для использования.
В отличие от наиболее популярных современных навигаторов он
реализует естественно-языковое общение с пользователем, тогда как
современные навигаторы, такие как Google Maps и Яндекс.Карты, выдают
описания маршрутов в формализованном виде. Разработанная вопросно-
ответная система выдает названия локаций и ориентиров в правильных
падежах в отличие от данных навигаторов. Также данная система богата
речевым разнообразием, так как использует различные глаголы перемещения
в описаниях маршрутов. И, конечно, самое важное преимущество данной
системы над этими популярными современными навигаторами состоит в том,
что в отличие от них, данная система вместо описаний длинны пути в метрах
использует описания движения по ориентирам, что кажется намного более
естественным и удобным.
Настоящая работа будет способствовать развитию в области
разработки естественно-языковых навигаторов. Ее результаты могут служить
исследователям основой для создания новых, возможно, более
усовершенствованных вопросно-ответных систем навигации, что,
несомненно, будет иметь важные теоретические и практические последствия
для исследования лингвистических компонентов в области навигации.
В качестве материала для данного исследования выступали описания
маршрутов, взятые из Google Maps [Описания Google Maps], так как данный
навигатор на данный момент обладает наибольшим авторитетом. Для
исследования были взяты описания маршрутов от филологического
факультета СПбГУ до 15-ти случайно выбранных точек на Васильевском
острове. Позже эти описания были подвергнуты языковой унификации.
Также материалом исследования выступали диалоги о маршрутах, взятые из
Национального корпуса русского языка [НКРЯ]. Помимо этого был проведен
опрос о маршрутах пути из точки А в точку В. В общей сложности было
получено 100 естественно-языковых описаний маршрутов, что является
достаточным для исследования языковых средств русского языка,
описывающих перемещения и изменения положения в пространстве.
Для написания данной работы применялись следующие методы
исследования. Для получения диалогов о маршрутах проводился опрос.
Кроме того был совершен документальный анализ, а именно: были
проанализированы диалоги о маршрутах из Национального корпуса русского
языка, а также описания маршрутов из Google Maps. При построении массива
данных был использован метод формализации. Основным методом данного
исследования является метод моделирования, использованный для
построения базы данных и алгоритмов вопросно-ответной системы и
автоматического пополнения базы данных. Кроме того в работе
используются и элементы сравнительного метода при сравнении описаний
маршрутов смоделированной вопросно-ответной системы и наиболее
популярных современных навигаторов.
В рамках данной работы был реализован прототип естественно-
языковой вопросно-ответной системы навигации в городской среде с
использованием ориентиров по ходу движения в описаниях маршрутов.
Диссертационная работа состоит из введения, основной части,
включающей две главы, заключения, списка литературы и 6-ти приложений.
Список литературы содержит 37 наименований, 12 из которых составляет
литература на иностранных языках, а 25 – на русском языке. Также в работе
имеется список использованных корпусов и источников примеров,
содержащий 6 наименований, 3 из которых являются корпусами и 3
источниками примеров. Общий объем работы – 93 страницы.
В ходе решения поставленных задач были достигнуты следующие
результаты. Были исследованы общие принципы работы и виды вопросно-
ответных систем. Также были исследованы языковые средства русского
языка для описания перемещения и изменения положения в пространстве,
что помогло в дальнейшем создать базу данных с описаниями возможных
вариантов перемещения из одной точки в другую и шаблоны вопросов и
ответов для вопросно-ответной системы. Был совершен поиск диалогов на
тему «Как пройти из точки А в точку В» в Национальном корпусе русского
языка [НКРЯ], в том числе для получения подобных диалогов был совершен
опрос. Было построено дерево возможных вариантов навигации по
Васильевскому острову на основании описаний маршрутов, взятых из Google
Maps [Google Maps]. На основании полученных диалогов в описания было
внесено речевое разнообразие. На основании дерева была построена база
данных, содержащая названия точек на местности и ориентиров, а также
описания возможных вариантов перемещения из этих точек. После чего были
написаны алгоритм вопросно-ответной системы навигации в городской среде
и алгоритм автоматического пополнения базы данных. Первый алгоритм был
протестирован на нескольких точках, что показало удобство его
использования, так как вместо описаний длины пути в метрах, как обычно
описывают маршруты современные навигаторы, он использует описания
ориентиров по ходу движения, что кажется более естественным и легко
воспринимаемым. Также в описаниях, получаемых при помощи алгоритма,
названия локаций и ориентиров используются в правильных падежах, что
также отличает данный алгоритм от популярных сейчас навигаторов,
которые используют названия локаций только в именительном падеже
независимо от того, какой предлог стоит перед ними. Кроме того в этих
описаниях присутствует разнообразие речи за счет того, что алгоритм
использует различные глаголы перемещения. Из всего этого можно сделать
вывод, что данный прототип вопросно-ответной системы навигации,
учитывая лингвистические компоненты, делает свои описания маршрутов
более естественными и удобными для использования. Также алгоритм
автоматического пополнения базы данных может по запросам пользователей
пополнять базу данных новыми точками и информацией о них для
дальнейшей работы с этими точками.
Результаты настоящего диссертационного исследования могут быть
полезны для дальнейшего развития естественно-языковых систем навигации.
Кроме того результаты данной работы могут быть применены на практике
при создании естественно-языкового навигатора.
В диссертационной работе не были реализованы некоторые
компоненты, полезные для развития естественно-языковых систем
навигации, но рассмотрение которых не входило в задачи данной работы. К
таким компонентам можно отнести, например, модуль изменения по падежам
для ориентиров по ходу движения. На данный момент алгоритм
автоматического пополнения базы данных может вносить в базу данных в
качестве ориентиров только количество перекрестков, номера домов, мосты
и дороги. Что касается названий известных зданий, магазинов, ресторанов и
т.д., их алгоритм не вносит в базу данных, так как не может изменять их по
падежам. Наличие модуля изменения по падежам решило бы эту проблему и
еще более разнообразило бы описания маршрутов, выдаваемые программой,
поэтому в перспективе необходимо реализовать такой модуль. Подобные
проблемы представляют собой поле для дальнейшей работы.
1. Агаев Н.З. Исследование и разработка методов реализации вопросно-
ответных систем / Н.З. Агаев // Курсовая робота. Московский
государственный университет им. М.В.Ломоносова. Факультет
Вычислительной математики и кибернетики. Кафедра системного
программирования. – Москва, 2012. – 35с.
2. Агаев Н.З. Исследование и разработка современных методов
реализации вопросно-ответных систем / Н.З. Агаев // Дипломная
робота. Московский государственный университет им.
М.В.Ломоносова. Факультет Вычислительной математики и
кибернетики. Кафедра системного программирования. – Москва, 2013. – 68с.
3. Апресян Ю.Д. Глаголы моментального действия и перформативы в
русском языке // Русистика сегодня. Язык: система и ее
функционирование. М., 1988. С. 57-78.
4. Апресян Ю.Д. Избранные труды. Том I. Лексическая семантика: 2-е
изд., испр. и доп. – М.: Школа «Языки русской культуры»,
Издательская фирма «Восточная литература» РАН, 1995. – VIII с., 472с.
5. Белнап Н., Стил С. Логика вопросов и ответов. – М: Прогресс, 1981. - 290с.
6. Бочкарева Т.А. Способы передачи глагольного действия в языках
разных типов: дис. на соискание ученой степени канд. филологических
наук: 10.02.19 / Бочкарева Татьяна Анатольевна. – Саратов, 1993. – 206с.
7. Булыгина Т.В. К построению типологии предикатов в русском языке //
Семантические типы предикатов. - М.: Наука, 1982. – С. 7-85.
8. Вригт Г.Х. фон. Модальная логика местоположения / Логический
анализ языка. Языки пространств / Отв. ред.: Н.Д. Арутюнова, И.Б.
Левонтина. – М.: Языки русской культуры, 2000. С. 7-15.
9. Всеволодова М.В., Владимирский Е. Ю. Способы выражения
пространственных отношений в современном русском языке. М., 1982. – 288с.
10. Галкин Д.В., Кондрушина Е.В., Шиляев К.С. Возможности систем
генерации речи для обработки естественного языка и развития
взаимодействия «человек – машина» // Гуманитарная информатика. No7
/ 2013. С. 56-65.
11. Житко, В.А. Семантическая технология компонентного
проектирования естественно-языкового интерфейса вопросно-ответных
систем / В.Н. Вяльцев, Ю.С. Гецевич, В.А. Житко, А.А. Кузьмин //
Открытые семантические технологии проектирования
интеллектуальных систем OSTIS-2011 : материалы Междунар. научн.-
техн. конф., Минск, 10–12 февраля 2011 г. / редкол. : В.В. Голенков
(отв. ред.) [и др.]. – Минск : БГУИР, 2011. – С. 395–408.
12. Зализняк Анна А. Преодоление пространства в русской языковой
картине мира: глагол добираться / Логический анализ языка. Языки
пространств / Отв. ред.: Н.Д. Арутюнова, И.Б. Левонтина. – М.: Языки
русской культуры, 2000. С. 30-37.
13. Засухина Т.П. Пространственная семантика предлогов, приставок и
падежей в современном русском языке // Автореф. дис. на соискание
ученой степени канд. филологических наук: 10.02.01 / Засухина Тамара
Петровна. – Екатеринбург, 1992. – 17с.
14. Кибрик А.Е. К типологии пространственных значений // Язык и
человек. - М., 1970. С. 110-156.
15. Кустова Г.И. Тип концептуализации пространства и семантические
свойства глагола (группа попасть) / Логический анализ языка. Языки
пространств / Отв. ред.: Н.Д. Арутюнова, И.Б. Левонтина. – М.: Языки
русской культуры, 2000. С. 47-55.
...