Введение 3
1 Методы моделирования композиции в семантических формализмах 6
2 Расширения композиционального аппарата 9
2.1 Расширения для унификационных формализмов 9
2.2 Расширения для систем с теоретико-типовым контролем композиции 11
Заключение 15
Приложение А. Основные определения 16
A.1 Типизированные структуры признаков 16
A.2 Гибридная логика 17
A.3 Зависимое произведение (П-тип) 18
A.4 Векторное расслоение 19
Список литературы
Данная работа посвящена поиску путей совмещения формальных (символьных, композиционных) подходов в лексической семантике и семантике предложения [Carpenter,1992; Montague,1975;Pustejovsky,1991; Ranta, 1994]и дистрибутивных (квантитативных, векторных, некомпозиционных) подходов в лексической семантике [Landauer, Dumais,1997; Lenci,2008]. Оба эти направления имеют длительную историю развития и занимают заметное положение среди различных концепций лингвистической семантики, а в ряде прикладных областей (обработка естественного языка, извлечение знаний, информационный поиск, семантико-синтаксические анализаторы и др.) играют ключевую роль [Blackburn, Bos,2005; Manning, Raghavan, Schutze, 2008]. Методы и теоретические предпосылки этих направлений существенно различны, что делает затруднительным их объединение в рамках единой семантической модели. Тем не менее, потребность в таком объединении неоднократно подчеркивалась [Baroni, Bernardi, Zamparelli,2014; Coecke, Sadrzadeh, Clark, 2010; Mitchell, Lapata, 2010; Widdows, 2008]. В то время как формальная семантика, руководствуясь принципом композициональности [Partee,1984], смогла предложить анализ большого числа нетривиальных лингвистических явлений, охват языкового материала в рамках этого подхода оказывается скромным, так как предполагает осуществление анализа и формализации языковых явлений вручную. Кроме того, в большинстве случаев значения слов трактуются в качестве примитивов. В свою очередь, дистрибутивные модели, строящиеся на основе обработки больших массивов текстов и позволяющие определить понятие семантической близости между отдельными словами, представляются в достаточной мере эмпирически обоснованными, однако при этом значительно менее выразительными. В частности, они оказываются нечувствительны ко многим аспектам лексической семантики (полисемия, фразеология, метафорические и метонимические переносы) и не допускают распространения на уровень предложения. Предположительно, совмещение сильных сторон формальной и дистрибутивной семантики может позволить преодолеть эти ограничения. Задача реализации композициональных дистрибутивных семантических моделей в последние годы приобрела приоритетный характер в рамках прикладной лингвистики.
Практика реализации дистрибутивных (векторных) семантических моделей претерпела за последние несколько лет значительные изменения. В ранних подходах, таких как латентный семантический анализ [Landauer, Dumais,1997], компоненты векторных репрезентаций отдельных слов строились на основе непосредственного подсчета совместной встречаемости в контекстном окне фиксированного размера, возможно, с последующей обработкой полученной разреженной матрицы с целью понижения размерности. Это приводило к построению векторов с большим числом компонентов, каждый из которых тем не менее мог быть про-интерпретирован (либо как встречаемость некоторой словоформы в общих контекстах, либо как коэффициент при «латентном» семантическом признаке). В работе [Mikolov (et al.),2013] была впервые применена техника аппроксимации компонентов векторов средствами машинного обучения, что позволило достигать сопоставимого качества моделей при значительном уменьшении размерности и снижении вычислительных затрат на их построение. При этом отдельные компоненты векторов оказывается невозможным интерпретировать непосредственно.
Проблема реализации композициональных механизмов в рамках дистрибутивной семантики была поставлена в работах [Coecke, Sadrzadeh, Clark,2010; Mitchell, Lapata, 2010; Widdows, 2008]. Среди предлагавшихся методов реализации композиции в дистрибутивных моделях можно назвать методы на основе «смешивания векторов» (vector mixture), т.е. аддитивные и мультипликативные способы композиции [Mitchell, Lapata,2010], методы на основе тензорных операций (тензорного умножения, свертки и т. п.) [Smolensky,1990; Widdows, 2008], линейных отображений [Baroni, Bernardi, Zamparelli,2014; Coecke, Sadrzadeh, Clark, 2010], декомпозиции тензоров [Van de Cruys, Poibeau, Korhonen, 2013], композиции на основе проекций [Tsubaki (et al.), 2013], методы реализации репрезентаций слов в искусственных нейронных сетях с одновременной обработкой композиции [Pennington, Socher, Manning, 2014; Socher (et al.),2013] и другие. Несмотря на множество известных подходов, задача реализации композициональных дистрибутивных моделей ещё далека от окончательного решения. Простые методы композиции на основе сложения и умножения векторов не способны учитывать синтаксическую структуру языковых конструкций, более сложные подходы оказываются крайне неэффективными с вычислительной точки зрения. Этим определяется актуальность рассматриваемой темы.
Обращаясь к данной проблеме, мы выбираем формальный подход. Выбор основан на уверенности в том, что для убедительной реализации композициональных механизмов в семантике следует прежде всего изучить природу композиции. Ключом к пониманию могут служить многочисленные случаи нарушения композициональности в естественном языке, анализ которых должен позволить установить область применимости принципа композициональности в семантических моделях.
Цель данного исследования состоит в разработке методов построения композициональных семантических моделей, совмещающих векторные репрезентации с формальными механизмами композиции. Достижение этой цели требует решения следующих задач. Во-первых, в связи с необходимостью учета языковых явлений, анализ которых в рамках традиционных моделей затруднен, исследуются возможности построения механизмов контроля композиции. В представленных работах мы рассматриваем два возможных пути - на основе унификации с контролем равенства и на основе функционального применения с внешним контролем, осуществляемым с помощью некоторой дедуктивной системы. Во-вторых, требуется предложить
способы повышения выразительности известных в настоящее время композициональных семантических моделей, в т. ч. дистрибутивных. Отталкиваясь от вычислительной характеристики композиции в формальной семантике, основанной на соответствии Карри-Ховарда и позволяющей соотнести процедуры конструирования семантических представлений с некоторым логическим исчислением, предлагаются модификации, способные отразить такие явления, как логическая полисемия и изменение значения под влиянием контекста.
Теоретическая значимость работы связана с тем, что предлагаемые обобщения механизмов композиции позволяют сопоставить квантитативные и формальные методы в лексической семантике и семантике предложения и выявить пути их совмещения в рамках гибридной модели. Практическая значимость определяется тем фактом, что описанные методы позволяют добиться большей выразительности семантических моделей, в том числе основанных на обработке корпусных данных, что ведет к повышению их эмпирической обоснованности. Возможности практического применения рассматриваемых моделей связаны с разработкой систем семантического анализа текстовых фрагментов, играющих ключевую роль при решении таких задач, как голосовое управление оборудованием, обработка больших объемов однотипных запросов при автоматизации контактных центров и служб технической поддержки, оценка семантической близости, логический вывод на основе текста и др.
Основные положения и результаты работы представлены в следующих публикациях:
— Соколов К. В. Формализация локальных свойств в структурах типизированных признаков // Материалы XLIII Международной филологической конференции. Секция прикладной и математической лингвистики. - Филологический факультет СПбГУ - 2014.
— Sokolov K., Timofeev D., Samochadin A. Process Extraction from Texts using Semantic Unification // Proceedings of the 7th International Joint Conference on Knowledge Discovery, Knowledge Engineering and Knowledge Management (IC3K 2015) - Vol. 3: KMIS - 2015.
— Sokolov K. A Vector Model for Dependent Type Semantics // Proceedings of the First Workshop on Representation Learning for NLP (ACL-2016 Workshop), to appear.
В данной работе описан подход к построению композициональных семантических моделей, совмещающих векторные репрезентации с теоретико-типовым механизмом контроля композиции. Предпринятый анализ методов моделирования композиции в формальных семантических моделях позволил определить два возможных пути их расширения. Первый основан на трансляции семантического представления в логическое выражение и оценке его выполнимости в модели. Этот способ позволяет учесть прагматические факторы и был опробован в прикладной задаче голосового управления оборудованием. Он также допускает расширение за счет рассмотрения композиции как непротиворечивого согласования фрагментов семантического описания, ассоциированных с различными контекстами. Второй опирается на метод контроля композиции, реализуемый средствами дедуктивной системы. Для этой цели был использован фрагмент интуиционистской теории типов, включающий зависимое произведение. Использование данного формализма позволило добиться учета таких языковых явлений, как логическая полисемия и контекстная адаптация значений. Ближайшие задачи, связанные с развитием этого подхода, включают строгое формальное обоснование, разработку методов обучения модели и её оценку, в первую очередь в задаче оценки семантической близости.
1. Борщев В. Б. Окрестностная модель языка - логика и/или топология (история одной идеи Ю. А. Шрейдера). // Системы и модели: границы интерпретаций : сборник трудов Всероссийской научной конференции с международным участием. Москва - Томск, 5-7 ноября 2008 г. — 2008. — С. 9—18.
2. Даммит М. Что такое теория значения // Философия, логика, язык. М.: Прогресс. — 1987. — С. 127—212.
3. Лапшин В. А. Языки синтаксических диаграмм. Окрестностные грамматики и их топологические интерпретации. // Рукопись. РГГУ. М. — 2008.
4. Мищенко А. С. Векторные расслоения и их применения. — М.: Наука, 1984.
5. Abramsky S., Sadrzadeh M. Semantic unification // Categories and Types in Logic, Lan¬guage, and Physics. — Springer, 2014. — Pp. 1-13.
6. Asher N. Lexical meaning in context: A web of words. — Cambridge University Press,
2011.
7. Asher N., Pustejovsky J. A type composition logic for generative lexicon. // Journal of Cognitive Science. — 2006. — Vol. 6. — Pp. 1-38.
8. Baldridge J., Kruijff G.-J. M. Coupling CCG and hybrid logic dependency semantics // Proceedings of the 40th Annual Meeting of Association for Computational Linguistics. — Association for Computational Linguistics. 2002. — Pp. 319-326.
9. Baroni M., Bernardi R., Zamparelli R. Frege in space: A program of compositional distri¬butional semantics // Linguistic Issues in Language Technology. — 2014. — Vol. 9. — Pp. 5-110.
10. Bekki D., Asher N. Logical polysemy and subtyping // New Frontiers in Artificial Intelli¬gence. — Springer, 2012. — Pp. 17-24.
11. Blackburn P. Modal logic and attribute value structures // Diamonds and Defaults. — Springer, 1993. — Pp. 19-65.
12. Blackburn P., Bos J. Representation and inference for natural language //A first course in computational semantics. CSLI. — 2005.
13. Carpenter B. The logic of typed feature structures with applications to unification-based grammars, logic programming and constraint resolution. // Cambridge Tracts in Theoretical Computer Science. — 1992. — Vol. 32.
14. Coecke B., Sadrzadeh M., Clark S. Mathematical foundations for distributed compositional model of meaning. // Linguistic Analysis. — 2010. — Vol. 36. — Pp. 345-384.
15. Cooper R. Records and record types in semantic theory. // Journal of Logic and Computa¬tion. — 2005. — Vol. 15, no. 2. — Pp. 99-112.
16. Copestake A. Appendix: Definitions of typed feature structures. // Natural Language En¬gineering. — 2000. — Vol. 6, no. 01. — Pp. 109-112.
17. Copestake A. Implementing typed feature structure grammars. Vol. 110. — CSLI publica¬tions Stanford, 2002.
18. Copestake A. [et al.] Minimal recursion semantics: An introduction // Research on Language and Computation. — 2005. — Vol. 3, no. 2-3. — Pp. 281-332.
19. Dalrymple M. Semantics and syntax in Lexical Functional Grammar: The resource logic approach. — MIT Press, 1999.
20. Dalrymple M. Lexical-Functional Grammar. — 2001.
21. Dalrymple M., Lamping J., Saraswat V. LFG semantics via constraints // Proceedings of the sixth conference on European chapter of the Association for Computational Linguistics. — Association for Computational Linguistics. 1993. — Pp. 97-105.
22. Doran C. [et al.] XTAG system: A wide coverage grammar for English // Proceedings of the 15th conference on Computational linguistics-Volume 2. — Association for Computational Linguistics. 1994. — Pp. 922-928.
23. Egg M., Koller A., Niehren J. The constraint language for lambda structures // Journal of Logic, Language and Information. — 2001. — Vol. 10, no. 4. — Pp. 457-485.
24. Franceschet M., de Rijke M. Model checking hybrid logics (with an application to semistruc¬tured data) // Journal of Applied Logic. — 2006. — Vol. 4, no. 3. — Pp. 279-304.
25. Francez N., Wintner S. Unification grammars. — Cambridge University Press, 2011.
26. Gazdar G. [et al.] Category structures // Computational Linguistics. — 1988. —Vol. 14, no. 1. — Pp. 1-19.
27. Goguen J. What is unification // Resolution of Equations in Algebraic Structures. — 1989. — Vol. 1, no. 5. — Pp. 217-261.
28. Groenendijk J., Stokhof M. Dynamic predicate logic // Linguistics and philosophy. — 1991. — Vol. 14, no. 1. — Pp. 39-100.
29. Hintikka J. Quantisers vs. quantification theory // Dialectica. — 1973. — Vol. 27, no. 3¬
4. — Pp. 329-358.
30. Hodges W. Compositionality is not the problem // Logic and Logical Philosophy. — 2004. — Vol. 6. — Pp. 7-33.
31. Hofmann M. Syntax and semantics of dependent types // Extensional Constructs in Inten- sional Type Theory. — Springer, 1997. — Pp. 13-54.
32. Howard W. The formulas-as-types notion of construction //To H.B. Curry: Essays in Combinatory Logic, Lambda-Calculus, and Formalism. — Academic Press, 1980. — С. 479— 490.
33. Janssen T. M. Compositionality. — 1996.
34. Johnson M. Attribute-value logic and the theory of grammar. Vol. 16. — Center for the Study of Language, Information, 1988.
35. Johnson M. Features and formulae. // Computational Linguistics. — 1991. — Vol. 17, no. 2. — Pp. 131-151.
36. Kaplan R. M., Bresnan J. Lexical-functional grammar: A formal system for grammatical representation // Formal Issues in Lexical-Functional Grammar. — 1982. — Pp. 29-130.
37. Kasper R. T., Rounds W. C. A logical semantics for feature structures // Proceedings of the 24th annual meeting on Association for Computational Linguistics. — Association for Computational Linguistics. 1986. — Pp. 257-266.
38. King P. J. A logical formalism for head-driven phrase structure grammar: PhD thesis / King Paul John. — University of Manchester, 1989.
39. King P. J. An expanded logical formalism for head-driven phrase structure grammar. Vol.
59. — 1994.
40. Lahav R. Against compositionality: the case of adjectives // Philosophical studies. — 1989. — Vol. 57, no. 3. — Pp. 261-279.
41. Lambek J. Type grammars as pregroups // Grammars. — 2001. — Vol. 4, no. 1. — Pp. 21¬39.
42. Landauer T. K., Dumais S. T. A solution to Plato’s problem: The latent semantic anal¬ysis theory of acquisition, induction, and representation of knowledge. // Psychological review. — 1997. — Vol. 104, no. 2. — Pp. 211-240.
43. Lenci A. Distributional semantics in linguistic and cognitive research // Italian journal of linguistics. — 2008. — Vol. 20, no. 1. — Pp. 1-31.
44. Liang P., Potts C. Bringing machine learning and compositional semantics together // Annu. Rev. Linguist. — 2015. — Vol. 1, no. 1. — Pp. 355-376.
45. Luo Z. Formal semantics in modern type theories with coercive subtyping. // Linguistics and Philosophy. — 2012. — Vol. 35, no. 6. — Pp. 491-513.
46. Manning C. D., Raghavan P., Schutze H. Introduction to information retrieval. Vol. 1. — Cambridge University Press, 2008.
47. Mikolov T. [et al.] Distributed representations of words and phrases and their composition¬ality // Advances in neural information processing systems. — 2013. — Pp. 3111-3119.
48. Mitchell J., Lapata M. Composition in distributional models of semantics // Cognitive science. — 2010. — Vol. 34, no. 8. — Pp. 1388-1429.
49. Montague R. Formal philosophy. — 1975.
50. Partee B. Compositionality // Varieties of formal semantics. — 1984. — Vol. 3. — Pp. 281¬311.
51. Pennington J., Socher R., Manning C. D. GloVe: Global vectors for word representation // Empirical Methods in Natural Language Processing (EMNLP). — 2014. — Pp. 1532-1543.
52. Pollard C., Sag I. Information-based syntax and semantics, vol. 1. — 1987.
53. Pollard C., Sag I. Head-driven phrase structure grammar // Center for the Study of Lan¬guage and Information, Stanford, USA. — 1994.
54. Prosorov O. Compositionality and contextuality as adjoint principles // The composition¬ality of meaning and content. — 2005. — Vol. 2. — Pp. 149-174.
55. Pustejovsky J. The generative lexicon // Computational linguistics. — 1991. — Vol. 17, no. 4. — Pp. 409-441.
56. Pustejovsky J. The generative lexicon. — Cambridge MA: MIT Press, 1995.
57. Pustejovsky J. Type theory and lexical decomposition // Advances in generative lexicon theory. — Springer, 2013. — Pp. 9-38.
58. Ranta A. Type-theoretical grammar. — 1994.
59. Richter F. A mathematical formalism for linguistic theories with an application in Head- Driven Phrase Structure Grammar: PhD thesis / Richter Frank. — Universitat Tubingen, 2000.
60. Shieber S. M. An introduction to unification-based approaches to grammar. — 1986.
61. Smolensky P. Tensor product variable binding and the representation of symbolic structures in connectionist systems // Artificial intelligence. — 1990. — Vol. 46, no. 1. — Pp. 159¬216.
62. Socher R. [et al.] Recursive deep models for semantic compositionality over a sentiment tree¬bank // Proceedings of the conference on empirical methods in natural language processing (EMNLP). — 2013. — Pp. 1631-1642.
63. Szabo Z. G. Compositionality // The Stanford Encyclopedia of Philosophy. — 2013.
64. Tsubaki M. [et al.] Modeling and learning semantic co-compositionality through prototype projections and neural networks. // Proceedings of the conference on empirical methods in natural language processing (EMNLP). — 2013. — Pp. 130-140.
65. Van de Cruys T., Poibeau T., Korhonen A. A tensor-based factorization model of seman¬tic compositionality // Conference of the North American Chapter of the Association of Computational Linguistics (HTL-NAACL). — 2013. — Pp. 1142-1151.
66. Widdows D. Semantic vector products: Some initial investigations // Second AAAI Sym¬posium on Quantum Interaction. Vol. 26. — 2008.
67. Zettlemoyer L. S., Collins M. Learning to map sentences to logical form: Structured classi¬fication with probabilistic categorial grammars // arXiv preprint arXiv:1207.1420. — 2012.