Тип работы:
Предмет:
Язык работы:


МЕТОДИКА ИЗВЛЕЧЕНИЯ КАНДИДАТОВ ДЛЯ МНОГОЯЗЫЧНОГО (АНГЛО-ФРАНКО-РУССКОГО) ТЕРМИНОЛОГИЧЕСКОГО СЛОВАРЯ

Работа №72646

Тип работы

Дипломные работы, ВКР

Предмет

лингвистика

Объем работы124
Год сдачи2016
Стоимость4275 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
251
Не подходит работа?

Узнай цену на написание


Введение 5
Глава 1. Выделение терминов и терминологических словосочетаний в параллельных корпусах текстов 8
1.1. Понятие термина и кандидата в термины 8
1.2. Термин в переводном многоязычном словаре 9
1.3. Методы выделения терминов-кандидатов в корпусах текстов 11
1.3.1. Методы выделения однословных терминов-кандидатов в корпусах
текстов 11
1.3.2. Методы выделения терминологических словосочетаний в корпусах
текстов 12
1.3.2.1. Статистический метод 12
1.3.2.2. Лингвистический метод 13
1.3.2.3. Смешанный метод 14
1.4. Алгоритмы выделения терминов-кандидатов на базе многоязычных
параллельных корпусах текстов 16
1.5. Многоязычные терминологические базы данных 18
1.6. Выводы 21
Глава 2. Методика извлечения терминов-кандидатов для многоязычного терминологического словаря 23
2.1. Методы исследования 23
2.2. Морфосинтаксические шаблоны 23
2.2.1. Анализ морфосинтаксических шаблонов на основе переводных
словарей 24
2.2.2. Анализ переводных соответствий между морфосинтаксическими
шаблонами 30
2.2.3. Итоговый набор морфосинтаксических шаблонов и их переводных
соответствий 33
2.3. Инструменты исследования 35
2.4. Алгоритм выделения переводных терминов-кандидатов из
многоязычного (англо-франко-русского) корпуса текстов 36
2.5. Выводы 38
Глава 3. Эксперимент. Выделение переводных терминов-кандидатов из англо- франко-русского корпуса текстов международных документов 39
3.1. Выделение однословных терминов-кандидатов 39
3.2. Выделение терминологических биграмм 40
3.3. Анализ и оценка работы алгоритма 44
3.3.1. Анализ результатов эксперимента (выделение однословных
терминов-кандидатов) 46
3.3.2. Анализ результатов эксперимента (выделение биграмм) 48
3.4. Выводы 53
Заключение 54
Список литературы 57
Приложения 64
Приложение 1. Релевантные переводные однословные термины-кандидаты для англо-франко-русского терминологического словаря 64
Приложение 2. Релевантные переводные терминологические биграммы для англо-франко-русского терминологического словаря 75
Приложение 3. Нерелевантные однословные переводные эквиваленты 104
Приложение 4. Нерелевантные переводные биграммы 106


Извлечение терминологии является важной задачей современных корпусных исследований. С развитием науки и техники терминосистемы различных отраслей знаний меняются, тогда как существующие лексикографические источники - терминологические словари, терминологические банки и базы данных, терминологические стандарты - не всегда своевременно отражают информацию о новых терминах и обозначаемых ими понятиях. В связи с постоянным изменением терминосистем различных предметных областей возникает потребность в разработке и совершенствовании методов выделения современной терминологии, необходимых для решения задач в области терминоведения, общей и прикладной лексикографии, информационного поиска и машинного перевода [5, с. 40]. Немаловажную роль в современном многоязычном мире играет перевод научно-технической литературы: ведутся многочисленные исследования по разработке эффективных методов извлечения переводной терминологии и создания многоязычных переводных терминологических словарей [10; 11; 17; 23; 28; 32; 36; 39; 42; 51; 65].
В многоязычной лексикографии широкое применение находят параллельные корпусы текстов - совокупности документов, переведённых на два или несколько языков и выровненных на уровне слов и предложений. Многоязычные параллельные корпусы используются, в основном, в задачах перевода и переводных исследованиях [33, р. 4]: для автоматического создания переводных словарей, выделения терминов для многоязычных терминологических баз данных, уточнения значений слов и словосочетаний определённой предметной области, верификации значений терминов и терминологических словосочетаний, уже зафиксированных в двуязычных и многоязычных словарях, и оценки адекватности перевода [6, с. 55]. Кроме того, параллельные корпусы текстов широко используются для обучения систем машинного перевода, проверки качества машинного перевода, тестирования и оценки качества выравнивания на уровне предложений (слов, словосочетаний), а также для обучения и тестирования программ по извлечению многоязычной информации и многоязычных классификаторов предметных областей [63].
Благодаря корпусным исследованиям были разработаны и усовершенствованы программные средства для профессиональных переводчиков и пользователей систем машинного перевода [42]. Ярким примером прогресса в области корпусных исследований в лексикографии вообще и переводной лексикографии в частности является корпусный менеджер SketchEngine (www.sketchengine.co.uk). На данный момент в этой системе разработаны специальные модули для работы с параллельными корпусами текстов, а также
переводными терминами и терминологическими словосочетаниями (модули Bilingual terminology extraction и Bilingual Wordsketches) [51].
Таким образом, проблема, рассматриваемая в данной работе, является многосторонней и включает в себя такие аспекты, как использование многоязычных параллельных корпусов текстов в исследованиях по терминологии, создание многоязычных терминологических ресурсов (переводных терминологический словарей, многоязычных терминологических банков, баз данных), оценка переводной терминологии, методы выделения терминов в многоязычных корпусах текстов, современные инструменты для работы с многоязычными корпусами текстов и переводной терминологией.
Целью данного исследования является разработка методики выделения кандидатов (терминов и терминологических словосочетаний) для многоязычного (англо-франко-русского) терминологического словаря на основе многоязычного параллельного корпуса текстов.
Для достижения поставленной цели было необходимо решить следующие теоретические и практические задачи:
1. Описать понятие термина-кандидата для переводного терминологического словаря;
2. Описать методы и алгоритмы извлечения переводных терминов-кандидатов из многоязычных параллельных корпусов текстов;
3. Выявить особенности построения терминов и терминологических словосочетаний и их переводных эквивалентов в английском, русском и французском языках (на примере гуманитарной области знаний);
4. Разработать алгоритм выделения терминов-кандидатов и их переводных эквивалентов из многоязычного параллельного корпуса текстов;
5. Проверить работу данного алгоритма на основе англо-франко-русского корпуса международных юридических текстов и оценить его эффективность.
Объектом исследования являются термины и терминологические словосочетания в многоязычных специальных корпусах текстов. Предмет исследования - переводные термины-кандидаты для многоязычного терминологического словаря. В данной работе используются такие методы, как статистический, лексикографический, сопоставительный анализ и эксперимент. Материалом исследования является параллельный англо-франко-русский корпус международных юридических текстов объёмом 412 000 словоупотреблений.
Теоретическая значимость работы определяется разработкой методики выделения переводных терминов-кандидатов на базе многоязычного параллельного корпуса текстов, сочетающей использование морфосинтаксических шаблонов и статистических метрик. Практическая значимость данного исследования заключается в том, что полученные результаты могут использоваться для создания переводных терминологический словарей, расширения существующих многоязычных терминологических ресурсов, а также для создания лингвистических баз данных для систем машинного перевода.
Данная работа состоит из введения, трёх глав, заключения, списка литературы из 65 названий и четырёх приложений. В первой главе рассматриваются теоретические вопросы, связанные с выделением терминов и терминологических словосочетаний в параллельных корпусах текстов. Вторая глава посвящена описанию методики извлечения терминов-кандидатов для многоязычного терминологического словаря. В третьей главе описан эксперимент по извлечению переводных терминов-кандидатов из англо-франко-русского корпуса международных текстов и представлен анализ алгоритма выделения кандидатов в термины, разработанного в рамках данного исследования, и оценка полученных результатов.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Одной из важных задач современных корпусных исследований является извлечение переводной терминологии. Многоязычный параллельный корпус текстов даёт возможность извлекать переводные термины и терминологические словосочетания и тем самым может служить основой для создания и расширения переводных терминологических словарей различных отраслей знаний, а также повышения качества и эффективности машинного перевода.
Извлечение терминологии из корпусов текстов осуществляется с помощью статистического, лингвистического и смешанного методов, описанных в теоретической части данного исследования. Для выделения переводных терминов-кандидатов из многоязычных параллельных корпусов текстов чаще всего используется алгоритм extract-then-align («выделение-выравнивание»), состоящий из двух основных этапов - непосредственно выделение кандидатов в термины в корпусе текстов и установление переводных соответствий между выделенными словами и словосочетаниями.
В ходе данного исследования была разработана методика выделения терминов-кандидатов для англо-франко-русского терминологического словаря на базе параллельного корпуса текстов. В основе методики лежит смешанный подход для извлечения терминологии, который сочетает в себе использование морфосинтаксических шаблонов и статистических мер для определения статистической значимости кандидатов в термины. Анализ морфосинтаксических шаблонов на примере переводных терминологических словарей позволил определить наиболее частотные шаблоны терминов гуманитарной области знаний для английского, французского и русского языков, а также наиболее характерные переводные соответствия между терминами и терминологическими словосочетаниями данных языков. Однословные термины и терминологические биграммы являются наиболее частотными терминологическими конструкциями для английского, французского и русского языков, поэтому алгоритм, разработанный в рамках данного исследования, использовался для выделения именно этих типов терминов.
Экспериментальная часть данной работы была направлена на извлечение переводных терминов-кандидатов из англо-франко-русского параллельного корпуса международных юридических текстов. Однословные термины и терминологические биграммы выделялись в соответствии с наиболее частотными морфосинтаксическими шаблонами терминов, а их статистическая значимость оценивалась с помощью простой частоты встречаемости (для однословных терминов) и статистической меры log-likelihood (для терминологических биграмм). Статистически значимые кандидаты определялись на основании порога статистической значимости, а переводные соответствия между ними устанавливались посредством метода опорного языка. В результате работы алгоритма было выделено 484 однословных переводных кандидата в термины и 224 переводных терминологических словосочетания. Созданный нами параллельный корпус текстов имеет самостоятельную ценность и может быть использован в других исследованиях.
Оценка релевантности выделенных терминов-кандидатов осуществлялась на основе формальных критериев - наличия или отсутствия данного слова или словосочетания в переводных и одноязычных терминологических словарях и многоязычных терминологических базах данных. Международные юридические тексты характеризуются широкой тематической направленностью и терминологической неоднородностью, поэтому для оценки релевантности терминов-кандидатов использовались терминологические словари разных предметных отраслей.
Согласно результатам эксперимента, точность данного алгоритма для выделения однословных терминов-кандидатов составляет 86%, для выделения терминологических биграмм - 60%. Такие показатели точности являются оптимальными для лексикографических задач. Анализ эффективности алгоритма проводился на основании формальных критериев, поэтому для более точной оценки релевантности выделенных переводных терминов-кандидатов требуется участие специалистов данной предметной области и профессиональных переводчиков. Достоверность полученных результатов обеспечивается представительностью корпуса текстов и большим числом использованных лексикографических ресурсов.
Представленная методика, с одной стороны, базируется на обширном анализе научной литературы по данной теме; с другой стороны, полученные результаты хорошо коррелируют с результатами других исследований.
Достоинства разработанного алгоритма заключаются в том, что он позволяет выделять термины-кандидаты, не зафиксированные в существующих переводных терминологических словарях, варианты терминов, а также редкие термины и терминологические словосочетания. Стоит отметить, что описанная методика и алгоритм отличаются простотой реализации, носят достаточно универсальный характер и могут быть использованы для выделения терминов-кандидатов различных предметных областей. При оценке алгоритма необходимо учитывать, что на качество его работы влияет не только собственно методика, но и качество выравнивания на уровне слов, качество морфологической разметки и выбор статистической меры для оценки статистической значимости кандидатов в термины.
Практическая значимость данного исследования заключается в том, что выделенные переводные кандидаты в термины могут использоваться для создания переводных терминологических словарей, расширения существующих многоязычных терминологических ресурсов (терминологических банков, баз данных), а также для создания лингвистических баз данных для систем машинного перевода и других приложений.



1. Англо-русский экономический словарь. - ABBYY, 2001. - [Электронный
ресурс]. URL:
http://www.lingvo.ua/ru/LingvoDictionaries/Details?dictionary=LingvoEconomics+(En-Ru)(дата обращения: 16.05.2016).
2. Андрианов С.Н., Никифоров А.С., Берсон А.С. Англо-русский юридический словарь. - М.: ABBYY Press, 2009. - 568 с.
3. Анисимова А.Г. К вопросу о переводе терминов гуманитарных наук // Язык, сознание, коммуникация: Сб. статей / Отв. ред. В.В. Красных, А.И. Изотов. - М.: МАКС Пресс, 2002. - Вып. 21. - 184 с.
4. Ахманова О.С., Минаева Л.В. О предмете и метаязыке учебной лексикографии // Словари и лингвострановедение. - М.: Русский язык, 1982. - С. 5-11.
5. Беляева Л.Н. Автоматизированная лексикография: гуманитарные
технологии. - СПб.: Изд-во РГПУ им. А.И. Герцена, 2011. - 75 с.
6. Беляева Л.Н. Лексикографический потенциал параллельного корпуса текстов // Труды международной конференции «Корпусная лингвистика - 2004». - СПб., 2004. - С. 55-64.
7. Беляева Л.Н. Параллельный корпус текстов в задачах лексикографического
анализа // Труды международной научной конференции «Корпусная лингвистика - 2013». - СПб., 2013. - [Электронный ресурс]. URL:
http://corpora.phil.spbu.ru/Works2013/Беляева.pdf (дата обращения:
16.05.2016).
8. Бенжамен Г., Пике М. Экономический и коммерческий словарь. Англо- франко-русский словарь. - М.: Международные отношения, 1993. - 448 с.
9. Большакова Е.И., Васильева Н.Э., Морозов С.С. Лексико-синтаксические шаблоны для автоматического анализа научно-технических текстов // Десятая Национальная конференция по искусственному интеллекту с международным участием КИИ-2006: Труды конференции в 3-х томах. Т. 2. - М.: Физматлит, 2006. - С. 506-524.
10. Браславский П., Соколов Е. Сравнение четырех методов автоматического извлечения двухсловных терминов из текста // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог-2006».- М.: РГГУ, 2006. - С. 88-94. - [Электронный ресурс]. URL: http: //www.dialog-21.ru/digests/ dialog2006/materials/html/Braslavski.htm (дата обращения: 16.05.2016).
11. Браславский, П., Соколов, Е. Сравнение пяти методов извлечения терминов
произвольной длины // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции
«Диалог 2008». - М.: РГГУ, 2008. - С. 67-74.
12. Васильева Н. Э. Шаблоны употреблений терминов и их использование при автоматической обработке научно-технических текстов // Компьютерная лингвистика и интеллектуальные технологии: Труды международной конференции «Диалог-2004». — М.: РГГУ, 2004. — С. 96-101.
13. Вдовина О. А. Языковая специфика научного текста по международным отношениям // Вестник МГИМО, 2010. - №5. - С.235-245.
14. Герд А.С. Введение в изучение языков для специальных целей: Учеб. пособие.
- СПб.: Филологический факультет СПбГУ, 2011. - 60 с.
15. Гринев C. B. Введение в терминоведение. - М.: Московский лицей, 1993. - 309 с.
16. Гринев-Гриневич, С.В. Терминоведение: Учеб. пособие. - М.: Академия, 2008.
- 303 с.
17. Ефремова Н.Э., Большакова Е.И., Носков А.А., Антонов В.Ю. Терминологический анализ текста на основе лексико-синтаксических шаблонов // Компьютерная лингвистика и интеллектуальные технологии: По материалам ежегодной Международной конференции «Диалог 2010». - М.: РГГУ, 2010. - С. 124-129.
18. Лантюхова Н.Н., Загоровская О.В., Литвинова Т.А. Термин: определение понятия и его сущностные признаки // Вестник ВИ ГПС МЧС России, 2013. - №1 (6). - С. 42-45.
19. Лейчик В.М. Терминоведение: предмет, методы, структура. - М.: Изд-во ЛКИ, 2007. - 256 с.
20. Лексикография русского языка: учебник для высших учебных заведений Российской Федерации / А. С. Герд, Л. А. Ивашко, И. С. Лутовинова и др.; под ред. Д. М. Поцепни / Учебно-методический комплекс по курсу «Лексикография русского языка». - СПб.: Филологический факультет СПбГУ,
2013. - 704 с.
21. Мачковский Г.И. Французско-русский юридический словарь. - М.: ABBYY Press, 2009. - 551 с.
22. Митрофанова О.А., Захаров В.П. Автоматизированный анализ терминологии
в русскоязычном корпусе текстов по корпусной лингвистике // Компьютерная лингвистика и интеллектуальные технологии: По
материалам ежегодной Международной конференции «Диалог 2009». - М.: РГГУ, 2009. - С. 321-328. - [Электронный ресурс]. URL: http://www.dialog- 21.ru/dialog2009/materials/pdf/49.pdf(дата обращения: 16.05.2016).
23. Морозова Ю.И. Извлечение переводных соответствий из корпуса
параллельных текстов с использованием методов дистрибутивной семантики // Труды международной научной конференции «Корпусная лингвистика - 2013». - СПб., 2013. - [Электронный ресурс]. URL:
http://corpora.phil.spbu.ru/Works2013/Морозова.pdf (дата обращения: 16.05.2016).
24. Новикова Д.С. Автоматическое выделение терминов из текстов предметных
областей и установление связей между ними // Труды всероссийской конференции «Информационно-телекоммуникационные технологии и математическое моделирование высокотехнологичных систем». - М.: РУДН, 2012. - [Электронный ресурс]. URL:
http://conf.sci.pfu.edu.ru/index.php/ittmm/2012/paper/view/245/409(дата обращения: 16.05.2016).
25. Русско-английский военно-политический словарь. - Женева, 2002. -
[Электронный ресурс]. URL:http://www.twirpx.com/file/1636431(дата обращения: 16.05.2016).
26. Словарь современных военно-политических и военных терминов Россия-
НАТО. - Москва-Брюссель, 2001. - [Электронный ресурс]. URL:
http://www.twirpx.com/file/988419(дата обращения: 16.05.2016).
27. Терминологическая база данных по военной реформе. - Специальная
рабочая группа Совета Россия-НАТО, 2005. - [Электронный ресурс]. URL: http://www.nato.int/docu/other/ru/2005/050715/Database.pdf (дата
обращения: 16.05.2016).
28. Усталов Д. А. Извлечение терминов из русскоязычных текстов при помощи
графовых моделей // Теория графов и приложения: материалы
конференции. - Екатеринбург: Уральский университет, 2012. - С. 62-69. - [Электронный ресурс]. URL: http://koost.eveel.ru/science/CSEDays2012.pdf(дата обращения: 16.05.2016).
29. Хохлова М.В. Исследование лексико-синтаксической сочетаемости в русском языке с помощью статистических методов (на базе корпусов текстов): дис. ... канд. фил. наук. - СПб., 2010. - 211 с.
30. Acs J. Pivot-based Multilingual Dictionary Building using Wiktionary //
Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik, 2014. - [Электронный ресурс]. URL: http://www.lrec-conf.org/proceedings/lrec2014/pdf/864 Paper.pdf (дата
обращения: 15.05.2016).
31. Aker A., Paramita M., Pinnis M., Gaizauskas R. Bilingual dictionaries for all EU
languages // Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik, 2014. - [Электронный ресурс]. URL: http://www.lrec-
conf.org/proceedings/lrec2014/pdf/803 Paper.pdf (дата обращения:
15.05.2016).
32. Alegria I., Gurrutxaga A., Lizaso P., Saralegi X., Ugartetxea S., Urizar R.: Linguistic
and statistical approaches to basque term extraction // Proceedings of GLAT 2004: The production of specialized texts. - Barcelona: ENST Breagne, 2004. -
[Электронный ресурс]. URL: https://www.elhuyar.eus/media/content/files/Erauzterm-Glatos-2004.pdf(дата обращения: 15.05.2016).
33. Biel L. Corpus-Based Studies of Legal Language for Translation Purposes:
Methodological and Practical Potential // Online proceedings of the XVII European LSP Symposium 2009. - Aarhus, 2010. - [Электронный ресурс]. URL:
http://www.academia.edu/596750/Corpus-
Based Studies of Legal Language for Translation Purposes(дата обращения: 15.05.2016).
34. Borzovs J., Ilzina I., Keisa I., Pinnis M., Vasiljevs A. Terminology Localization
Guidelines for the National Scenario // Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik,
2014. - [Электронный ресурс]. URL: http://www.lrec-
conf.org/proceedings/lrec2014/pdf/1189 Paper.pdf (дата обращения:
15.05.2016).
35. Church K., Hanks P. Word association norms, mutual information, and lexicography // Computational Linguistics. - 1990. - Vol. 16. - Issue 1. - P. 22-29.
36. Daille B., Gaussier E., Lange J.-M. Towards automatic extraction of monolingual and bilingual terminology // Proceedings of the 15thInternational Conference on Computational Linguistics. - Kyoto, 1994. - P. 515-521.
37. Daille B. Combined Approach for Terminology Extraction: Lexical Statistics and
Linguistic Filtering. Technical papers // UCREL Technical Papers. - 1995. - Vol. 5. - [Электронный ресурс]. URL:
http://ucrel.lancs.ac.uk/papers/techpaper/vol5.pdf (дата обращения:
15.05.2016).
38. Desilets A., Huberdeau L.-P., M., Quirion J. Building a Collaborative Multilingual
Terminology System // Proceedings of the ASLIB Translating and the Computer Conference. - London, 2009. - [Электронный ресурс]. URL: http://wiki-
translation.com/tiki-download wiki attachment.php?attId=57(дата обращения: 15.05.2016).
39. Dejean H., Gaussier E., Sadat F. Bilingual terminology extraction: an approach
based on a multilingual thesaurus applicable to comparable corpora // Proceedings of the 19th International Conference on Computational Linguistics. - Taiwan, 2002. - [Электронный ресурс]. URL:
http://www.xrce.xerox.com/Research-Development/Publications/2002-025(дата обращения: 15.05.2016).
40. Department Of Defense Dictionary Of Military And Associated Terms: Joint Publication 1-02. - US Department of Defense, 2010. - [Электронный ресурс]. URL:https://fas.org/irp/doddir/dod/ip102.pdf(дата обращения: 15.05.2016).
41. Evert S. The statistics of word cooccurences word pairs and collocations. PhD thesis. - Institut fur Maschinelle Sprachverarbeitung (IMS): Universitat Stuttgart,
2004. - 353 p. [Электронный ресурс]. URL: http://elib.uni-
stuttgart.de/handle/11682/2573(дата обращения: 5.10.2010).
42. Fantinuoli C., Zanettin F. Creating and using multilingual corpora in translation
studies // New directions in corpus-based translation studies. - Berlin: Language Science Press, 2015. - [Электронный ресурс]. URL:
http://www.academia.edu/12810278/Creating and using multilingual corpora in translation studies(дата обращения: 15.05.2016).
43. Firth J.R. Selected papers of J.R. Firth, 1952-1959. - London: Harlow, Longman, 1968. - 219 p.
44. Gaussier E., Lange J.-M., Meunier F. Towards Bilingual Terminology // Proceedings of the Joint ALLC/ACH Conference. - Oxford, 1992. - P. 121-124.
45. Guinovart X., Simoes A. Parallel corpus-based bilingual terminology extraction //
Proceedings of the 8th International Conference on Terminology and Artificial Intelligence. - Toulouse, 2009. - [Электронный ресурс]. URL:
http://sli.uvigo.es/arquivos/TIA09.pdf(дата обращения: 15.05.2016).
46. Ha L.A., Fernandez G., Mitkov R., Corpas G. Mutual bilingual terminology extraction
// Proceedings of the 6thInternational Conference on Language Resources and Evaluation (LREC'2008). - Marrakech, 2008. - [Электронный ресурс]. URL: http://www.lrec-conf.org/proceedings/lrec2008/pdf/463 paper.pdf (дата
обращения: 15.05.2016).
47. Heid U. On ways words work together - research topics in lexical combinatorics // Proceedings of the 6th Euralex International Congress on Lexicography (EURALEX ’94). - Amsterdam, 1994. - P. 226-257.
48. Heylen K., Bond S., De Hertog D., Vulic I., Kockaert H. TermWise: A CAT-tool with
Context-Sensitive Terminological Support // Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik, 2014. - [Электронный ресурс]. URL: http://www.lrec-
conf.org/proceedings/lrec2014/pdf/706_Paper.pdf (дата обращения:
15.05.2016).
49. Hilgert L., Lopes L., Freitas A., Vieira R., Hogetop D., Vanin A. Building Domain
Specific Bilingual Dictionaries // Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik, 2014. -
[Электронный ресурс]. URL: http://www.lrec-
conf.org/proceedings/lrec2014/pdf/1112_Paper.pdf (дата обращения:
15.05.2016).
50. Kilgarriff A., Jakubicek M., Kovar V., Rychly P., Suchomel V. Finding Terms in
Corpora for Many Languages with the Sketch Engine // Proceedings of the Demonstrations at the 14th Conference of the European Chapter of the Association for Computational Linguistics. - Goethenburg, 2014. - [Электронный ресурс]. URL: https://www.sketchengine.co.uk/wp-
content/uploads/Finding Terms 2014.pdf(дата обращения: 15.05.2016).
51. Kilgarriff A. Terminology finding, parallel corpora and bilingual word sketches in
the Sketch Engine // Proceedings of the ASLIB 35thTranslating and the Computer Conference. - London, 2013. - [Электронный ресурс]. URL:
https://www.sketchengine.co.uk/wp-content/uploads/2015/05/Terminology finding 2013.pdf(дата обращения: 15.05.2016).
52. Lefever E., Macken L., Hoste V. Language-independent bilingual terminology
extraction from a multilingual parallel corpus // Proceedings of the 12th Conference of the European Chapter of the ACL. - Athens, 2009. - [Электронный ресурс]. URL: http://www.academia.edu/2957382/Language-
independent bilingual terminology extraction from a multilingual parallel corpus (дата обращения: 15.05.2016).
53. Lu B., Tsou B.K. Towards bilingual term extraction in comparable patents // Proceedings of the 23rdPacific Asia Conference on Language, Information and Computation (PACLIC). - Hong Kong, 2009. - P. 755-762. - [Электронный ресурс]. URL:http://www.aclweb.org/anthology/Y09-2038(дата обращения: 15.05.2016).
54. Manning Ch., Schutze H. Foundations of Statistical Natural Language Processing. - Massachusetts: MIT Press, 1999. - 717 p.
55. Nenadic G., Okazaki N., Ananiadou S. Towards a terminological resource for biomedical text mining // Proceedings of the 5thInternational Conference on Language Resources and Evaluation (LREC'2006). - Genoa, 2006. - [Электронный ресурс]. URL: http://www.lrec-conf.org/proceedings/lrec2006/pdf/352_pdf.pdf(дата обращения: 15.05.2016).
56.Oakes M. Statistics for corpus linguistics. - Edinburgh: Edinburgh University Press, 1998. - 303 p.
57.Schmid H. Probabilistic Part-of-Speech Tagging Using Decision Trees //
Proceedings of International Conference on New Methods in Language Processing. - Manchester, 1994. - [Электронный ресурс]. URL:http://www.cis.uni-
muenchen.de/~schmid/tools/TreeTagger/data/tree-tagger1.pdf (дата
обращения: 15.05.2016).
58.Seretan V. Syntax-Based Collocation Extraction. - Berlin: Springer, 2011. - 222 p.
59.Smadja F. Retrieving collocations from text: Xtract // Computational Linguistics. - 1993. - Vol. 19. - Issue 1. - P. 143-177. [Электронный ресурс]. URL:
http://www.aclweb.org/anthology/J93-1007(дата обращения: 16.05.2016).
60.Smadja F., McKeown K. Automatically extracting and representing collocations for language generation // Proceedings of the 28thAnnual Meeting of the Association for Computational Linguistics. - Pittsburgh, 1990. - [Электронный ресурс]. URL: https://www.aclweb.org/anthology/P/P90/P90-1032.pdf (дата обращения:
16.05.2016).
61.Somers H. Bilingual parallel corpora and Language Engineering // Anglo-Indian Workshop "Language Engineering for South-Asian Languages". - Mumbai, 2001. - [Электронный ресурс]. URL: http://www.emille.lancs.ac.uk/lesal/somers.pdf(дата обращения: 16.05.2016).
62. Spela V. Using parallel corpora for translation-oriented term extraction. - Ljubljana: Crotian Philological Society, 2000. - [Электронный ресурс]. URL: https://www.researchgate.net/publication/233544867 Using Parallel Corpora for Translation-Oriented Term Extraction(дата обращения: 16.05.2016).
63.Steinberger R., Pouliquen B., Widiger A., Ignat C., Erjavec T., Tufis D., Varga D. The JRC-Acquis: A multilingual aligned parallel corpus with 20+ languages file // Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'2006). - Genoa, 2006. - [Электронный ресурс]. URL:
https://arxiv.org/ftp/cs/papers/0609/0609058.pdf (дата обращения:
16.05.2016).
64.Stubbs M. Words and Phrases: Corpus Studies of Lexical Semantics. - Oxford: Blackwell, 2001. - 267 p.
65.Zadeh B., Handschuh S. Evaluation of Technology Term Recognition with Random Indexing // Proceedings of the 9thInternational Conference on Language Resources and Evaluation (LREC'2014). - Reykjavik, 2014. - [Электронный ресурс]. URL: http://www.lrec-
conf.org/proceedings/lrec2014/pdf/920 Paper.pdf (дата обращения:
16.05.2016).


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ