Тип работы:	Предмет:	Язык работы:

Исследование автоматических метрик оценки перевода на материале профессиональных художественных переводов

Работа №	133494
Тип работы	Магистерская диссертация
Предмет	лингвистика
Объем работы	90
Год сдачи	2018
Стоимость	4875 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено	10

Не подходит работа?

Узнай цену на написание

Содержание

Введение 3
Глава 1. Машинный перевод как разновидность переводческой деятельности 6
1.1. Перевод как процесс и его характеристики 6
1.2. Специфика перевода художественного произведения 9
1.3. Ручной и автоматический перевод 12
1.5. Экспертная и ручная оценка перевода 14
1.5.1. Понятия адекватность перевода и эквивалентность оригиналу 14
1.5.2. Экспертная оценка машинного перевода 16
1.6. Автоматическая оценка перевода 19
1.6.1. Автоматическая оценка с использованием эталонного перевода 20
1.6.2. Автоматическая оценка без использования эталонного перевода 21
1.7. Различные меры, оценивающие качество перевода 21
Выводы к главе 1 34
Глава 2. Эксперимент по оценке метрик с помощью художественных переводов 36
2.1. Общий обзор эксперимента 36
2.2. Описание переводчиков, выбранных для эксперимента 37
2.3. Подготовка фрагментов перевода для сравнения 41
2.4. Использованные инструменты для оценки переводов 46
2.5. Выбор элементов «перевод-эталон» и «перевод-кандидат» 50
2.6. Анализ результатов, полученных с помощью системы Asiya 52
2.7. Анализ результатов, полученных с помощью MT-ComparEval 57
2.8. Обобщение результатов проведенного анализа 63
Выводы к главе 2 74
Заключение 77
Список литературы 79
Список источников 84
Приложение 1. Результаты оценки сегментов в Asiya (Ч. Хогарт (эталон) – И. Хэпгуд (перевод-кандидат) 85
Приложение 2. Результат оценки сегментов в MT-ComparEval (Дж. Ормсби (эталон) – Э. Гроссман (перевод-кандидат) 87

Введение

Развитие систем машинного перевода привело к созданию автоматических метрик, способных оценивать такие переводы. Данная работа посвящена изучению качества работы этих метрик. В идеале при их использовании метрик качественный перевод должен получать более высокие оценки. Очевидно, что качественными переводами считаются переводы, выполненные профессиональными переводчиками, и именно поэтому мы решили использовать профессиональные художественные переводы для анализа работы таких метрик.
Объектом настоящего исследования являются проблемы автоматической оценки качества переводов. Предметом являются проблемы работы наиболее доступных автоматических метрик оценки при рассмотрении художественных переводов в языковых парах русский —английский, испанский — английский, испанский — русский.
Актуальность работы связана с важной ролью компьютерных переводов в современном обществе и необходимостью их качественной оценки.
Научная новизна работы состоит в характере самого исследуемого материала — автоматические метрики оценки переводов и их работа с художественными текстами. Проведенное исследование может расширить представления об особенностях работы автоматических мер оценки и помочь при дальнейшей разработке и улучшении данных метрик.
Цель работы заключается в оценке качества работы автоматических метрик и выявлении возможных способов улучшения их работы.
Цель исследования определила постановку следующих задач:
1) Изучить специфику перевода художественных произведений;
2) Проанализировать существующие подходы к оценке качества переводов;
3) Изучить различные автоматические метрики, которые могут применяться для автоматической оценки качества с использованием эталонного перевода;
4) Рассмотреть оценки, которые получают профессиональные художественные переводы в соответствии с работой наиболее популярных и доступных автоматических метрик;
5) Систематизировать полученные результаты работы и проанализировать возможные причины получения высоких или низких оценок, а также способы улучшения работы тех или иных метрик.
Материалом исследования послужили переводы поэмы Николая Васильевича Гоголя «Мертвые души» на английский язык и переводы романа Мигеля де Сервантеса «Хитроумный идальго Дон Кихот Ламанчский» на английский и русский языки. Переводы Н.В. Гоголя на английский выполнены такими переводчиками, как Чарльз Джеймс Хогарт, Изабель Флоренс Хэпгуд и Роберт Магуайр. Переводы Сервантеса на английский выполнены Эдит Гроссман и Джоном Ормсби, на русский — Борисом Александровичем Энгельгардтом и Николаем Михайловичем Любимовым.
Общий объем материала — 3900 значений оценки сегментов по всем метрикам, полученных при анализе (а) 50 предложений на русском языке и переводов на английский каждого из них, выполненных тремя переводчиками (150 английских переводческих соответствий), (б) 50 предложений на испанском языке и переводов на русский каждого из них, выполненных двумя переводчиками (100 русских переводческих соответствий) и (в) 50 предложений на испанском языке и переводов на английский каждого из них, выполненных двумя переводчиками(100 английских переводческих соответствий).
В работе используются методы контекстного и компонентного анализа данных, анализа и обобщения отечественной и зарубежной теории, обобщения и аналогии, а также метод семантического анализа.
Настоящая работа состоит из введения, двух глав, заключения, списка литературы и приложений. Каждая глава сопровождается выводами. В заключении приводятся основные результаты исследования.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!

ДИПЛОМНЫЕ МАГИСТЕРСКИЕ ДИССЕРТАЦИИ

Курсовые Статьи Диплом Рязань

Заключение

В настоящей работе была предпринята попытка исследовать автоматические метрики оценки переводов с помощью художественных переводов, выполненных профессиональными переводчиками.
Был проведен эксперимент, в ходе которого мы оценили художественные переводы с помощью автоматических метрик. Эталоном послужили профессиональные переводы, с которыми сравнивались переводы-кандидаты, выполненные другими профессиональными переводчиками. Были получены результаты работы различных метрик, затем проанализированы оценки всех сегментов оригинального текста и вариантов перевода. Мы проанализировали элементы, получившие самые высокие и низкие оценки и предложили, что именно может улучшить результаты работы метрик.
Для достижения поставленной цели — оценки качества работы автоматических метрик и выявления возможных способов улучшения их работы — было проведено исследование отрывков из семи переводов двух художественных произведений: трех английских переводов поэмы «Мертвые души» Николая Васильевича Гоголя, двух испанских и двух английских переводов романа «Хитроумный идальго Дон Кихот Ламанчский» Мигеля де Сервантеса.
Для получения результатов работы метрик использовались системы Asiyaи MT-ComparEval. Они позволяют узнать балы разных сегментов по следующим метрикам: BLEU, GTM–3, NIST,–WER,–PER, Ol,–TERbase, METEOR-ex, ROUGE–L (Asiya),BREVITY-PENALTY, BLEU, BLEU–cased, PRECISION, RECALL, F–MEASURE (MT-ComparEval).
Следует отметить, что для улучшения представления о качестве работы самих систем Asiyaи MT-ComparEvalдля данных языковых пар необходимо провести гораздо более обширное исследование. Однако мы не располагаем достаточными средствами для достижения этой цели в рамках данной дипломной работы.
В ходе исследования мы пришли к выводу, что в целом, на данный момент работу исследованных метрик нельзя назвать удовлетворительной. Представленные переводы не получают высоких оценок и в соответствии с данными метрик не являются эквивалентными оригиналу.
К возможным способам улучшения работы метрик можно отнести следующие: подключение словаря синонимов, обучение системы оценки перевода принципам транслитерации, применение систем автоматического разрешения кореференции, подключение морфологических анализаторов, подключение системы, схожей с существующими словарями концептов, где основные понятия включены в семантическую сеть.
Кроме того, более высокие оценки можно получить, если использовать выравнивание не целых предложений, а их более коротких фрагментов. Если сравнивать каждый короткий фрагмент эталона со всеми фрагментами перевода-кандидата, учитывая наиболее высокие оценки, то можно увеличить оценку всего сегмента, тем самым улучшив работу метрик. Разработка алгоритма или программы, позволяющей сравнивать все сегменты A-Z перевода A с сегментами A-Z перевода B, кажется нам вполне реальной. Однако автоматическое деление текста на короткие смысловые сегменты представляет определенную трудность.

Литература

1. Арутюнова И.А. Лексические средства характеризации героев в английских переводах романа Н.В. Гоголя «Мертвые души». ВКР, рукопись. СПб, 2016.
2. Баранов A.Н. Введение в прикладную лингвистику: Учебное пособие. М.: Эдиториал УРСС, 2001.
3. Бархударов Л.С. Язык и перевод (Вопросы общей и частной теории перевода). М.: Международные отношения, 1975.
4. Басинский П. Несгораемое слово. [Электронный ресурс - https://rg.ru/2012/11/20/lubimov.html], 2012.
5. Беляева Л. Н., Откупщикова М. И. Автоматический (машинный) перевод // Прикладное языкознание / под. ред. Герда А. С. СПб., 1996.
6. Виноградов B.C. Лексические вопросы перевода художественной прозы. М.: Изд-во Московского университета, 1978.
7. Галинская Т.Н. Иноязычное деловое общение в подготовке специалистов переводчиков: монография. Оренбург: ГОУ ОГУ, 2009.
8. Джваршейшвили Р.Г. Психологическая проблема художественного перевода. Тбилиси: Мецниереба, 1984.
9. Казакова Т.А. Практические основы перевода. English <=> Russian. СПб.: Издательство Союз, 2001.
10. Комиссаров В.Н. Теория перевода (лингвистические аспекты). М.: Высшая школа, 1990.
11. Кэтфорд Дж. Лингвистическая теория перевода. Вопросы теории перевода в зарубежной лингвистике. М., 1978.
12. Латышев Л.К. Перевод: проблемы теории, практики и методики преподавания. М.: Просвещение, 1988.
13. Литературное наследство / Ред.: Анисимов И.И. (гл. ред.), Благой Д.Д., Бушмин А.С., Виноградов В.В., Дубовиков А.Н., Зильберштейн И.С., Макашин С.А., Муратова К.Д., Самарин Р.М., Тимофеев Л.И., Трифонов Н.А., Храпченко М.Б., Щербина В.Р. Том 75: Толстой и зарубежный мир. Кн. 1. М.: Наука, 1965.
14. Мельников Н. Портрет без сходства: Владимир Набоков в письмах и дневниках современников (1910—1980е годы). М.: Новое литературное обозрение, 2015.
15. Митренина О.В. Машинный перевод // Прикладная и компьютерная лингвистика. М.: URSS, 2016.
16. Нестеренко О.В. Поэма Н.В. Гоголя "Мертвые души" в англоязычных переводах XIX - XXI вв. [Электронный ресурс -http://cheloveknauka.com/poema-n-v-gogolya-mertvye-dushi-v-angloyazychnyh-perevodah-xix-xxi-vv#ixzz5CqZizMk9]. 2010.
17. Никитина Н.В. Эстетическая функция художественного стиля [Электронный ресурс - https://cyberleninka.ru/article/v/esteticheskaya-funktsiya-hudozhestvennogo-stilya], 2008.
18. Попович А. Проблемы художественного перевода М.: Высшая школа, 1980.
19. Чуковский К.И. Высокое искусство. М.: Советский писатель, 1968.
20. Швейцер А.Д. К вопросу об анализе грамматических явлений при переводе. Тетради переводчика. - Вып. 1. - М., 1963.
21. Шиллингер, Л. Эдит Гроссман про испанскую литературу и переводческие ловушки [Электронный ресурс - https://www.livelib.ru/translations/post/19828-edit-grossman-pro-ispanskuyu-literaturu-i-perevodcheskie-lovushki]. 2016.
22. Эткинд Е.Г. Художественный перевод: искусство и наука. Вопросы языкознания. М., 1970, № 4.
23. ALPAC Report, Language and Machines — Computers in Translation and Linguistics. A Report by the Automatic Language Processing Advisory Committee. Washington, DC, 1966.
24. Amigó E., Gonzalo J., Giménez J., Verdejo F. Corroborating text evaluation results with heterogeneous measures. In Proc. of the EMNLP, Edinburgh, UK, 2011.
25. Banerjee S., Lavie, A. METEOR: An Automatic Metric for MT Evaluation with Improved Correlation with Human Judgments. Proceedings of ACL Workshop on Intrinsic and Extrinsic Evaluation Measures for MT and/or Summarization. 2005.
26. Bloom H. The knight in the mirror. [Электронный ресурс - https://www.theguardian.com/books/2003/dec/13/classics.miguelcervantes]. 2003.
27. Bojar O., Buck C., Callison-Burch C., Federmann C., Haddow B., Koehn P., Monz C., Post M., Soricut R., Specia L. Proc. VIII Workshop on Statistical Machine Translation. Sofia, 2013.
28. Denkowski M., Lavie A. Meteor-next and the meteor paraphrase tables: Improved evaluation support for five target languages. Proceedings of the Joint Fifth Workshop on Statistical Machine Translation and MetricsMATR. 2010.
29. Doddington G. Automatic Evaluation of Machine Translation Quality Using N–gram Co-Occurrence Statistics. Proceedings of the 2nd International Conference on Human Language Technology. San Diego, California, 2002.
30. FuentesC.Tilt. [Электронный ресурс - https://www.nytimes.com/2003/11/02/books/tilt.html]. 2003.
31. Giménez J., Amigó E. IQMT: A Framework for Automatic Machine Translation Evaluation. Proceedings of the 5th International Conference on Language Resources and Evaluation (LREC'06). Genoa, Italy, 2006.
32. GiménezJ., Màrquez L. Linguistic Measures for Automatic Machine Translation Evaluation. Machine Translation. 2010.
33. Giménez J., Gonzàlez M. Asiya. An Open Toolkit for Automatic. Machine Translation (Meta-) Evaluation. Technical Manual. Version 3.0. TALP Research Center, LSI Department. Universitat Politècnica de Catalunya, Barcelona. February 2014.
34. Gonzàlez M., Giménez J., Màrquez L. "A Graphical Interface for MT Evaluation and Error Analysis". ACL 2012. System Demonstrations. 2012.
35. Holmes J. The Name and Nature of Translation Studies. The Translation Studies. Reader. Ed. by L.Venuti. London, New York, Routledge Publ., 2000.
36. King M., Falkedal K. Using Test Suites in Evaluation of MT Systems. In Proceedings of the 13th International Conference on Computational Linguistics (COLING), 1990.
37. Koehn P. Statistical Machine Translation. Cambridge, UK, 2010.
38. Lin C.Y, Och F. J. ORANGE: a Method for Evaluating Automatic Evaluation Metrics for Machine Translation. Geneva, Switzerland, 2004b.
39. Lin C.Y., Och F. J. Automatic Evaluation of Machine Translation Quality Using Longest Common Subsequence and Skip-Bigram Statics. Proceedings of the 42nd Annual Meeting of the Association for Computational Linguistics (ACL). 2004a.
40. Maguire R.A. Gogol from the twentieth century: eleven essays. Princeton, N.J.: Princeton University Press, 1974.
41. Maguire R.A. Exploring Gogol. Studies of the Harriman Institute. Stanford: Stanford University Press, 1994.
42. Manning Christopher D., Schütze H. Foundations of Statistical Natural Language Processing. MIT Press. Cambridge, MA, 1999.
43. Melamed I. D., Green R., Turian J. P. Precision and Recall of Machine Translation. Proceedings of the Joint Conference on Human Language Technology and the North American Chapter of the Association for Computational Linguistics (HLT-NAACL). 2003a.
44. Melamed I. D., Turian J. P., Shen L. Evaluation of Machine Translation and its Evaluation. Proceedings of MT SUMMIT IX. 2003b.
45. Nießen S., Och F. J., Leusch G., Ney H. An Evaluation Tool for Machine Translation: Fast Evaluation for MT Research. Proceedings of the 2nd International Conference on Language Resources and Evaluation (LREC). Athens, Greece, 2000.
46. Ormsby J.Translator's Preface. Don Quixote, by Miguel de Cervantes Saavedra. [Электронный ресурс - http://www.gutenberg.org/cache/epub/996/pg996-images.html]. 2004.
47. Papineni K., Roukos S., Ward T., Zhu W.-J. Bleu: a method for automatic evaluation of machine translation, RC22176 (Technical Report). IBM T.J. Watson Research Center. Philadelphia, Pennsylvania, USA, 2001.
48. Snover M., Dorr B., Schwartz R., Micciulla L., Makhoul J. A Study of Translation Edit Rate with Targeted Human Annotation. Proceedings of the 7th Conference of the Association for Machine Translation in the Americas (AMTA), 2006.
49. Snover M., Madnani N., Dorr B., Schwartz R. Fluency, adequacy, or HTER? Exploring different human judgments with a tunable MT metric. Proceedings of the Fourth Workshop on Statistical Machine Translation. Stroudsburg, PA, USA, 2009.
50. Tillmann C., Vogel S., Ney H., Zubiaga A., Sawaf H. Accelerated DP based Search for Statistical Translation. Proceedings of European Conference on Speech Communication and Technology. Aachen, Germany, 1997.
51. Troiano F., Permentiers J., Springael E. Translation, Adaptation and Multilingual Editing. A user's guide to linguistic and multimedia services. T.C.G. Editions. Brussels, 2002.
52. Wołk K., MarasekK. Neural-based Machine Translation for Medical Text Domain. Based on European Medicines Agency Leaflet Texts». ProcediaComputerScience 64 (64), 2015. Pp. 2–9.
Список источников
1. Cervantes Saavedra, Miguel de. Don Quijote. tr. from sp. Edith Grossman. HarperCollins: 2005.
2. Cervantes Saavedra, Miguel de. El ingenioso hidalgo Don Quijote de la Mancha.[Электронный ресурс - http://www.gutenberg.org/ebooks/2000].
3. Cervantes Saavedra, Miguel de. The Ingenious Gentleman Don Quixote of La Mancha. tr.from sp. John Ormsby. Digireads.com: 2009.
4. Gogol N. Chichikov`s Journeys or Dead Souls. tr. from rus. Isabel F. Hapgood, 2010.
5. Gogol N. Dead Souls. tr. from rus. C. J. Horagth[Электронный ресурс - https://ebooks.adelaide.edu.au/g/gogol/nikolai/g61d/complete.html].
6. Gogol N. Dead Souls. tr. from rus. Robert A. Maguire. London: Penguin, 2004.
7. Гоголь Н.В. Мертвые души. СПб., 2014.
8. Сервантес Сааведра, Мигель де. Хитроумный идальго Дон Кихот Ламанчский. Обраб. для детей и [послесл. написал] Б.М. Энгельгардт. Ленинград: Дет. лит. Ленингр. отд-ние, 1977.
9. Сервантес Сааведра, Мигель де. Хитроумный идальго Дон Кихот Ламанчский. Пер. с исп. Н.Любимова. М.: Правда, 1989.