Тип работы:
Предмет:
Язык работы:


ПРОБЛЕМЫ СОВРЕМЕННЫХ МАШИННЫХ СИСТЕМ ПЕРЕВОДА НА ПРИМЕРЕ ЯПОНСКОГО ЯЗЫКА

Работа №127672

Тип работы

Бакалаврская работа

Предмет

филология

Объем работы102
Год сдачи2022
Стоимость4285 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
118
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 3
1. МАШИННЫЙ ПЕРЕВОД 6
1.1 Определение понятия «перевод» 6
1.2 Определение понятия «машинный перевод» 9
1.3 История развития машинного перевода 10
1.4. Типология систем МП 16
1.4.1. МП на основе правил (Rule-Based Machine Translation — RBMT) ...17
1.4.2. Статистический МП (Statistical Machine Translation — SMT) 19
1.4.3 Гибридный МП 20
1.4.4 Нейронный МП 21
1.5 Выводы 22
2. ОЦЕНКА КАЧЕСТВА МП 24
2.1 Автоматические методы оценки 24
2.2 Экспертная оценка качества перевода 26
2.3 Классификация ошибок МП по Vilar D 28
3. ОСОБЕННОСТИ МП В ЯЗЫКОВОЙ ПАРЕ ЯПОНСКИЙ-РУССКИЙ (НА ПРИМЕРЕ
ПУБЛИЦИСТИЧЕСКИХ И ХУДОЖЕНСТВЕННЫХ ТЕКСТОВ) 31
3.1 Оценка перевода с японского на русский по метрикам BLEU и METEOR 31
3.2 Экспертная оценка переводов с японского на русский 35
3.2.1 Публицистический текст 35
3.2.2 Художественный текст 44
ЗАКЛЮЧЕНИЕ 55
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ И ИСТОЧНИКОВ 57
ПРИЛОЖЕНИЕ 62
A. Классификация ошибок МП по Vilar D. на английском языке 62
Б. Публицистические тексты 62
B. Художественные тексты. Акутагава Рюноскэ


Проблема перевода, а особенно быстрого и качественного перевода большого количества информации с одного языка на другой, стояла перед людьми многие столетия. В середине XX века стало понятно, что данную задачу помогут решить появившиеся электронно-вычислительные машины. Однако на протяжении многих десятилетий системы машинного перевода (далее — МП) не отличались качеством и скоростью. Всё начало меняться в 1990 годах, когда вычислительные мощности компьютеров, а также разработанные лингвистами методы языкового анализа, позволили учёным сравнивать большие корпуса параллельных текстов, тем самым совершенствуя системы МП.
Сегодня сотни миллионов людей ежедневно пользуются популярными сервисами онлайн-перевода и вряд ли могут представить себе жизнь без них. Однако, несмотря на значительный прогресс в области МП, автоматический перевод всё ещё уступает в своём качестве профессиональному переводу, выполненному человеком. Особенно хорошо заметно низкое качество МП между представителями разных языковых семей.
Актуальность данной работы обусловлена необходимостью дальнейшего усовершенствования систем МП и тем, что ошибки МП в языковой паре японский-русской до сих пор мало изучены в академической среде. Объектом исследования являются тексты, переведённые с помощью систем МП Google Translator и Yandex Переводчик. В качестве предмета исследования выступают особенности МП и ошибки, возникающие при использовании систем МП в языковой паре японский-русский на материале публицистических и художественных текстов.
Цель данной работы заключается в описании особенностей внутреннего устройства и работы систем МП, а также в рассмотрении ошибок МП с японского на русский язык.
Для достижения поставленной цели были определены следующие задачи:
1. Изучить подходы к определению понятий «перевод» и «машинный перевод» и историю появления МП.
2. Рассмотреть принципы работы современных систем МП.
3. Проанализировать типы ошибок в МП с японского на русский язык.
Теоретической базой для исследования послужили работы отечественных и зарубежных ученых, среди которых труды Бузаджи Д. М., Федорова А. В., Бархударова Л. С., Комиссарова В.Н., Рецкера Я.И., Сдобникова В.В., Петровой О.В., Нелюбина Л.Л., Дроздовой К.А., Раренко М.Б., Филинова Е.Н., Ревзина И.И., Захаровой Т.В., Шаляпина З.М., Головко Д.Р., Молчанова А.П., Нуриева В.А., Нагао М., Shieber S., Vasconcellos M., Brown P., Koehn P., Vilar D.
Материалом для проведения исследования стали публицистические тексты на японском языке, взятые из учебника «Японский для старших курсов» Чиронова С.В., а также отрывки из художественных произведений Акутагава Рюноскэ. В ходе работы анализировались и сравнивались переводы данных текстов, выполненные человеком, с переводами систем МП Google Translator и Yandex Переводчик.
Практическая ценность исследования заключается в возможности использования полученных результатов и анализа ошибок для дальнейшего усовершенствования систем МП.
Структура данной работы состоит из введения, трёх глав, заключения и приложения. Во введении обосновывается актуальность, практическая ценность, описывается объект и предмет исследования.
В первой главе рассматриваются различные точки зрения учёных на определения «перевода» и «машинного перевода», историю развития систем МП, а также типы МП. Вторая глава посвящена оценке МП, рассматриваются два подхода — автоматическая оценка и экспертная оценка качества перевода.
В третьей главе представлен анализ и классификация ошибок в МП с японского языка на русский. В заключении подводятся итоги работы и делаются выводы. В приложении представлена таблица классификации ошибок МП, а также анализируемые тексты на японском и их перевод на русский язык.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Машинный перевод, как и подход к его осуществлению, за последние десятилетия претерпел ряд изменений, которые без сомнений привели к улучшению его качества. В середине 2010 годов началось повсеместное внедрение нейронного метода в большинство популярных систем МП. Это позволило значительно сократить затраты на разработку и обучение систем МП, а также привело к увеличению скорости и качества перевода. Однако МП до сих пор уступает профессиональному переводу, выполненному человеком.
Как удалось выяснить в ходе данного исследования, большой проблемой для современных систем МП в паре японский-русский является перевод различных типов безличных предложений, где отсутствует подлежащее в оригинальном тексте. Такие ошибки особенно характерны для МП художественного текста. Опущение подлежащего в предложении, особенно, если оно выражено местоимением 1 и 2 лица, крайне распространённая практика в японском языке.
Также нам удалось зафиксировать пропуски слов в МП. Системы МП просто не видят определённые слова или словосочетания, скорее всего, потому что довольно редко их встречают при обучении.
Большую трудность при МП вызывает также выбор подходящего по смыслу слова в русском. Часто выбранный аналог либо не соответствует стилистике текста, либо не передаёт всю семантику японского слова, как случилось с переводом «разведывательного бурения», где система МП оставила только «бурение». Особые трудности при переводе представляют редкие имена собственные и мало употребляемая, специфическая лексика.
К тому же в паре японский-русский замечен целый ряд ошибок, связанный с тем, что системы МП не отражают в переводе категории модальности и семантические особенности некоторых грамматических конструкций.
Стоит отметить, что при анализе результатов МП не было найдено пунктуационных ошибок. Это свидетельствует о том, на наш взгляд, что нейронные сети, лежащие в основе современных систем МП, ориентируются на правила пунктуации языка-реципиента.



1. Альотаиби С. М. Состояние современных систем машинного перевода с русского языка на арабский // Язык, сознание, коммуникация. — 2011.
— №42. — 69-75 с.
2. Бархударов Л.С. Язык и перевод (Вопросы общей и частной теории перевода). — М.: Междунар. отношения, 1975.
3. Бузаджи Д. М. К вопросу об определении понятия «перевод» // Мосты. Журнал переводчиков. — 2011. — №2. — 44-56 с.
4. Головко Д. Р. Особенности и виды машинного перевода // Вестник
Московского информационно-технологического университета -
Московского архитектурно-строительного института. — 2020. — №. 4.
— 24-30 с.
5. Джабраилова В. С., Безух А. Э. Скопос-теория как фактор прагматической адаптации при переводе слоганов коммерческой рекламы с английского языка на русский // Филологические науки. Вопросы теории и практики. — 2017. — №. 4 (70). — 92-95 с.
6. Дроздова К. А. Машинный перевод: история, классификация, методы // Вестник Омского государственного педагогического университета. Гуманитарные исследования. — 2015. — №. 3 (7). — 156-158 с.
7. Дьяченко И. Н., Матыченко Ю. В. Нейронный машинный перевод: преимущества, сложности, перспективы // Языки и литература в поликультурном пространстве. —2020. — №. 6. — 28-33 с.
8. Захарова Т. В. Теоретические основы компьютерных технологий в переводе: учебное пособие. — Оренбург: ОГУ, 2016.
9. Карасев И. В., Артюшина Е. А. Системы машинного перевода // Успехи современного естествознания. — 2011. — №. 7. — 117-118 с.
10. Комиссаров В. Н. Теория перевода (Лингвистические аспекты). — М.: Высшая школа, 1990.
11. Митренина О. В. Прикладная и компьютерная лингвистика. — М.: URSS, 2017.
12. Мифтахова Р. Г., Морозкина Е. А. Машинный перевод. Нейроперевод // Вестник Башкирского университета. — 2019. — Т. 24. — №. 2. — 497¬502 с.
13. Нелюбин Л. Л. Толковый переводоведческий словарь. — М.: Флинта: Наука, 2003.
14. Нуриев В. А., Егорова А. Ю. Методы оценки качества машинного перевода: современное состояние // Информатика и её применения. —
2021. — Т. 15. — №. 2. — 104-111 с.
15. Переходько И. В., Мячин Д. А. Оценка качества компьютерного перевода // Вестник Оренбургского государственного университета. — 2017. — №. 2 (202). — 92-96 с.
16. Раренко М. Б. Машинный перевод: от перевода «по правилам» к нейронному переводу // Социальные и гуманитарные науки. Отечественная и зарубежная литература. Языкознание: Реферативный журнал. — 2021. — №. 3. — 70-79 с.
17. Ревзин И. И. Основы общего и машинного перевода. — М.: Высшая школа, 1964.
18. Рецкер Я. И. Пособие по переводу с английского языка на русский язык. — М.: Просвещение, 1982.
19. Рычихин А. К. О методах оценки качества машинного перевода // Системы и средства информатики. — 2019. — Т. 29. — №. 4. — 106-118 с.
20. Сдобников В. В., Петрова О. В. Теория перевода. — М.: АСТ, 2008.
21. Улиткин И. А. Автоматическая оценка качества машинного перевода // Вестник Московского государственного областного университета. —
2022. — №. 1. — 47-59 с.
22. Федоров А.В. Основы общей теории перевода (лингвистические проблемы) . — 5-е изд. — Спб.: Филология Три, 2002.
23. Шаляпина З. М. Автоматический перевод: эволюция и современные тенденции // Вопросы языкознания. — 1996. — Т. 2. — 105-117 с.
24. Янбекова Г. Б., Галимзянова З. В., Ситдикова Ф. Б. Эволюция машинного перевода // Научные революции: сущность и роль в развитии науки и техники. — 2018. — 53-58 с.
25. Brown P. F. et al. The mathematics of statistical machine translation: Parameter estimation // Computational linguistics. — 1993. — Т. 19. — №.
2. — 263-311 p.
26. Hutchins J., Lovtskii E. Petr Petrovich Troyanskii (1894-1950): A forgotten pioneer of mechanical translation // Machine translation. — 2000. — Т. 15.
— №. 3. — 187-221 p.
27. Koehn P. Statistical machine translation. — Cambridge, MA: Cambridge University Press, 2009.
28. Nagao M., Tsujii J., Nakamura J. The Japanese government project for machine translation //Computational Linguistics. — 1985. — Т. 11. — №. 2¬
3. - 91-110 p.
29. Sager J. C. Language engineering and translation: Consequences of automation. — Amsterdam and Philadelphia: John Benjamins Publishing, 1994. — Т. 1.
30. Shieber S. M. The Turing test: verbal behavior as the hallmark of intelligence.
— Cambridge, MA: Mit Press, 2004.
31. Toury G. Descriptive translation studies: And beyond. — Amsterdam and Philadelphia: John Benjamins Publishing, 2012.
32. Ulitkin I. Computer-assisted Translation Tools // Translation journal. — 2011.
— Т. 15. — №. 1. — 1-8 p.
33. Vasconcellos M., Leon M. SPANAM and ENGSPAN: machine translation at the Pan American Health Organization // Computational Linguistics. — 1985. — Т. 11. — №. 2-3. — 122-136 p.
34. Vilar D. et al. Error analysis of statistical machine translation output // Proceedings of the fifth international conference on language resources and 
Электронные ресурсы:
35. Акутагава Рюноскэ, Нос // Фантасты братья Стругацкие URL: http://www.rusf.ru/abs/books/aku_nos.htm(дата обращения: 25.04.2022).
36. Акутагава Рюноскэ, Хана (Нос) // Aozora URL:
https://www.aozora.gr.jp/cards/000879/files/42_15228.html (дата
обращения: 25.04.2022).
37. Акутагава Рюноскэ, Ябу-но нака (В чаще) // Aozora URL:
https://www.aozora.gr.jp/cards/000879/files/179_15255.html (дата
обращения: 28.04.2022).
38. Глава «Яндекс.Переводчика» — о том, как искусственный интеллект меняет мир // BBC URL: https://www.bbc.com/russian/features-41086998(дата обращения: 25.02.2022).
39. Главная страница // PROMT URL:
https://www.promt.com/company/technology/neural-machine-translation/(дата обращения: 25.02.2022).
40. История машинного перевода // Виртуальный компьютерный музей
URL: https://www.computer-museum.ru/histsoft/histmt.htm (дата
обращения: 17.02.2022).
41. Рюноскэ Акутагава, В чаще // Kulichki URL: http://www.kulichki.com/moshkow/INOFANT/RUNOSKE/thicket.txt(дата обращения: 28.04.2022).
42. Рюноскэ Акутагава, Ворота Расёмон // Librebook URL:
https://librebook.me/vorota_rasemon/vol1/1(дата обращения: 07.05.2022).
43. Рюноскэ Акутагава, Кумо-но ито (Паутинка) // Aozora URL:
https://www.aozora.gr.jp/cards/000879/files/92_14545.html (дата
обращения: 15.05.2022).
44. Рюноскэ Акутагава, Паутинка // Booksonline URL:
https://booksonline.com.ua/view.php7bookM27805 (дата обращения:
15.05.2022).
45. Рюноскэ Акутагава, Расё:мон (Ворота Расёмон) // Aozora URL:
https://www.aozora.gr.jp/cards/000879/files/127_15260.html (дата
обращения: 07.05.2022).
46. Системы автоматического (машинного) перевода текста // Научно-образовательный кластер CLAIM URL: http://it-
claim .ru/Education/Course/Lingvistika/Lecture/Lecturel 3 .pdf (дата
обращения: 17.02.2022).
47. Статистические и гибридные методы перевода в технологиях компании
ПРОМТ // PROMT URL:
https://www.promt.ru/company/technology/white_papers/molchanov- 2013.pdf(дата обращения: 22.02.2022).
48. Found in translation: More accurate, fluent sentences in Google Translate // Blog Google URL: https://www.promt.com/company/technology/neural- machine-translation/(дата обращения: 25.02.2022).
49. What is Machine Translation? // The European Association for Machine Translation (EAMT) URL: https://eamt.org/what-is-machine-translation/(дата обращения: 15.02.2022).


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ