Введение 3
Глава 1 Теоретическая основа машинного перевода 7
1.1 История развития машинного перевода 7
1.2 Определение и классификация машинного перевода 12
1.3 Специфика и трудности при переводе экономического текста 16
1.4 Оценка качества машинного перевода 17
1.5 Классификация ошибок при машинном переводе 20
Выводы по Главе 1 26
Глава 2 Сопоставительный анализ переводов английских экономических текстов на русский язык 28
2.1 Горизонтальное сравнение 32
2.1.1 Количество ошибок в переведенной версии 202104 34
2.1.2 Количество ошибок в переведенной версии 202201 38
2.1.3 Согласованность перевода и количество изменений на трех платформах 42
2.2 Вертикальное сравнение 45
2.2.1 Анализ переводов Google 46
2.2.2 Анализ переводов Promt 51
2.2.3 Анализ переводов Yandex 53
2.3 Анализ результатов перевода с точки зрения экономических текстов 55
2.4 Обсуждение взаимосвязи между машинным переводом и человеческим переводом 58
Вывод по Главе 2 64
Заключение 67
Список литературы 70
Список источников 74
С широким распространением Интернета, ускорением глобализации и все более частым обменом информацией между странами растет потребность людей в переводе, и традиционный ручной перевод далек от того, чтобы удовлетворить быстро растущий спрос на перевод. Способность машин обрабатывать большие объемы данных делает возможным эффективный и быстрый перевод. Внимание людей все чаще обращается к машинному переводу. Машинный перевод открыл новый этап развития, и в соответствии с требованиями времени появилось различное программное обеспечение для машинного перевода.
В последние годы, с быстрым развитием глубокого обучения, был достигнут большой прогресс в исследованиях машинного перевода нейронных сетей (neural machine translation, NMT). На многих языках производительность машинного перевода с использованием нейронных сетей была значительно улучшена, намного превосходя производительность традиционного статистического машинного перевода (statistical machine translation, SMT). В настоящее время исследования NMT стали центром внимания ученых и экспертов, и теперь это самое передовое направление развития исследований в области обработки естественного языка, и оно имеет огромное влияние в академических кругах. Этим объясняется актуальность данного исследования.
Целью исследования стал сопоставительный анализ качества перевода экономических текстов с английского языка на русский разными системами машинного перевода с использованием нейронных сетей. В задачи исследования входит следующее:
1) рассмотреть особенности машинного перевода с использованием нейронных сетей;
2) определить критерии оценки качества машинного перевода экономических текстов с использованием нейронных сетей;
3) по выделенным критериям провести горизонтальное и вертикальное сравнение результатов перевода экономических текстов с английского языка на русский в системах машинного перевода с использованием нейронных сетей Google Translate, Promt Translatorи Yandex Translatorв два разных периода времени;
4) проанализировать качество перевода и эффективность обучения исследуемых систем машинного перевода с использованием нейронных сетей.
Объектом исследования в данной работе являются результаты перевода экономических текстов различными системами машинного перевода, а предметом исследования являются ошибки и изменения в результатах перевода.
Материалом исследования послужили десять текстов экономической тематики на английском языке, опубликованных на сайте информационного агентства ТАСС, и результаты их перевода, выполненного в трех системах машинного перевода с использованием нейронных сетей, а именно Google Translate, Promt Translatorи Yandex Translatorв апреле 2021 года и январе 2022 года, то есть в общей сложности было проанализировано 60 русских переводов с английского языка, выдаваемых тремя переводческими платформами за два разных периода времени.
Методологической основой исследования послужили сплошная выборка, метод классификации, описательный и сравнительно-сопоставительный методы. Материал для исследования отбирался методом сплошной выборки. Далее для анализа качество переводов, полученных с помощью разных систем машинного перевода использовались метод классификации, описательный и сравнительно-сопоставительный методы.
Научная новизна исследования состоит в том, что в работе впервые анализируются и сопоставляются ошибки перевода текстов экономической тематики в трех разных переводческих системах на основе нейросетей за два разных периода времени.
Теоретическая значимость работы состоит в том, что в работе впервые критерии оценки качества перевода применены к переводу экономических текстов с английского языка на русский за два разных периода времени. Полученные данные могут использоваться в дальнейшем изучении принципов работы систем машинного перевода с использованием нейронных сетей. Практическая значимость обусловлена тем, что результаты исследования могут применяться при оценке эффективности машинного обучения нейросети, в разработке улучшений переводческих систем с использованием нейронных сетей, а также в курсе обучения письменному переводу с английского языка на русский.
На защиту выносятся следующие положения:
После десятилетий развития появились различные виды машинного перевода, и благодаря быстрому росту спроса на перевод машинный перевод широко используется в обществе. Качество перевода нейросетевой системы машинного перевода все еще очень низкое, поэтому машинный перевод без участия человека никогда не заменит человека.
Структура: данная работа включает введение, две главы, заключение и список литературы. Во введении раскрываются цель, задачи, значимость и актуальность. В первой главе представляются обзор истории машинного перевода, определение и классификация машинного перевода, специфика и трудности при переводе экономического текста, оценка качества машинного перевода и классификация ошибок при машинном переводе. Во второй главе исследуются результаты машинного перевода экономических текстов и изменения с течением времени.
В первой главе кратко представлены соответствующие теории машинного перевода вокруг истории развития, определения, классификации машинного перевода, характеристик экономических текстов и трудностей перевода, критериев оценки машинного перевода и ошибок машинного перевода. Мы можем обнаружить, что машинный перевод быстро развивался в последние годы, и появление глубокого обучения значительно улучшило качество перевода машинного перевода. С развитием технологий и потребностей связи исследования машинного перевода продолжают делать прорывы, а теория машинного перевода продолжает развиваться.
Во второй главе мы сравним результаты перевода выбранных английских экономических текстов тремя системами по горизонтали и вертикали. Мы оцениваем качество перевода машинного перевода, подсчитывая ошибки в переводе и проверяя непротиворечивость перевода соответствующих существительных. Мы также изучаем скорость и эффективность глубокого обучения нейронной сети трех систем, анализируя, как каждая система обрабатывает один и тот же текст с течением времени. Наконец, мы используем характеристики экономических текстов в качестве отправной точки для анализа качества результатов машинного перевода экономических текстов, а затем обсуждаем противоречие и взаимосвязь между машинным переводом и человеческим переводом.
Взяв за отправную точку экономические тексты, в этой работе мы протестировали три нейросетевые системы машинного перевода и сделали вывод о том, что экономические тексты обладают определенными характеристиками, включая большое количество чисел, единиц, терминов. Текстовые характеристики экономических текстов также предъявляют высокие требования к точности и совершенству переводческого содержания. В целом, качество перевода нейросетевой системы машинного перевода все еще очень низкое, и системы могут передать основной смысл предложения, но существующие ошибки и несоответствия в переводе говорят нам о том, что результаты перевода нейросетевой системы машинного перевода до сих пор не могут достичь высокого уровня стандарта. Хотя системы машинного перевода на основе нейронных сетей постоянно совершенствуются и учатся, еще есть много возможностей для совершенствования.
Стоит констатировать, что развитие машинного перевода достигло сегодня выдающихся показателей, что в определенной степени облегчило жизнь людей. Программное обеспечение для машинного перевода предоставляет удобные функции поиска слов и перевода в повседневной жизни. Хотя сервис не идеален и значение многих переводов неточное, оно все же расширяет возможности общения людей, снижает стоимость перевода для обычных людей и делает перевод более удобным. В настоящее время все больше и больше программного обеспечения машинного перевода использует для перевода метод нейронной сети (neural machine translation, NMT), который в определенной степени улучшает качество перевода.
С быстрым развитием машинного перевода сегодня многие люди сомневаются, действительно ли машинный перевод заменит человеческий перевод. Но ответ очевиден: машинный перевод без участия человека никогда не заменит человека. Те, кто заинтересован в переводческой деятельности, должны усердно изучать иностранные языки, овладевать навыками перевода, читать много текстов и накапливать устойчивые выражения, чтобы улучшить свои переводческие способности и способствовать развитию машинного перевода.
Перспективы исследования данной проблемы состоят в возможности дальнейшего более глубокого изучения машинного перевода, особенно нейронный машинный перевод, по оптимальному решению и преодолению наличных проблем.
1. Александрова Е.И. Экономический термин как элемент экономического дискурса при обучении экономическому переводу на материале текстов СМИ // Вестник Московского государственного областного университета. Серия: Педагогика. 2013. № 1. С. 54-60.
2. Антонова О.А., Мартынова И.Н. Грамматические и лексические ошибки при использовании систем машинного перевода “PROMT” и “GOOGLE. TRANSLATE” (на материале экономического текста) // В сборнике: Вопросы переводоведения, межкультурной коммуникации и зарубежной литературы. сборник научных статей. Чувашский государственный педагогический университет им. И.Я. Яковлева. Чебоксары, 2020. С. 8-14.
3. Газизов И.Ф. Трудности перевода экономических терминов и терминологических словасочетаний в английских экономических текстах // В сборнике: Фундаментальные и прикладные научные исследования: актуальные вопросы, достижения и инновации. сборник статей VIII Международной научно-практической конференции: в 4 частях. 2017. С. 158-160.
4. Гончаров А.А., Бунтман Н.В., Нуриев В.А. Ошибки в машинном переводе: проблемы классификации // Системы и средства информатики. 2019. Т. 29. № 3. С. 92-103.
5. Дьяченко И.Н., Матыченко Ю.В. Нейронный машинный перевод: преимущества, сложности, перспективы // Языки и литература в поликультурном пространстве. 2020. № 6. С. 28-33.
6. Дроздова, К. А. Машинный перевод: история, классификация, методы / К. А. Дроздова. — Текст : непосредственный // Филологические науки в России и за рубежом : материалы III Междунар. науч. конф. (г. Санкт-Петербург, июль 2015 г.). — Санкт-Петербург : Свое издательство, 2015. — С. 139-141.
7. Карасев И. В., Артюшина Е. А. Системы машинного перевода // Успехи современного естествознания. 2011, №7, С.117-118.
8. Крашенинникова Н.А. Классификация типичных ошибок при использовании систем машинного перевода // Симбирский научный вестник. 2011. №2 (4). С. 190-194.
9. Легостина М.С. Метрики оценки качества машинного перевода //В сборнике: ИННОВАТИКА-2019. сборник материалов XV Международной школы-конференции студентов, аспирантов и молодых ученых. 2019. С. 490-493.
10. Лядащева Е.Д. Экономический текст как особый тип текста // Филология и лингвистика. 2018. № 3 (9). С. 29-30.
11. Мошкович В.В. Оценка качества перевода и использование адекватности и эквивалентности как критериев оценки качества перевода // Вестник Челябинского государственного педагогического университета. 2013. № 10. С. 291-297.
12. Нанкевич А.А. Оценка качества разультатов систем машинного перевода // Системы компьютерной математики и их приложения. 2019. № 20-1. С. 215-221.
13. Новожилова А. А. Машинные системы перевода: качество и возможности использования // Вестник ВолГУ. Серия 2: Языкознание. 2014. №3 С.67-73.
14. Павлов В.Е., Башмакова И.С. Нейронная сеть и машинный перевод // Молодежный вестник ИрГТУ. 2017. № 2. С. 16.
15. Переходько И.В., Мячин Д.А. Оценка качества компьютерного перевода // Вестник Оренбургского государственного университета. 2017. № 2 (202). С. 92-96.
16. Полякова Н.Е. О критериях оценивания качества машинного перевода // Тенденции развития науки и образования. 2020. № 61-8. С. 84-87.
17. Ртищева Н.Г. Оценка качества работы систем машинного перевода // Решетневские чтения. 2017. Т. 2. С. 704-705.
18. Рычихин А.К. О методах оценки качества машинного перевода // Системы и средства информатики. 2019. Т. 29. № 4. С. 106-118.
19. Степанов Д.А., Федорцов П.А. Машинный перевод: преимущества и недостатки // В книге: Тезисы докладов 52-й Международной научно-технической конференции преподавателей и студентов. Тезисы докладов 52-й Международной научно-технической конференции преподавателей и студентов. 2019. С. 14-15.
20. Талызина Е.В. Анализ типичных ошибок и их причин при использовании средств машинного перевода // В книге: Проблемы теории и практики современной науки. Материалы VI Международной научно-практической конференции: Сборник научных трудов. ООО «НОУ «Вектор науки». 2016. С. 120-124.
21. Улиткин И.А. Автоматическая оценка качества машинного перевода научно-технического текста // Вестник Московского государственного областного университета. Серия: Лингвистика. 2016. № 4. С. 174-182.
22. Фаустова К.И. Нейронные сети: применение сегодня и перспективы развития // Территория науки. 2017. № 4. С. 83-87.
23. Шаляпина З. М. Автоматический перевод: Эволюция и современные тенденции // Вопросы языкознания, 1996, №2, C. 105—117.
24. Colin McIntosh. Cambridge Learner's Dictionary English-Russian. Cambridge ELT, UK, 2011.
25. Papineni, K.; Roukos, S.; Ward, T.; Zhu, W. J., BLEU: a method for automatic evaluation of machine translation // ACL 2002, USA, P311-318.
26. Philipp Koehn. Statistical Machine Translation. Cambridge, UK, 2010.
27. Vilar D., Jia Xu, D’Haro L., Ney H. Error Analysis of Statistical Machine Translation Output. // Proceedings of the Fifth International Conference on Language Resources and Evaluation, Genoa, Italy, 2006, P. 697—702.
Список источников
28. Машинный перевод от холодной войны до диплёрнинга
URL: https://vas3k.rU/blog/machine translation/#scroll20(дата обращения:
20.12.2020)
29. IMF improves forecast for US GDP growth rates in 2021 and 2022
URL: https://tass.com/economy/1274775(дата обращения: 29.03.2021)
30. IMF praises Russia’s measures to fight economic consequences of pandemic
URL: https://tass.com/economy/1254455(дата обращения: 29.03.2021)
31. Putin highlights Far East’s advanced development as Russia’s top priority
URL: https://tass.com/economy/1333593(дата обращения: 29.03.2021)
32. Facebook, Twitter, Telegram face $988,605 fine for prohibited content
URL: https://tass.com/economy/1334045(дата обращения :29.03.2021)
33. Sber, Gazprombank to provide $2.7 bln loan to Russian Copper Company
URL: https://tass.com/economy/1333427(дата обращения :29.03.2021)
34. Eurasian Economic Commission projects EAEU GDP growth at 3.8% in 2021
URL:https://tass.com/economy/1322521(дата обращения: 29.03.2021)
35. Russia ranks second by petroleum exports to US in June 2021 — EIA
URL: https://tass.com/economy/1332285(дата обращения: 29.03.2021)
36. Google pays $47,174 out of $438,047 of fines in Russia
URL: https://tass.com/economy/1330647(дата обращения: 29.03.2021)
37. Shanghai Stock Exchange sets up capital market service base on Hainan
URL: https://tass.com/economy/1330611(дата обращения: 29.03.2021)
38. Cross-border money transfers to appear in Faster Payment System in 2022 —
Bank of Russia
URL: https://tass.com/economy/1329133(дата обращения: 29.03.2021)