ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА ПРИ РАБОТЕ С НАУЧНЫМ ТЕКСТОМ В НАПРАВЛЕНИИ С РУССКОГО ЯЗЫКА НА АНГЛИЙСКИЙ
|
ВВЕДЕНИЕ 4
ГЛАВА 1 СИСТЕМЫ МАШИННОГО ПЕРЕВОДА И МЕТОДЫ ИХ
ОЦЕНКИ 6
1.1 Понятие машинного перевода 6
1.2 Истоки рождения машинного перевода и этапы его развития 6
1.3 Классификация систем машинного перевода 8
1.3.1 Память переводов (Translation Memory) 12
1.3.2 Системы, основанные на правилах 13
1.3.3 Гибридные системы машинного перевода 14
1.4 Методы оценки качества машинного перевода 15
1.4.1 Общая характеристика результатов перевода 15
1.4.2 Метод Макото Нагао 17
1.4.3 Автоматическая оценка перевода 17
1.4.4 Автоматическая оценка с использованием эталонного перевода 18
1.4.5 Алгоритм оценки качества машинного перевода Bilingual Evaluation .. 18
1.4.6 Метод оценки качества перевода NIST 19
1.4.7 Метрика для оценки перевода METEOR 19
1.4.8 Метрика Recall-Oriented Understudy 20
Выводы по главе 1 21
ГЛАВА 2. ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА DEEPL TRANSLATOR И GOOGLE TRANSLATE НА НАУЧНЫХ СТАТЬЯ ПО
МЕДИЦИНЕ 22
2.1 Методологический аспект исследования 22
2.2 Анализ результатов онлайн перевода научной статьи Д.Ж. Мамчуева
«Патогенез макулодистрофии» 26
2.3 Анализ результатов онлайн перевода научной статьи Ф.Х. Биджиева
«Этиопатогенез системной красной волчанки» 28
2.4 Анализ результатов онлайн перевода научной статьи Е.А. Ляшенко, Н.И.
Верюгина «Клинические особенности течения болезни Паркинсона у пациентов с психотическими нарушениями» 29
2.5 Анализ результатов онлайн перевода научной статьи А.А. Гочияев
«Цирроз печени и его осложнения» 31
2.6 Анализ результатов онлайн перевода научной статьи Ф.Х. Биджиева «Рак
шейки матки» 32
2.7 Анализ результатов онлайн перевода научной статьи И.А. Хафизова, Д.Р.
Ефимова, Э.Ш. Шаверская «Злокачественные новообразования тощей кишки» 34
2.8 Анализ результатов онлайн перевода научной статьи М.А. Есауленко,
И.М. Панфилов «Эффективность лечения ядерной катаракты ЛЭК» 36
2.9 Анализ результатов онлайн перевода научной статьи Д.У. кизи
Мирзокаримова, А.О. Даминов «Мутация и её последствия» 37
2.10 Анализ результатов онлайн перевода научной статьи Л.П. Сарапулова,
А.Н. Чичкина, Г.И. Ахмадуллина «Остеопороз у женщин в постменопаузе без нарушения углеводного обмена: особенности клиники и диагностики» 39
2.11 Анализ результатов онлайн перевода научной статьи Ю.А. Окунева
«Механизмы регуляции углеводного обмена» 41
2.12 Анализ результатов онлайн перевода научной статьи В.Ю. Судас
«Особенности диагностики и лечения острого аппендицита» 42
2.13 Анализ результатов онлайн перевода научной статьи З.И. Каппушева
«Г енетические основы гомеостаза» 44
2.14 Анализ результатов онлайн перевода научной статьи В.Н. Павлова, П.А.
Плотникова, И.А. Тетерлева, С.Д. Дейранян «Лечение ГЭРБ» 46
Выводы по главе 2 47
ЗАКЛЮЧЕНИЕ 49
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 51
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
ГЛАВА 1 СИСТЕМЫ МАШИННОГО ПЕРЕВОДА И МЕТОДЫ ИХ
ОЦЕНКИ 6
1.1 Понятие машинного перевода 6
1.2 Истоки рождения машинного перевода и этапы его развития 6
1.3 Классификация систем машинного перевода 8
1.3.1 Память переводов (Translation Memory) 12
1.3.2 Системы, основанные на правилах 13
1.3.3 Гибридные системы машинного перевода 14
1.4 Методы оценки качества машинного перевода 15
1.4.1 Общая характеристика результатов перевода 15
1.4.2 Метод Макото Нагао 17
1.4.3 Автоматическая оценка перевода 17
1.4.4 Автоматическая оценка с использованием эталонного перевода 18
1.4.5 Алгоритм оценки качества машинного перевода Bilingual Evaluation .. 18
1.4.6 Метод оценки качества перевода NIST 19
1.4.7 Метрика для оценки перевода METEOR 19
1.4.8 Метрика Recall-Oriented Understudy 20
Выводы по главе 1 21
ГЛАВА 2. ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА DEEPL TRANSLATOR И GOOGLE TRANSLATE НА НАУЧНЫХ СТАТЬЯ ПО
МЕДИЦИНЕ 22
2.1 Методологический аспект исследования 22
2.2 Анализ результатов онлайн перевода научной статьи Д.Ж. Мамчуева
«Патогенез макулодистрофии» 26
2.3 Анализ результатов онлайн перевода научной статьи Ф.Х. Биджиева
«Этиопатогенез системной красной волчанки» 28
2.4 Анализ результатов онлайн перевода научной статьи Е.А. Ляшенко, Н.И.
Верюгина «Клинические особенности течения болезни Паркинсона у пациентов с психотическими нарушениями» 29
2.5 Анализ результатов онлайн перевода научной статьи А.А. Гочияев
«Цирроз печени и его осложнения» 31
2.6 Анализ результатов онлайн перевода научной статьи Ф.Х. Биджиева «Рак
шейки матки» 32
2.7 Анализ результатов онлайн перевода научной статьи И.А. Хафизова, Д.Р.
Ефимова, Э.Ш. Шаверская «Злокачественные новообразования тощей кишки» 34
2.8 Анализ результатов онлайн перевода научной статьи М.А. Есауленко,
И.М. Панфилов «Эффективность лечения ядерной катаракты ЛЭК» 36
2.9 Анализ результатов онлайн перевода научной статьи Д.У. кизи
Мирзокаримова, А.О. Даминов «Мутация и её последствия» 37
2.10 Анализ результатов онлайн перевода научной статьи Л.П. Сарапулова,
А.Н. Чичкина, Г.И. Ахмадуллина «Остеопороз у женщин в постменопаузе без нарушения углеводного обмена: особенности клиники и диагностики» 39
2.11 Анализ результатов онлайн перевода научной статьи Ю.А. Окунева
«Механизмы регуляции углеводного обмена» 41
2.12 Анализ результатов онлайн перевода научной статьи В.Ю. Судас
«Особенности диагностики и лечения острого аппендицита» 42
2.13 Анализ результатов онлайн перевода научной статьи З.И. Каппушева
«Г енетические основы гомеостаза» 44
2.14 Анализ результатов онлайн перевода научной статьи В.Н. Павлова, П.А.
Плотникова, И.А. Тетерлева, С.Д. Дейранян «Лечение ГЭРБ» 46
Выводы по главе 2 47
ЗАКЛЮЧЕНИЕ 49
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 51
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ
Использование информационных технологий в переводческой сфере деятельности с каждым годом занимает всё больше значимых позиций в связи с активными темпами глобализации. Именно этот процесс оказывает существенное влияние на количество и качество машинного перевода. Помимо этого изменения затронули и саму процедуру перевода, которая как никогда нуждается в использовании технологий машинного перевода для интенсификации труда.
Актуальность исследования заключается в нынешнем растущем интересе к этой области знаний, что сопровождается множеством споров относительно целесообразности использования таких систем и качества получаемых переводов. Все существующие машинные переводчики используют искусственные нейронные сети, что делает их процесс и результат похожими друг на друга, поэтому использование методов оценки машинного перевода и выявление слабых и сильных сторон крайне остро необходимы на сегодняшний день.
Объектом исследования является нейронный машинный перевод.
Предметом исследования выступает критерии оценки машинного перевода и методы их измерения.
Цель исследования - оценка качества машинного перевода научных текстов, основанная на сравнении итогов перевода при использовании двух нейронных сетей.
Задачи исследования:
1) Проанализировать понятие машинного перевода;
2) Исследовать развитие машинного перевода;
3) Выявить разницу между системами машинного перевода;
4) Сравнить качество машинного перевода программ Google Translate и DeepL Translator.
Теоретической основой исследования послужили труды отечественных ученых-лингвистов по теории перевода (В.Н. Комиссаров, В.В. Сдобников, Л.Н. Беляева) и по машинному переводу (О.С. Кулагина, Ю.Н. Марчук), а также работы зарубежных специалистов в области искусственного интеллекта (М. Нагао).
Материалом исследования стали 13 научных текстов на русском языке, средний объем которые 700 слов и их перевод при помощи алгоритмов нейронных сетей онлайн переводчиками Google Translate и DeepL Translator.
Теоретическая значимость исследования заключается в выявлении наиболее практичного онлайн переводчика для перевода научных статей.
Практической значимостью исследования является возможность использования результатов исследования в курсах по академическому письму.
На защиту выносятся следующие положения:
1. При переводе научны статей с русского на английский, с
использованием машинного перевода, превалируют ошибки в
словоупотреблении.
2. Возможности Google Translate помогают данному онлайн переводчику продемонстрировать более оптимальную работу при переводе научных терминов.
Результаты исследования прошли апробацию на конкурсе НИРС ЮУрГУ (апрель 2023), где основные положения были представлены в качестве научной статьи.
Работа проводилась в рамках проектного обучения (сентябрь 2021-июнь 2023 гг.), результатом которого стала разработка онлайн-курса «Английский язык для научно-публикационных целей». Курс предоставлен на образовательной платформе «Электронный ЮУрГУ». Результаты исследования нашли отражение в 10 модуле курса «The Help of Online Translator in Academic Writing».
Актуальность исследования заключается в нынешнем растущем интересе к этой области знаний, что сопровождается множеством споров относительно целесообразности использования таких систем и качества получаемых переводов. Все существующие машинные переводчики используют искусственные нейронные сети, что делает их процесс и результат похожими друг на друга, поэтому использование методов оценки машинного перевода и выявление слабых и сильных сторон крайне остро необходимы на сегодняшний день.
Объектом исследования является нейронный машинный перевод.
Предметом исследования выступает критерии оценки машинного перевода и методы их измерения.
Цель исследования - оценка качества машинного перевода научных текстов, основанная на сравнении итогов перевода при использовании двух нейронных сетей.
Задачи исследования:
1) Проанализировать понятие машинного перевода;
2) Исследовать развитие машинного перевода;
3) Выявить разницу между системами машинного перевода;
4) Сравнить качество машинного перевода программ Google Translate и DeepL Translator.
Теоретической основой исследования послужили труды отечественных ученых-лингвистов по теории перевода (В.Н. Комиссаров, В.В. Сдобников, Л.Н. Беляева) и по машинному переводу (О.С. Кулагина, Ю.Н. Марчук), а также работы зарубежных специалистов в области искусственного интеллекта (М. Нагао).
Материалом исследования стали 13 научных текстов на русском языке, средний объем которые 700 слов и их перевод при помощи алгоритмов нейронных сетей онлайн переводчиками Google Translate и DeepL Translator.
Теоретическая значимость исследования заключается в выявлении наиболее практичного онлайн переводчика для перевода научных статей.
Практической значимостью исследования является возможность использования результатов исследования в курсах по академическому письму.
На защиту выносятся следующие положения:
1. При переводе научны статей с русского на английский, с
использованием машинного перевода, превалируют ошибки в
словоупотреблении.
2. Возможности Google Translate помогают данному онлайн переводчику продемонстрировать более оптимальную работу при переводе научных терминов.
Результаты исследования прошли апробацию на конкурсе НИРС ЮУрГУ (апрель 2023), где основные положения были представлены в качестве научной статьи.
Работа проводилась в рамках проектного обучения (сентябрь 2021-июнь 2023 гг.), результатом которого стала разработка онлайн-курса «Английский язык для научно-публикационных целей». Курс предоставлен на образовательной платформе «Электронный ЮУрГУ». Результаты исследования нашли отражение в 10 модуле курса «The Help of Online Translator in Academic Writing».
Переводческая деятельность является трудозатратным и довольно сложным процессом. В настоящее время машинный перевод является однимиз наиболее популярных направлений в переводческой сфере.
Деятельность по преобразованию текста с одного языка на другой уже сложно представить без систем машинного перевода, поскольку такие системы оказывают колоссальную помощь человеку-переводчику.
В настоящей работе мы определили понятие машинного перевода, изучили его историю и описали основные типы систем МП, а также методы оценки качества МП. На основании изученных нами теоретических данных, описанных в первой главе, мы проанализировали работу двух машинных переводчиков — Google Translate и DeepL Translator, — работающих на разных видах нейронных сетей, и пришли к ряду заключений.
Результаты анализа переводов свидетельствуют о том, что Google
Translate, чаще прибегает к буквальному переводу, тогда как DeepL Translator, стремится найти подходящий синоним, передать речевые нюансы, что, в конечном итоге, приводит к более естественно звучащему переводу.
Результаты анализа переводов свидетельствуют о том, что Google Translate работает последовательно, обрабатывая предложения слово за словом прежде, чем установить отношения между его компонентами. В то время как DeepL Translator менее склонен к подобной линейности, за счет чего он способен лучше понимать контекстное значение, но меньше подходят для перевода длинных последовательных сочетаний. Об этом свидетельствует тот факт, что Google Translate показывает лучшие результаты при переводе научных статей, для которых особенно характерны именно такие сочетания слов. Однако стоит понимать, что практические навыки человеческого интеллекта по-прежнему имеют огромное значение для точного перевода текстов, содержащих специальную лексику и термины, присущие той или иной сфере деятельности. Даже сложные системы машинного перевода подходят лишь как производители «сырой» переводной продукции, которая обрабатывается, проверяется и редактируется профессионалом, человеком-переводчиком. В тоже время DeepL Translator продемонстрировал лучшие результаты при строении предложений, оно было более понятное и привычное англоговорящему читателю.
Данные наблюдения позволяют нам заключить, что есть возможность использования этих переводчиков в связке. GoogleTranslate отлично справляется с переводом научной терминологии, в то время как DeepL Translator не имеет ошибок построении предложений и не демонстрирует возможность упущения некоторой информации. Как результат комбинации работы двух переводчиков и минимального редактирования можно получить практический идеальный вариант перевода.
Деятельность по преобразованию текста с одного языка на другой уже сложно представить без систем машинного перевода, поскольку такие системы оказывают колоссальную помощь человеку-переводчику.
В настоящей работе мы определили понятие машинного перевода, изучили его историю и описали основные типы систем МП, а также методы оценки качества МП. На основании изученных нами теоретических данных, описанных в первой главе, мы проанализировали работу двух машинных переводчиков — Google Translate и DeepL Translator, — работающих на разных видах нейронных сетей, и пришли к ряду заключений.
Результаты анализа переводов свидетельствуют о том, что Google
Translate, чаще прибегает к буквальному переводу, тогда как DeepL Translator, стремится найти подходящий синоним, передать речевые нюансы, что, в конечном итоге, приводит к более естественно звучащему переводу.
Результаты анализа переводов свидетельствуют о том, что Google Translate работает последовательно, обрабатывая предложения слово за словом прежде, чем установить отношения между его компонентами. В то время как DeepL Translator менее склонен к подобной линейности, за счет чего он способен лучше понимать контекстное значение, но меньше подходят для перевода длинных последовательных сочетаний. Об этом свидетельствует тот факт, что Google Translate показывает лучшие результаты при переводе научных статей, для которых особенно характерны именно такие сочетания слов. Однако стоит понимать, что практические навыки человеческого интеллекта по-прежнему имеют огромное значение для точного перевода текстов, содержащих специальную лексику и термины, присущие той или иной сфере деятельности. Даже сложные системы машинного перевода подходят лишь как производители «сырой» переводной продукции, которая обрабатывается, проверяется и редактируется профессионалом, человеком-переводчиком. В тоже время DeepL Translator продемонстрировал лучшие результаты при строении предложений, оно было более понятное и привычное англоговорящему читателю.
Данные наблюдения позволяют нам заключить, что есть возможность использования этих переводчиков в связке. GoogleTranslate отлично справляется с переводом научной терминологии, в то время как DeepL Translator не имеет ошибок построении предложений и не демонстрирует возможность упущения некоторой информации. Как результат комбинации работы двух переводчиков и минимального редактирования можно получить практический идеальный вариант перевода.





