Тема: ПРОБЛЕМЫ СОВРЕМЕННЫХ МАШИННЫХ СИСТЕМ ПЕРЕВОДА НА ПРИМЕРЕ ЯПОНСКОГО ЯЗЫКА
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1. МАШИННЫЙ ПЕРЕВОД 6
1.1 Определение понятия «перевод» 6
1.2 Определение понятия «машинный перевод» 9
1.3 История развития машинного перевода 10
1.4. Типология систем МП 16
1.4.1. МП на основе правил (Rule-Based Machine Translation — RBMT) ...17
1.4.2. Статистический МП (Statistical Machine Translation — SMT) 19
1.4.3 Гибридный МП 20
1.4.4 Нейронный МП 21
1.5 Выводы 22
2. ОЦЕНКА КАЧЕСТВА МП 24
2.1 Автоматические методы оценки 24
2.2 Экспертная оценка качества перевода 26
2.3 Классификация ошибок МП по Vilar D 28
3. ОСОБЕННОСТИ МП В ЯЗЫКОВОЙ ПАРЕ ЯПОНСКИЙ-РУССКИЙ (НА ПРИМЕРЕ
ПУБЛИЦИСТИЧЕСКИХ И ХУДОЖЕНСТВЕННЫХ ТЕКСТОВ) 31
3.1 Оценка перевода с японского на русский по метрикам BLEU и METEOR
31
3.2 Экспертная оценка переводов с японского на русский 35
3.2.1 Публицистический текст 35
3.2.2 Художественный текст 44
ЗАКЛЮЧЕНИЕ 55
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ И ИСТОЧНИКОВ 57
ПРИЛОЖЕНИЕ 62
A. Классификация ошибок МП по Vilar D. на английском языке 62
Б. Публицистические тексты 62
B. Художественные тексты. Акутагава Рюноскэ 89
📖 Введение
Сегодня сотни миллионов людей ежедневно пользуются популярными сервисами онлайн-перевода и вряд ли могут представить себе жизнь без них. Однако, несмотря на значительный прогресс в области МП, автоматический перевод всё ещё уступает в своём качестве профессиональному переводу, выполненному человеком. Особенно хорошо заметно низкое качество МП между представителями разных языковых семей.
Актуальность данной работы обусловлена необходимостью дальнейшего усовершенствования систем МП и тем, что ошибки МП в языковой паре японский-русской до сих пор мало изучены в академической среде. Объектом исследования являются тексты, переведённые с помощью систем МП Google Translator и Yandex Переводчик. В качестве предмета исследования выступают особенности МП и ошибки, возникающие при использовании систем МП в языковой паре японский-русский на материале публицистических и художественных текстов.
Цель данной работы заключается в описании особенностей внутреннего устройства и работы систем МП, а также в рассмотрении ошибок МП с японского на русский язык.
Для достижения поставленной цели были определены следующие задачи:
1. Изучить подходы к определению понятий «перевод» и «машинный перевод» и историю появления МП.
2. Рассмотреть принципы работы современных систем МП.
3. Проанализировать типы ошибок в МП с японского на русский язык.
Теоретической базой для исследования послужили работы отечественных и зарубежных ученых, среди которых труды Бузаджи Д. М., Федорова А. В., Бархударова Л. С., Комиссарова В.Н., Рецкера Я.И., Сдобникова В.В., Петровой О.В., Нелюбина Л.Л., Дроздовой К.А., Раренко М.Б., Филинова Е.Н., Ревзина И.И., Захаровой Т.В., Шаляпина З.М., Головко Д.Р., Молчанова А.П., Нуриева В.А., Нагао М., Shieber S., Vasconcellos M., Brown P., Koehn P., Vilar D.
Материалом для проведения исследования стали публицистические тексты на японском языке, взятые из учебника «Японский для старших курсов» Чиронова С.В., а также отрывки из художественных произведений Акутагава Рюноскэ. В ходе работы анализировались и сравнивались переводы данных текстов, выполненные человеком, с переводами систем МП Google Translator и Yandex Переводчик.
Практическая ценность исследования заключается в возможности использования полученных результатов и анализа ошибок для дальнейшего усовершенствования систем МП.
Структура данной работы состоит из введения, трёх глав, заключения и приложения. Во введении обосновывается актуальность, практическая ценность, описывается объект и предмет исследования.
В первой главе рассматриваются различные точки зрения учёных на определения «перевода» и «машинного перевода», историю развития систем МП, а также типы МП. Вторая глава посвящена оценке МП, рассматриваются два подхода — автоматическая оценка и экспертная оценка качества перевода.
В третьей главе представлен анализ и классификация ошибок в МП с японского языка на русский. В заключении подводятся итоги работы и делаются выводы. В приложении представлена таблица классификации ошибок МП, а также анализируемые тексты на японском и их перевод на русский язык.
✅ Заключение
Как удалось выяснить в ходе данного исследования, большой проблемой для современных систем МП в паре японский-русский является перевод различных типов безличных предложений, где отсутствует подлежащее в оригинальном тексте. Такие ошибки особенно характерны для МП художественного текста. Опущение подлежащего в предложении, особенно, если оно выражено местоимением 1 и 2 лица, крайне распространённая практика в японском языке.
Также нам удалось зафиксировать пропуски слов в МП. Системы МП просто не видят определённые слова или словосочетания, скорее всего, потому что довольно редко их встречают при обучении.
Большую трудность при МП вызывает также выбор подходящего по смыслу слова в русском. Часто выбранный аналог либо не соответствует стилистике текста, либо не передаёт всю семантику японского слова, как случилось с переводом «разведывательного бурения», где система МП оставила только «бурение». Особые трудности при переводе представляют редкие имена собственные и мало употребляемая, специфическая лексика.
К тому же в паре японский-русский замечен целый ряд ошибок, связанный с тем, что системы МП не отражают в переводе категории модальности и семантические особенности некоторых грамматических конструкций.
Стоит отметить, что при анализе результатов МП не было найдено пунктуационных ошибок. Это свидетельствует о том, на наш взгляд, что нейронные сети, лежащие в основе современных систем МП, ориентируются на правила пунктуации языка-реципиента.





