Введение 4
Глава 1 Машинный перевод 6
1.1 История машинного перевода 6
1.2 Области использования машинного перевода 7
1.3 Китайско-русский машинный перевод 8
1.4 Качество перевода 9
1.4.1 Экспертная оценка 10
1.4.2 Автоматическая оценка 11
1.5 Удобочитаемость или readability 14
1.6 Типология ошибок машинного перевода 17
1.6.1 Пропущенные слова 18
1.6.2 Неправильный порядок слов 19
1.6.3 Неверные слова 19
1.6.4 Неизвестные слова 20
1.6.5 Пунктуация 20
1.7 Обзор современных систем машинного перевода 20
Выводы по главе 1 22
Глава 2 Сопоставительный анализ 24
2.1 Материал и методология исследования 24
2.2 Подготовка практического материала 24
2.3 Анализ 30
2.3.1 Синтаксические ошибки 30
2.3.2 Лексические ошибки 32
2.3.2.1 Лексические ошибки при переводе многозначных лексических единиц32
2.3.2.2 Лексические ошибки на примерах неправильного личных имен 34
2.3.2.3 Лексические ошибки на примерах неверного перевода имен
собственных 35
2.3.3 Неверный перевод фразеологизмов 37
2.3.4 Орфографические ошибки 38
Выводы по главе 2 39
Заключение 41
Библиографический список 42
Приложение 1 46
Приложение 2 147
Современное информационное общество развивается очень стремительно и это отражается в изменениях в различных сферах деятельности и жизни людей. Люди понимают, что разнообразная информация и различные научные знания будут составлять будущий стратегический потенциал, а не какие-либо вещества и энергия.
Развитие компьютерных технологий дало возможность использовать перевод, который строится на использовании компьютером постоянных и определенных соответствий между словами и грамматическими явлениями разных языков для определенного вида материала.
Актуальность данного исследования заключается в том, что в наши дни становится все больше и больше становится, которую нужно оперативно переводить. Именно поэтому современные системы машинного перевода пользуются большой популярностью в наши дни. Люди ходят получить результат в тот же момент, когда это им потребуется, пусть даже и не идеальный. Системы машинного перевода доступны везде, на телефонах, компьютерах и планшетах, и вы можете ими пользоваться даже если у вас нет интернета в данный момент.
За последние годы влияние Китая в мире значительно увеличилось и количество информации, которую нужно переводить тоже. А так как китайский язык знают далеко не все, то людям приходится прибегать к помощи онлайн переводчиков, чтобы перевести нужный им фрагмент или же пообщаться с человеком из Китая.
Объектом исследования является системы машинного перевода, в то время как предмет - это перевод осуществлённый системами перевода.
Цель настоящего исследования заключается в том, чтобы найти и классифицировать ошибки в современных системах и разобраться в причинах их возникновения. Вследствие чего появляются следующие задачи:
1) Определение понятий
2) Описание основных особенностей систем машинного перевода.
3) Анализ перевода и классификация ошибок.
Материалом исследования послужили параллельные тексты на китайском языке.
Для решения поставленных задач былииспользованы следующие методы:
1) Сбор параллельного корпуса.
2) Анализ переводов машинных систем.
3) Классификация ошибок.
Теоретическая значимость исследования заключается в попытке собрать и систематизировать информацию об ошибках современных систем машинного перевода.
Практическая значимость состоит в том, что разработка системы оценки качества машинного перевода позволяет выявить и систематизировать все недостатки компьютерных программ с целью их дальнейшего совершенствования.
Структура и объем работы. Дипломная работа состоит из введения, двух глав, заключения, библиографического списка и приложения.
Наибольшие проблемы при машинном переводе связаны с семантикой, так как при переводе семантических конструкций необходимы базы данных, которые в настоящее время не разработаны. Помимо этого, немалые затруднения вызывают переводы сложных грамматических, синтаксических и лексических конструкций.
Полученные данные при исследовании могут быть систематизированы и использованы в избавлении недостатков в современных системах машинного перевода.
Современные машинные системы перевода - это удобный инструмент, если вам нужно получить желаемый результат с неплохим качеством в короткое время. Системы перевода за последние несколько лет прошли большой путь: от невозможности перевести простое предложение правильно, до момента, когда их перевод получается не хуже, чем у человека. Наиболее перспективным, на мой взгляд, кажется Гугл переводчик, потому что он использует нейросетевой подход, который позволяет учиться и запоминать переводы, а также, что разработкой этого переводчик занимается крупнейшая компания с неограниченными ресурсами. Немало важно Гугл переводчик сочетает в себе приемлемую скорость перевода и качество перевода, а также бесплатную возможность для автоматизации процесса перевода. Яндекс Переводчик хоть и справляется быстрее всех, но от этого страдает качество получаемого результата. Но и нельзя отметать Промт переводчик. Хоть он и не блистает скоростью перевода, но выдает приемлемый результат.