Тема: ОЦЕНКА КАЧЕСТВА МАШИННОГО ПЕРЕВОДА НА ПРИМЕРЕ ВЕБ-СЛУЖБЫ GOOGLE ПЕРЕВОДЧИК
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
1 Машинный перевод 6
1.1 История развития машинного перевода и основные понятия 6
1.2. Веб-служба Google Переводчик 15
1.3. Методы оценки качества машинного перевода 18
Выводы по главе 1 27
2 Оценка качества машинного перевода, выполненного службой Google
Переводчик 28
2.1. Анализ машинного перевода для языковой пары русский-
французский 28
2.2. Анализ машинного перевода для языковой пары английский-
французский 44
Выводы по главе 2 54
Заключение 55
Список использованных источников и литературы 58
Приложения 64
📖 Введение
В современном информационном обществе растущая роль компьютерных технологий неоспорима. Автоматизация проникла в большинство сфер науки и техники, не исключая и гуманитарные науки. При помощи технологий ученые пытаются решить проблемы, которые долгое время считались подвластными лишь человеку. Однако, машины и искусственный интеллект (ИИ) заняли место человека не только в промышленности и в области обработки огромных объемов информации, но и в таких сферах как, например, медицина и сельское хозяйство. Более того, технология ИИ продолжает активно развиваться и сегодня существуют ИИ, которые без труда проходят тест Тьюринга.1
Среди сфер применения ИИ находятся в том числе лингвистика и переводоведение. Компьютерная лингвистика - область языкознания, которая занимается автоматическим анализом естественного языка. На сегодняшний день это молодое направление является самым развивающимся в сфере языкознания. В рамках этого направления разрабатываются системы распознавания устной речи, голосового ввода и поиска информации, а также развиваются системы машинного (автоматического) перевода.
Считается, что машинный перевод не сравним по качеству с переводом, выполняемым людьми. В данной работе мы попытаемся понять так ли это на самом деле, на какой стадии развития находится машинный перевод в настоящее время и какие перспективы его дальнейшего развития.
Существуют множество современных систем машинного перевода, однако Google Переводчик является одной из самых популярных и доступных систем на сегодняшний день, он демонстрирует впечатляющие результаты по качеству и скорости перевода, что объясняет актуальность данной работы. Google Переводчик является одной из первых систем нейронного машинного перевода.
Новизна данного исследования состоит в рассмотрении малоизученных аспектов активно развивающихся систем нейронного машинного перевода.
Таким образом, темой данной работы является оценка качества машинного перевода на примере веб-сервиса Google Переводчик.
Цель данной работы заключается в выявлении особенностей современных систем машинного перевода и оценке качества машинного перевода.
Цель определила следующие задачи:
1. Рассмотреть историю развития систем автоматического перевода;
2. Рассмотреть особенности функционирования современных систем машинного перевода и их классификацию;
3. Изучить методы оценки качества машинного перевода;
4. Выявить достоинства и недостатки перевода, выполненные службой Google Переводчик;
5. Изучить влияние систем машинного перевода на современную переводческую деятельность.
Объектом исследования является машинный перевод.
Предметом исследования является анализ и оценка качества машинного перевода, осуществляемого веб-службой Google Переводчик.
В работе используются следующие методы: анализ теоретической литературы по изучаемой проблеме, сравнительно-сопоставительный анализ.
В качестве материала для анализа были выбраны статьи с официального новостного сайта ООН (https://news.un.org): две статьи на французском языке для перевода на русский, две статьи на русском языке для перевода на французский, одна статья на французском языке для перевода на английский и одна статья на английском языке для перевода на французский.
В данной дипломной работе мы опирались на труды как лингвистов (В.С. Виноградов, В.Н. Комиссаров, Ю.Н. Марчук, В.Г. Гак ), так и ученых, работающих над разработкой систем машинного перевода (F. Och , Y. Wu , M. Schuster).
...
✅ Заключение
В рамках работы над второй задачей был рассмотрен термин «машинный перевод», а также выделены существующие методы функционирования современных систем машинного перевода (МП на основе правил; МП на основе примеров; статистический МП; нейронный МП).
Кроме того, в настоящей работе была рассмотрена классификация систем МП и были разграничены понятия «автоматизированный перевод» и «машинный перевод».
В рамках третьей задачи были изучены методы оценки качества машинного перевода, среди которых были рассмотрены автоматическая оценка МП и оценка МП, выполняемая человеком.
В данной работе также были рассмотрены термины «эквивалентность», «адекватность», «буквальный перевод». Были приведены классификации переводческих и речевых ошибок. В настоящей работе анализ качества перевода проводится по методике выявления и квалификации переводческих ошибок. Для оценивания были выбраны следующие критерии: лексикосемантические ошибки, синтаксические ошибки, морфологические ошибки и стилистические ошибки. Наряду с этими критериями рассматривается также удачные решения в переводе, эквивалентность оригиналу и адекватность переведенного текста.
При работе над четвертой задачей был проанализирован перевод шести статей для двух пар языков: французский-русский, французский-английский.
По итогам анализа машинного перевода статей были сделаны следующие выводы. Во-первых, были выявлены недостатки системы машинного перевода:
1. Дословный перевод;
2. Непредсказуемость в принятии решений и выборе эквивалентов;
3. Системы МП не учитывают контекст за рамками одного предложения.
Помимо этого, были рассмотрены следующие достоинства машинного перевода:
1. Скорость перевода;
2. Доступность;
3. Высокий уровень эквивалентности на уровне цели коммуникации.
Перевод понятен, соблюдается эквивалентность перевода на уровне цели коммуникации, не было выявлено серьезного искажения смысла.
Стоит отметить, что для каждого языка наблюдаются свои особенности. Так, например, качество перевода для языковой пары французский-русский значительно ниже, чем для языковой пары английский-французский. Это объясняется как особенностями русского языка (например, свободный порядок слов), которые вызывают трудности при переводе, так и схожестью структуры английского и французского языков.
Кроме того, важно учитывать, что для машинного переводчика существуют различные ограничения. Например, наличие в тексте оригинала слов на языке, отличном от заданного, затрудняет перевод - такие слова остаются не переведенными. Еще одним ограничением для систем машинного перевода являются редкие слова, например, имена людей.
Наконец, в рамках решения заключительной задачи установлено, что с
введением систем нейронного машинного перевода качество машинного перевода значительно возросло. Благодаря таким системам, машинный перевод стал более «естественным», снизилось количество ошибок, что ведет к сокращению времени, требуемого для постредактирования текста и исправления ошибок. Такой перевод вызывает большего доверия и в будущем переводчики и обычные пользователи все чаще будут прибегать к автоматическому переводу.
По итогам исследования была достигнута его цель, а именно были выявлены особенности машинного перевода и современных систем машинного перевода.
Результаты данного исследования могут мотивировать новые исследования в области разработок систем МП, например, с целью устранения существующих недостатков подобных систем.
Дальнейшее исследование данной темы способно популяризовать работу в данном направлении в научном сообществе, оно потенциально позволит наверстать упущенное в области разработок систем машинного перевода в России и повысить регулярность проведения исследований в сфере компьютерной лингвистики.





