ОСОБЕННОСТИ НАЦИОНАЛЬНОГО КОРПУСА НЕМЕЦКОГО ЯЗЫКА (ЭЛЕКТРОННЫЕ РЕСУРСЫ)
|
ВВЕДЕНИЕ
1. ИСТОРИЧЕСКИЕИ ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИССЛЕДОВАНИЯ КОРПУСНОЙ ЛИНГВИСТИКИ 7
1.1 История зарождения корпусной лингвистики и определение основных
понятий лингвистического корпуса 7
1.2 Основные задачи и направления корпусной лингвистики 18
1.3 Лингвистические исследования на базе корпусов 23
2. РОЛЬ НАЦИОНАЛЬНЫХ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ ПРИ
ОСУЩЕСТВЛЕНИИ ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ 31
2.1 Типология основных лингвистических корпусов 31
2.2 Параллельное использование Национального корпуса русского языка
при работе с иностранными лингвистическими корпусами 37
2.3 Особенности функционирования Национального корпуса немецкого языка 44
Заключение 59
Список использованных источников 63
Приложение 1 67
Приложение 2 70
Приложение 3. Профильные коллективы, опыт которых был использован для Национального корпуса русского языка
1. ИСТОРИЧЕСКИЕИ ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИССЛЕДОВАНИЯ КОРПУСНОЙ ЛИНГВИСТИКИ 7
1.1 История зарождения корпусной лингвистики и определение основных
понятий лингвистического корпуса 7
1.2 Основные задачи и направления корпусной лингвистики 18
1.3 Лингвистические исследования на базе корпусов 23
2. РОЛЬ НАЦИОНАЛЬНЫХ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ ПРИ
ОСУЩЕСТВЛЕНИИ ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ 31
2.1 Типология основных лингвистических корпусов 31
2.2 Параллельное использование Национального корпуса русского языка
при работе с иностранными лингвистическими корпусами 37
2.3 Особенности функционирования Национального корпуса немецкого языка 44
Заключение 59
Список использованных источников 63
Приложение 1 67
Приложение 2 70
Приложение 3. Профильные коллективы, опыт которых был использован для Национального корпуса русского языка
Применение Национального корпуса немецкого языка существенно повышает качество изучения и анализа немецкого дискурса и является ярким примером объекта корпусной лингвистики, которая рассматривает текстовые массивы как поле изучения и как источник фактов для лингвистического описания и аргументации. Корпусная лингвистика занимается в основном описанием и объяснением сущности, структуры и использования языка, а также более частными вопросами: изучение языков, их изменение и т.п. Однако корпусная лингвистика стоит в языкознании несколько особняком. Можно отметить, что часто она ограничивается изучением скорее лексики и лексической грамматики, нежели синтаксиса. В чём-то это результат использования методики конкордансов - ширины экрана или печатного листа (обычно 130 символов) просто не хватает на то, чтобы анализировать синтаксис или дискурс.
Данная работа посвящена исследованию особенностей и потенциальных возможностей использования национального корпуса немецкого языка при переводе текстов с тем, чтобы найти способ устранения ошибок, заключающихся в употреблении таких конструкций и принятии таких решений, которые не являются очевидным выбором носителя языка. К ним относятся проблемы лексико-грамматической сочетаемости, орфографические, пунктуационные трудности и трудности, связанные с выбором оптимальной грамматической конструкции.
Дискретный характер таких ошибок, сложность их восприятия и оценки переводчиком, происходящее в основном на интуитивном уровне, свидетельствуют о том, что решение не может быть найдено традиционным способом с помощью справочных материалов и словарей. Все переводчики, и прежде всего начинающие, испытывают профессиональную необходимость в ресурсе, потенциал которого позволил бы выявить факторы, влияющий на качество переводного текста.
Актуальность настоящего исследования определяется: потребностью в описании применения, изучения алгоритмов по применению национального корпуса немецкого языка и создания рекомендаций для использования национального корпуса русского языка, что вызвано отсутствием готовых ресурсов данного типа.
Первый корпусный словарь на основе базы лингвистических данных Bank of English был разработан в 1980 году в рамках проекта COBUILD университета Бирмингема. Первые опыты по привлечению лингвистической наглядности корпуса были предприняты Т. Джонсом в рамках «обучения с помощью базы данных» (Т. Johns, Ph. King), что оказало существенное влияние на формирование «компьютерного обучения» и возникновение «лексического подхода» в обучении (М. Lewis). Психологические основы этого подхода разрабатывались с учетом теории схем Ф. Бартлетта, идей психологии обучения Л.С. Выготского, а также когнитивного течения в психологии, восходящего к работам Ж. Пиаже, Дж. Келли.
К вопросу исходных положений отбора лексики обращались в своих работах Г. Пальмер, А.С. Герд, Р.Г. Пиотровский, Л.В. Щерба, И.В. Рахманов, С.Ф. Шатилов, Р. Ладо, Б.А. Лапидус, М.А. Марусенко, Т.А. Лаздинь и др. В трудах этих ученых была также сформулирована необходимость научного отбора лексики и сформированы первые научно обоснованные лексические минимумы. Базовые направления в создании инновационной среды с привлечением баз данных и других цифровых ресурсов были заложены в научно-педагогической школе Р.Г. Пиотровского и развиваются Л.Н. Беляевой, E.C. Полат, П.В. Сысоевым, М.В. Евстигнеевым и др.
Вопросами выделения профессионального терминологического слоя лексики с помощью методов статистической оценки небольших корпусов текстов и статистикой речи занимались М.А. Марусенко, Т.А. Лаздинь и другие представители Санкт-Петербургской школы математической лингвистики (И.В. Азарова, А.О. Гребенников, О.Н. Гринбаум, Л.Н. Засорина, В.П. Захаров, Г.Я. Мартыненко, А.С. Герд и др.).
В последние десятилетия изучение теоретических и практических вопросов, связанных с использованием корпусных ресурсов в обучении иностранному языку, включая аудиторное корпусное обучение, развивается в рамках корпусной лингводидактики — междисциплинарного направления, в разработку которого вносят свой вклад исследователи отечественных и зарубежных школ: Н.Б. Гвишиани, Е.Е. Голубкова, Т.Б. Назарова, Т.А. Клепикова, С.О. Савчук, Т.В. Толстова, О.В. Нагель, В.П. Захаров, В.В. Рыков, Р.П. Мильруд, В. А. Плунгян, С. Браун, Т. Джонс, Р. Реппен, Д. Кристал, М. Льюс, Р. Картер, М. Маккарти, К. Триббл, М. Скотт, К. Лакман, С. Конрад, М. Хоуи, Л. Флаурдью, Д. Байбер, С. Йохансон, Дж. Лич, М. Дейвис и многие другие.
Актуальность и недостаточная разработанность данной проблемы обусловили выбор объекта, предмета и цели работы.
Объектом исследования является Национальный корпус немецкого языка. Сложный и многосторонний характер данного объекта обусловливает необходимость выделения предмета исследования, который сводится к процессу поиска лингвистической информации и принятия переводческого решения с помощью тематического электронного корпуса.
Цель работы заключается в том, чтобы определить особенности Национального корпуса немецкого языка.
Для достижения этой цели необходимо решить следующие задачи:
- изучить историю зарождения корпусной лингвистики и определение основных понятий лингвистического корпуса;
- рассмотреть основные задачи и направления корпусной лингвистики; оценить основные лингвистические исследования на базе корпусов;
- показать типологию основных лингвистических корпусов; оценить применение параллельного корпуса и его использование с Национальным корпусом русского языка при работе с иностранными лингвистическими корпусами;
- выявить особенности функционирования Национального корпуса немецкого языка.
При решении поставленных задач в данной работе применялись различные лингвистические методы исследования, включая историко-аналитический метод и интроспективный метод фиксации размышлений вслух (англ. think-aloud protocols).
Практическая значимость исследования состоит в том, что полученные результаты могут найти применение в подготовке переводчиков и практике специалистов, что значительно расширяет возможности применения корпусного подхода.
Работа состоит из введения, двух глав, заключения, списка используемой литературы, а также приложения.
Данная работа посвящена исследованию особенностей и потенциальных возможностей использования национального корпуса немецкого языка при переводе текстов с тем, чтобы найти способ устранения ошибок, заключающихся в употреблении таких конструкций и принятии таких решений, которые не являются очевидным выбором носителя языка. К ним относятся проблемы лексико-грамматической сочетаемости, орфографические, пунктуационные трудности и трудности, связанные с выбором оптимальной грамматической конструкции.
Дискретный характер таких ошибок, сложность их восприятия и оценки переводчиком, происходящее в основном на интуитивном уровне, свидетельствуют о том, что решение не может быть найдено традиционным способом с помощью справочных материалов и словарей. Все переводчики, и прежде всего начинающие, испытывают профессиональную необходимость в ресурсе, потенциал которого позволил бы выявить факторы, влияющий на качество переводного текста.
Актуальность настоящего исследования определяется: потребностью в описании применения, изучения алгоритмов по применению национального корпуса немецкого языка и создания рекомендаций для использования национального корпуса русского языка, что вызвано отсутствием готовых ресурсов данного типа.
Первый корпусный словарь на основе базы лингвистических данных Bank of English был разработан в 1980 году в рамках проекта COBUILD университета Бирмингема. Первые опыты по привлечению лингвистической наглядности корпуса были предприняты Т. Джонсом в рамках «обучения с помощью базы данных» (Т. Johns, Ph. King), что оказало существенное влияние на формирование «компьютерного обучения» и возникновение «лексического подхода» в обучении (М. Lewis). Психологические основы этого подхода разрабатывались с учетом теории схем Ф. Бартлетта, идей психологии обучения Л.С. Выготского, а также когнитивного течения в психологии, восходящего к работам Ж. Пиаже, Дж. Келли.
К вопросу исходных положений отбора лексики обращались в своих работах Г. Пальмер, А.С. Герд, Р.Г. Пиотровский, Л.В. Щерба, И.В. Рахманов, С.Ф. Шатилов, Р. Ладо, Б.А. Лапидус, М.А. Марусенко, Т.А. Лаздинь и др. В трудах этих ученых была также сформулирована необходимость научного отбора лексики и сформированы первые научно обоснованные лексические минимумы. Базовые направления в создании инновационной среды с привлечением баз данных и других цифровых ресурсов были заложены в научно-педагогической школе Р.Г. Пиотровского и развиваются Л.Н. Беляевой, E.C. Полат, П.В. Сысоевым, М.В. Евстигнеевым и др.
Вопросами выделения профессионального терминологического слоя лексики с помощью методов статистической оценки небольших корпусов текстов и статистикой речи занимались М.А. Марусенко, Т.А. Лаздинь и другие представители Санкт-Петербургской школы математической лингвистики (И.В. Азарова, А.О. Гребенников, О.Н. Гринбаум, Л.Н. Засорина, В.П. Захаров, Г.Я. Мартыненко, А.С. Герд и др.).
В последние десятилетия изучение теоретических и практических вопросов, связанных с использованием корпусных ресурсов в обучении иностранному языку, включая аудиторное корпусное обучение, развивается в рамках корпусной лингводидактики — междисциплинарного направления, в разработку которого вносят свой вклад исследователи отечественных и зарубежных школ: Н.Б. Гвишиани, Е.Е. Голубкова, Т.Б. Назарова, Т.А. Клепикова, С.О. Савчук, Т.В. Толстова, О.В. Нагель, В.П. Захаров, В.В. Рыков, Р.П. Мильруд, В. А. Плунгян, С. Браун, Т. Джонс, Р. Реппен, Д. Кристал, М. Льюс, Р. Картер, М. Маккарти, К. Триббл, М. Скотт, К. Лакман, С. Конрад, М. Хоуи, Л. Флаурдью, Д. Байбер, С. Йохансон, Дж. Лич, М. Дейвис и многие другие.
Актуальность и недостаточная разработанность данной проблемы обусловили выбор объекта, предмета и цели работы.
Объектом исследования является Национальный корпус немецкого языка. Сложный и многосторонний характер данного объекта обусловливает необходимость выделения предмета исследования, который сводится к процессу поиска лингвистической информации и принятия переводческого решения с помощью тематического электронного корпуса.
Цель работы заключается в том, чтобы определить особенности Национального корпуса немецкого языка.
Для достижения этой цели необходимо решить следующие задачи:
- изучить историю зарождения корпусной лингвистики и определение основных понятий лингвистического корпуса;
- рассмотреть основные задачи и направления корпусной лингвистики; оценить основные лингвистические исследования на базе корпусов;
- показать типологию основных лингвистических корпусов; оценить применение параллельного корпуса и его использование с Национальным корпусом русского языка при работе с иностранными лингвистическими корпусами;
- выявить особенности функционирования Национального корпуса немецкого языка.
При решении поставленных задач в данной работе применялись различные лингвистические методы исследования, включая историко-аналитический метод и интроспективный метод фиксации размышлений вслух (англ. think-aloud protocols).
Практическая значимость исследования состоит в том, что полученные результаты могут найти применение в подготовке переводчиков и практике специалистов, что значительно расширяет возможности применения корпусного подхода.
Работа состоит из введения, двух глав, заключения, списка используемой литературы, а также приложения.
Данная работа посвящена исследованию потенциальных возможностей использования национального корпуса немецкого языка при переводе текстов с тем, чтобы найти способ устранения ошибок, заключающихся в употреблении таких конструкций и принятии таких решений, которые не являются очевидным выбором носителя языка.
Развитие интернет-технологий значительно облегчило доступ к различным корпусам аутентичных текстов и позволило интенсифицировать применение лингвистического корпуса в обучении иностранным языкам
Тематический электронный корпус текстов - это эффективный инструмент, который дает возможность переводчику осуществлять автоматический поиск необходимой лингвистической информации и оперативно решать различные переводческие проблемы, возникающие в процессе перевода, например, военно-технических текстов на иностранный язык.
Немаловажным критерием при определении корпуса выступает также и простота его использования, другими словами, корпус должен быть обеспечен специализированной поисковой системой, которая должна быть (в идеальном случае) довольно понятна и проста в использовании. Так, предлагаемая поисковая система в Мангеймском корпусе немецкого языка довольно сложна в использовании, в то время как при использовании Национального корпуса русского языка, Британского национального корпуса и Банка английского языка особых трудностей не возникает.
Эффективность поиска информации в корпусе текстов зависит от специального программного обеспечения - так называемых корпус-менеджеров, или программ-конкордансеров. Широкие функциональные возможности программ-конкордансеров ограничиваются сложностью поиска лингвистической информации в корпусе текстов, который зависит от того, насколько переводчик способен выдвигать предположения о возможных вариантах перевода, служащих основой для составления запросов в процессе поиска лингвистической информации.
Поиск лингвистической информации с помощью электронного корпуса текстов и программы-конкордансера полностью оправдывает себя только на этапе проверки вариантов перевода, генерируемых переводчиком в процессе работы над текстом перевода.
Корпус должен сокращать количество времени, необходимое на поиск конкретного явления, а не предлагать сложный алгоритм этого поиска, ознакомление с основными пунктами которого требует подчас чисто технических и математических знаний.
Существенным признаком лингвистического корпуса текстов является наличие или отсутствие разметки, так как для решения лингвистических задач наличия простого массива текстов недостаточно, например, в Мангеймском корпусе немецкого языка морфологическая разметка присутствует в основном в подкорпусах публицистических текстов.
Деятельность в рамках корпусной лингвистики может быть сведена к созданию корпусов и к лингвистическим исследованиям на их базе (все задачи по изучению больших массивов текстов).
Особый интерес представляют параллельные или многоязычные корпусы, особенно «выровненные» или «сопоставленные» (aligned). В «выровненном корпусе» каждой фразе на одном языке соответствует её эквивалент на другом языке или языках. Такие корпусы используются при подготовке переводчиков или при создании двуязычных словарей. Очень важны они для создания систем автоматического машинного перевода (если такая система опирается на корпус переводов, сделанных переводчиками-людьми, её качество будет гораздо выше). Кроме того, такой корпус можно использовать для исследований, связанных со сравнением оригинальных и переводных текстов.
Крайне важным остается применение параллельных корпусов. Под корпусом параллельных текстов понимается тип лингвистического корпуса, состоящий из исходного текста на одном языке и его перевода на другой или другие языки.
Уровень языковой компетенции, необходимый для работы с корпусом текстов, носит относительный характер. Так, для переводчиков, использующих корпус текстов в профессиональной деятельности, этот уровень предполагает глубокую языковую подготовку, тогда как требования к учащимся, выполняющим перевод в целях получения практического опыта, ниже и подразумевают знание грамматики и большой словарный запас для генерирования возможных вариантов перевода.
При работе с любимым иностранным корпусом очень важно умнеть пользоваться отечественным Национальным корпусом русского языка.
Применение национального корпуса немецкого языка при обучении иностранным языкам дает возможность наблюдать и оценивать употребление различных словосочетаний и словообразований непосредственно носителями изучаемого языка, т. е. изучать «живой язык» и «живую речь»; быстро и качественно разрабатывать упражнения и задания по различным лексическим и грамматическим темам; выполнять учебно-исследовательскую работу на материалах корпуса. Показанные в данной работе способы использования национального корпуса в изучении немецкого языка представляют собой попытку исследовать богатые методические возможности корпусных методик изучения иностранных языков.
Проанализировав Национальный корпус немецкого языка, можно заключить, что Национальный корпус имеет две важные особенности:
1. Он характеризуется представительностью, или сбалансированным составом текстов.
2. Корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию).
Корпус используются, прежде всего, при:
• исследовании различных языковых разновидностей; проверке лингвистических теорий;
• составлении словарей, грамматических справочников и т.п.;
• изучении и преподавании иностранных языков (составление учебных пособий, упражнений, доступ к аутентичным материалам);
• переводе (проверка сочетаемости слов, стилистических особенностей);
• социолингвистике: сравнение языков разных социальных групп.
Отличительной особенностью исследования является то, что в нем подробно описан процесс и особенности использования корпуса немецкого языка на примере Цифрового словаря немецкого языка (DWDS).
Полученные результаты могут использоваться для поиска новых подходов к проблеме оптимизации письменного перевода. В работе рассмотрены не только различные варианты использования тематических корпусов текстов, но и представлены систематизированные рекомендации по применению самих запросов. Значимость работы также заключается в обосновании необходимости широкого использования специализированных электронных корпусов текстов с целью формирования навыков письменного перевода на иностранный язык.
Развитие интернет-технологий значительно облегчило доступ к различным корпусам аутентичных текстов и позволило интенсифицировать применение лингвистического корпуса в обучении иностранным языкам
Тематический электронный корпус текстов - это эффективный инструмент, который дает возможность переводчику осуществлять автоматический поиск необходимой лингвистической информации и оперативно решать различные переводческие проблемы, возникающие в процессе перевода, например, военно-технических текстов на иностранный язык.
Немаловажным критерием при определении корпуса выступает также и простота его использования, другими словами, корпус должен быть обеспечен специализированной поисковой системой, которая должна быть (в идеальном случае) довольно понятна и проста в использовании. Так, предлагаемая поисковая система в Мангеймском корпусе немецкого языка довольно сложна в использовании, в то время как при использовании Национального корпуса русского языка, Британского национального корпуса и Банка английского языка особых трудностей не возникает.
Эффективность поиска информации в корпусе текстов зависит от специального программного обеспечения - так называемых корпус-менеджеров, или программ-конкордансеров. Широкие функциональные возможности программ-конкордансеров ограничиваются сложностью поиска лингвистической информации в корпусе текстов, который зависит от того, насколько переводчик способен выдвигать предположения о возможных вариантах перевода, служащих основой для составления запросов в процессе поиска лингвистической информации.
Поиск лингвистической информации с помощью электронного корпуса текстов и программы-конкордансера полностью оправдывает себя только на этапе проверки вариантов перевода, генерируемых переводчиком в процессе работы над текстом перевода.
Корпус должен сокращать количество времени, необходимое на поиск конкретного явления, а не предлагать сложный алгоритм этого поиска, ознакомление с основными пунктами которого требует подчас чисто технических и математических знаний.
Существенным признаком лингвистического корпуса текстов является наличие или отсутствие разметки, так как для решения лингвистических задач наличия простого массива текстов недостаточно, например, в Мангеймском корпусе немецкого языка морфологическая разметка присутствует в основном в подкорпусах публицистических текстов.
Деятельность в рамках корпусной лингвистики может быть сведена к созданию корпусов и к лингвистическим исследованиям на их базе (все задачи по изучению больших массивов текстов).
Особый интерес представляют параллельные или многоязычные корпусы, особенно «выровненные» или «сопоставленные» (aligned). В «выровненном корпусе» каждой фразе на одном языке соответствует её эквивалент на другом языке или языках. Такие корпусы используются при подготовке переводчиков или при создании двуязычных словарей. Очень важны они для создания систем автоматического машинного перевода (если такая система опирается на корпус переводов, сделанных переводчиками-людьми, её качество будет гораздо выше). Кроме того, такой корпус можно использовать для исследований, связанных со сравнением оригинальных и переводных текстов.
Крайне важным остается применение параллельных корпусов. Под корпусом параллельных текстов понимается тип лингвистического корпуса, состоящий из исходного текста на одном языке и его перевода на другой или другие языки.
Уровень языковой компетенции, необходимый для работы с корпусом текстов, носит относительный характер. Так, для переводчиков, использующих корпус текстов в профессиональной деятельности, этот уровень предполагает глубокую языковую подготовку, тогда как требования к учащимся, выполняющим перевод в целях получения практического опыта, ниже и подразумевают знание грамматики и большой словарный запас для генерирования возможных вариантов перевода.
При работе с любимым иностранным корпусом очень важно умнеть пользоваться отечественным Национальным корпусом русского языка.
Применение национального корпуса немецкого языка при обучении иностранным языкам дает возможность наблюдать и оценивать употребление различных словосочетаний и словообразований непосредственно носителями изучаемого языка, т. е. изучать «живой язык» и «живую речь»; быстро и качественно разрабатывать упражнения и задания по различным лексическим и грамматическим темам; выполнять учебно-исследовательскую работу на материалах корпуса. Показанные в данной работе способы использования национального корпуса в изучении немецкого языка представляют собой попытку исследовать богатые методические возможности корпусных методик изучения иностранных языков.
Проанализировав Национальный корпус немецкого языка, можно заключить, что Национальный корпус имеет две важные особенности:
1. Он характеризуется представительностью, или сбалансированным составом текстов.
2. Корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию).
Корпус используются, прежде всего, при:
• исследовании различных языковых разновидностей; проверке лингвистических теорий;
• составлении словарей, грамматических справочников и т.п.;
• изучении и преподавании иностранных языков (составление учебных пособий, упражнений, доступ к аутентичным материалам);
• переводе (проверка сочетаемости слов, стилистических особенностей);
• социолингвистике: сравнение языков разных социальных групп.
Отличительной особенностью исследования является то, что в нем подробно описан процесс и особенности использования корпуса немецкого языка на примере Цифрового словаря немецкого языка (DWDS).
Полученные результаты могут использоваться для поиска новых подходов к проблеме оптимизации письменного перевода. В работе рассмотрены не только различные варианты использования тематических корпусов текстов, но и представлены систематизированные рекомендации по применению самих запросов. Значимость работы также заключается в обосновании необходимости широкого использования специализированных электронных корпусов текстов с целью формирования навыков письменного перевода на иностранный язык.



