ВВЕДЕНИЕ
1. ИСТОРИЧЕСКИЕИ ТЕОРЕТИЧЕСКИЕ АСПЕКТЫ ИССЛЕДОВАНИЯ КОРПУСНОЙ ЛИНГВИСТИКИ 7
1.1 История зарождения корпусной лингвистики и определение основных
понятий лингвистического корпуса 7
1.2 Основные задачи и направления корпусной лингвистики 18
1.3 Лингвистические исследования на базе корпусов 23
2. РОЛЬ НАЦИОНАЛЬНЫХ ЛИНГВИСТИЧЕСКИХ КОРПУСОВ ПРИ
ОСУЩЕСТВЛЕНИИ ПЕРЕВОДЧЕСКОЙ ДЕЯТЕЛЬНОСТИ 31
2.1 Типология основных лингвистических корпусов 31
2.2 Параллельное использование Национального корпуса русского языка
при работе с иностранными лингвистическими корпусами 37
2.3 Особенности функционирования Национального корпуса немецкого языка 44
Заключение 59
Список использованных источников 63
Приложение 1 67
Приложение 2 70
Приложение 3. Профильные коллективы, опыт которых был использован для Национального корпуса русского языка
Применение Национального корпуса немецкого языка существенно повышает качество изучения и анализа немецкого дискурса и является ярким примером объекта корпусной лингвистики, которая рассматривает текстовые массивы как поле изучения и как источник фактов для лингвистического описания и аргументации. Корпусная лингвистика занимается в основном описанием и объяснением сущности, структуры и использования языка, а также более частными вопросами: изучение языков, их изменение и т.п. Однако корпусная лингвистика стоит в языкознании несколько особняком. Можно отметить, что часто она ограничивается изучением скорее лексики и лексической грамматики, нежели синтаксиса. В чём-то это результат использования методики конкордансов - ширины экрана или печатного листа (обычно 130 символов) просто не хватает на то, чтобы анализировать синтаксис или дискурс.
Данная работа посвящена исследованию особенностей и потенциальных возможностей использования национального корпуса немецкого языка при переводе текстов с тем, чтобы найти способ устранения ошибок, заключающихся в употреблении таких конструкций и принятии таких решений, которые не являются очевидным выбором носителя языка. К ним относятся проблемы лексико-грамматической сочетаемости, орфографические, пунктуационные трудности и трудности, связанные с выбором оптимальной грамматической конструкции.
Дискретный характер таких ошибок, сложность их восприятия и оценки переводчиком, происходящее в основном на интуитивном уровне, свидетельствуют о том, что решение не может быть найдено традиционным способом с помощью справочных материалов и словарей. Все переводчики, и прежде всего начинающие, испытывают профессиональную необходимость в ресурсе, потенциал которого позволил бы выявить факторы, влияющий на качество переводного текста.
Актуальность настоящего исследования определяется: потребностью в описании применения, изучения алгоритмов по применению национального корпуса немецкого языка и создания рекомендаций для использования национального корпуса русского языка, что вызвано отсутствием готовых ресурсов данного типа.
Первый корпусный словарь на основе базы лингвистических данных Bank of English был разработан в 1980 году в рамках проекта COBUILD университета Бирмингема. Первые опыты по привлечению лингвистической наглядности корпуса были предприняты Т. Джонсом в рамках «обучения с помощью базы данных» (Т. Johns, Ph. King), что оказало существенное влияние на формирование «компьютерного обучения» и возникновение «лексического подхода» в обучении (М. Lewis). Психологические основы этого подхода разрабатывались с учетом теории схем Ф. Бартлетта, идей психологии обучения Л.С. Выготского, а также когнитивного течения в психологии, восходящего к работам Ж. Пиаже, Дж. Келли.
К вопросу исходных положений отбора лексики обращались в своих работах Г. Пальмер, А.С. Герд, Р.Г. Пиотровский, Л.В. Щерба, И.В. Рахманов, С.Ф. Шатилов, Р. Ладо, Б.А. Лапидус, М.А. Марусенко, Т.А. Лаздинь и др. В трудах этих ученых была также сформулирована необходимость научного отбора лексики и сформированы первые научно обоснованные лексические минимумы. Базовые направления в создании инновационной среды с привлечением баз данных и других цифровых ресурсов были заложены в научно-педагогической школе Р.Г. Пиотровского и развиваются Л.Н. Беляевой, E.C. Полат, П.В. Сысоевым, М.В. Евстигнеевым и др.
Вопросами выделения профессионального терминологического слоя лексики с помощью методов статистической оценки небольших корпусов текстов и статистикой речи занимались М.А. Марусенко, Т.А. Лаздинь и другие представители Санкт-Петербургской школы математической лингвистики (И.В. Азарова, А.О. Гребенников, О.Н. Гринбаум, Л.Н. Засорина, В.П. Захаров, Г.Я. Мартыненко, А.С. Герд и др.).
В последние десятилетия изучение теоретических и практических вопросов, связанных с использованием корпусных ресурсов в обучении иностранному языку, включая аудиторное корпусное обучение, развивается в рамках корпусной лингводидактики — междисциплинарного направления, в разработку которого вносят свой вклад исследователи отечественных и зарубежных школ: Н.Б. Гвишиани, Е.Е. Голубкова, Т.Б. Назарова, Т.А. Клепикова, С.О. Савчук, Т.В. Толстова, О.В. Нагель, В.П. Захаров, В.В. Рыков, Р.П. Мильруд, В. А. Плунгян, С. Браун, Т. Джонс, Р. Реппен, Д. Кристал, М. Льюс, Р. Картер, М. Маккарти, К. Триббл, М. Скотт, К. Лакман, С. Конрад, М. Хоуи, Л. Флаурдью, Д. Байбер, С. Йохансон, Дж. Лич, М. Дейвис и многие другие.
Актуальность и недостаточная разработанность данной проблемы обусловили выбор объекта, предмета и цели работы.
Объектом исследования является Национальный корпус немецкого языка. Сложный и многосторонний характер данного объекта обусловливает необходимость выделения предмета исследования, который сводится к процессу поиска лингвистической информации и принятия переводческого решения с помощью тематического электронного корпуса.
Цель работы заключается в том, чтобы определить особенности Национального корпуса немецкого языка.
Для достижения этой цели необходимо решить следующие задачи:
- изучить историю зарождения корпусной лингвистики и определение основных понятий лингвистического корпуса;
- рассмотреть основные задачи и направления корпусной лингвистики; оценить основные лингвистические исследования на базе корпусов;
- показать типологию основных лингвистических корпусов; оценить применение параллельного корпуса и его использование с Национальным корпусом русского языка при работе с иностранными лингвистическими корпусами;
- выявить особенности функционирования Национального корпуса немецкого языка.
При решении поставленных задач в данной работе применялись различные лингвистические методы исследования, включая историко-аналитический метод и интроспективный метод фиксации размышлений вслух (англ. think-aloud protocols).
Практическая значимость исследования состоит в том, что полученные результаты могут найти применение в подготовке переводчиков и практике специалистов, что значительно расширяет возможности применения корпусного подхода.
Работа состоит из введения, двух глав, заключения, списка используемой литературы, а также приложения.
Данная работа посвящена исследованию потенциальных возможностей использования национального корпуса немецкого языка при переводе текстов с тем, чтобы найти способ устранения ошибок, заключающихся в употреблении таких конструкций и принятии таких решений, которые не являются очевидным выбором носителя языка.
Развитие интернет-технологий значительно облегчило доступ к различным корпусам аутентичных текстов и позволило интенсифицировать применение лингвистического корпуса в обучении иностранным языкам
Тематический электронный корпус текстов - это эффективный инструмент, который дает возможность переводчику осуществлять автоматический поиск необходимой лингвистической информации и оперативно решать различные переводческие проблемы, возникающие в процессе перевода, например, военно-технических текстов на иностранный язык.
Немаловажным критерием при определении корпуса выступает также и простота его использования, другими словами, корпус должен быть обеспечен специализированной поисковой системой, которая должна быть (в идеальном случае) довольно понятна и проста в использовании. Так, предлагаемая поисковая система в Мангеймском корпусе немецкого языка довольно сложна в использовании, в то время как при использовании Национального корпуса русского языка, Британского национального корпуса и Банка английского языка особых трудностей не возникает.
Эффективность поиска информации в корпусе текстов зависит от специального программного обеспечения - так называемых корпус-менеджеров, или программ-конкордансеров. Широкие функциональные возможности программ-конкордансеров ограничиваются сложностью поиска лингвистической информации в корпусе текстов, который зависит от того, насколько переводчик способен выдвигать предположения о возможных вариантах перевода, служащих основой для составления запросов в процессе поиска лингвистической информации.
Поиск лингвистической информации с помощью электронного корпуса текстов и программы-конкордансера полностью оправдывает себя только на этапе проверки вариантов перевода, генерируемых переводчиком в процессе работы над текстом перевода.
Корпус должен сокращать количество времени, необходимое на поиск конкретного явления, а не предлагать сложный алгоритм этого поиска, ознакомление с основными пунктами которого требует подчас чисто технических и математических знаний.
Существенным признаком лингвистического корпуса текстов является наличие или отсутствие разметки, так как для решения лингвистических задач наличия простого массива текстов недостаточно, например, в Мангеймском корпусе немецкого языка морфологическая разметка присутствует в основном в подкорпусах публицистических текстов.
Деятельность в рамках корпусной лингвистики может быть сведена к созданию корпусов и к лингвистическим исследованиям на их базе (все задачи по изучению больших массивов текстов).
Особый интерес представляют параллельные или многоязычные корпусы, особенно «выровненные» или «сопоставленные» (aligned). В «выровненном корпусе» каждой фразе на одном языке соответствует её эквивалент на другом языке или языках. Такие корпусы используются при подготовке переводчиков или при создании двуязычных словарей. Очень важны они для создания систем автоматического машинного перевода (если такая система опирается на корпус переводов, сделанных переводчиками-людьми, её качество будет гораздо выше). Кроме того, такой корпус можно использовать для исследований, связанных со сравнением оригинальных и переводных текстов.
Крайне важным остается применение параллельных корпусов. Под корпусом параллельных текстов понимается тип лингвистического корпуса, состоящий из исходного текста на одном языке и его перевода на другой или другие языки.
Уровень языковой компетенции, необходимый для работы с корпусом текстов, носит относительный характер. Так, для переводчиков, использующих корпус текстов в профессиональной деятельности, этот уровень предполагает глубокую языковую подготовку, тогда как требования к учащимся, выполняющим перевод в целях получения практического опыта, ниже и подразумевают знание грамматики и большой словарный запас для генерирования возможных вариантов перевода.
При работе с любимым иностранным корпусом очень важно умнеть пользоваться отечественным Национальным корпусом русского языка.
Применение национального корпуса немецкого языка при обучении иностранным языкам дает возможность наблюдать и оценивать употребление различных словосочетаний и словообразований непосредственно носителями изучаемого языка, т. е. изучать «живой язык» и «живую речь»; быстро и качественно разрабатывать упражнения и задания по различным лексическим и грамматическим темам; выполнять учебно-исследовательскую работу на материалах корпуса. Показанные в данной работе способы использования национального корпуса в изучении немецкого языка представляют собой попытку исследовать богатые методические возможности корпусных методик изучения иностранных языков.
Проанализировав Национальный корпус немецкого языка, можно заключить, что Национальный корпус имеет две важные особенности:
1. Он характеризуется представительностью, или сбалансированным составом текстов.
2. Корпус содержит особую дополнительную информацию о свойствах входящих в него текстов (так называемую разметку, или аннотацию).
Корпус используются, прежде всего, при:
• исследовании различных языковых разновидностей; проверке лингвистических теорий;
• составлении словарей, грамматических справочников и т.п.;
• изучении и преподавании иностранных языков (составление учебных пособий, упражнений, доступ к аутентичным материалам);
• переводе (проверка сочетаемости слов, стилистических особенностей);
• социолингвистике: сравнение языков разных социальных групп.
Отличительной особенностью исследования является то, что в нем подробно описан процесс и особенности использования корпуса немецкого языка на примере Цифрового словаря немецкого языка (DWDS).
Полученные результаты могут использоваться для поиска новых подходов к проблеме оптимизации письменного перевода. В работе рассмотрены не только различные варианты использования тематических корпусов текстов, но и представлены систематизированные рекомендации по применению самих запросов. Значимость работы также заключается в обосновании необходимости широкого использования специализированных электронных корпусов текстов с целью формирования навыков письменного перевода на иностранный язык.
1. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика : учеб. пособие / Большакова Е.И., Клышинский Э .С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. — М.: МИЭМ, 2011. — 272 с.
2. Боярский К. К. Введение в компьютерную лингвистику. Учебное пособие. - СПб: НИУ ИТМО, 2013. - 72 с.
3. Буторина Е. П. Использование национального корпуса русского языка студентами-иностранцами // Национальный корпус русского языка и проблемы гуманитарного образования: материалы международной научной конференции. М.: ГУ-ВШЭ, 19-20 апреля 2007., с. 10
4. Вагнер В. Н. Методика преподавания русского языка англоговорящим и франкоговорящим: учеб. пособие для студ. высш. учеб. заведений. М.: Гуманит. изд. центр ВЛАДОС, 2001., с. 13
5. Кыркунова Л. Г., Ширинкина М. А. Использование НКРЯ в
преподавании речеведческих дисциплин в вузе // Национальный корпус русского языка и проблемы гуманитарного образования: материалы международной научной конференции. М.: ГУ-ВШЭ, 2007, с. 39
6. Левинзон А. И. Использование НКРЯ в преподавании русского языка иностранным студентам, специализирующим- ся в области экономики и финансов, с. 47
7. Мустайоки А. Роль корпусов в лингвистических исследованиях языков //, с. 58
8. Плунгян В. А. Зачем нужен Национальный корпус русского языка: неформальное введение [Электронный ресурс] // Национальный корпус русского языка: 2003-2005. М.: Индрик, 2005. URL: http: // ruscorpora.ru / sbomik2005 / 02plu.pdf
9. Плунгян В. А. Корпус как инструмент и как идеология //
Национальный корпус русского языка и проблемы гуманитарного образования: материалы международной научной конференции. М.: ГУ-ВШЭ, 19-20 апреля 2007, с. 64-66
10. Прилепская М. В. Из теории и практики формирования
межкультурной компетенции в билингвальной коммуникации // Третьи всероссийские Державинские чтения: сборник статей. М.: ГОУ ВПО РПА Минюста России, 2008. Кн. 8. Иностранный язык юридической специальности. Проблемы перевода и межкультурной коммуникации, с. 165
11. Шемякин Ю.И. Начала компьютерной лингвистики: Учеб. пособие. М.: Изд-во МГОУ, А/О "Росвузнаука", 1992
12. Славкова С Некоторые возможности использования НКРЯ в
преподавании русского языка иностранным студентам // Национальный корпус русского языка и проблемы гуманитарного образования: материалы международной научной конференции. М.: ГУ-ВШЭ, 19-20 апреля 2007, с. 69
13. Сысоев П.В. Дидактические свойства и функции современных информационных и коммуникационных технологий // Иностранные языки в школе. 2012. № 6, с. 16
14. Тирадо Р. Об использовании Национального корпуса русского языка в контрастивной лингвистике (на материалах испанского и русского языков, с. 20
Источники на иностранном языке
15. Aijmer K., Altenberg B., Johansson M. Language in contrast: Papers from a symposium on textbased cross-cultural studies. Lund, 1996.
16. Andrea Abel, Renata Zanin: Korpora in Lehre und Forschung. Bozen- Bolzano University Press, Bozen 2011,
17. Anke Ludeling, Merja Kyto: Corpus Linguistics. An International Handbook. Vol. 1, de Gruyter, Berlin/ New York 2008; Vol. 2, 2009.
18. Baker M. The role of corpora in investigating the linguistic behavior of professional translators // International Journal of Corpus Linguistics. 1999. № 4. P. 281-298
19. Center for Spoken Language Understanding, http://www. cslu.ogi.edu
20. D. Biber, «Variations across Speech and Writing»
21. European Language Resources Association, http://www.elra.info
22. Fortschritte in Sprach- und Textkorpusdesign und linguistischer
Korpusanalyse I. Komplette Ausgabe der Zeitschrift „Linguistik online“ Nr. 38 (2009) zur Korpuslinguistik
23. Fortschritte in Sprach- und Textkorpusdesign und linguistischer
Korpusanalyse II. Komplette Ausgabe der Zeitschrift „Linguistik online“ Nr. 39 (2009) zur Korpuslinguistik
24. Johansson S. On the role of corpora in crosslinguistic research // Corpora and cross-linguistic research. Amsterdam, 1999. P. 3-24
25. Korpuslinguistik im Zeitalter der Textdatenbanken. Komplette Ausgabe der Zeitschrift „Linguistik online“ Nr. 28 (2006) zur Korpuslinguistik
26. Lemnitzer, Zinsmeister, 2006. S. 7
27. Linguistic Data Consorcium, http://www.ldc.upenn.edu
28. Lothar Lemnitzer, Heike Zinsmeister: Korpuslinguistik. 2., uberarbeitete Auflage. Gunter Narr Verlag, Tubingen 2010. Winfried Lenders: Computational lexicography and corpus linguistics until ca. 1970/1980.
29. Marco Zierl: Entwicklung und Implementierung eines
Datenbanksystems zur Speicherung und Verarbeitung von Textkorpora. 1997. Magisterarbeit; mit einem groBen Teil zu Grundlagen der Korpuslinguistik
30. Noam Chomsky: Knowledge of Language. Praeger, New York 1986.
31. Rainer Perkuhn, Holger Keibel, Marc Kupietz: Korpuslinguistik. 2012. Erganzende Website zum gleichnamigen Lehrbuch der Autoren
32. Sinclair, 1991. P. 171
33. Stubbs, 2001. P. 239-240
34. Tony McEnery, Andrew Wilson: Corpus Linguistics. 1996. Erganzende Website zur ersten Auflage des gleichnamigen Buches der beiden Autoren
35. Tony McEnery, Andrew Wilson: Corpus linguistics: an introduction. 2. Auflage. Edinburgh University Press. 2001.
36. Uwe Quasthoff, Christian Wolff: Korpuslinguistik und groBe
einsprachige Worterbucher. In: Linguistik online. Nr. 3, 1999
Электронные ресурсы
37. [http: //ruscorpora.ru/corporastructure. html]
38. http: // www.ege.edu.ru /
39. http: // www.ids-mannheim.de/kl/proj ekte/korpora/
40. http://corpora.iling.spb.ru/ - специальный интернет-сайт по корпусной лингвистике
41. http://corpus.byu. edu/bnc
42. http://corpus.byu.edu/bnc/
43. http://dic.academic.ru/dic.nsf/ruwiki/51884
44. http://titus.uni-frankfurt.de
45. http://www.collins.co.uk/Corpus/CorpusSearch.aspx
46. http://www.collinslanguage.com/ content-solutions/wordbanks
47. http://www.elsnet. org/resources/eciCorpus.html
48. http://www.natcorp.ox.ac. uk/
49. http://www.opensourceshakespeare.org/concordance/ findform.php
50. http://www.statmt.org/europarl
51. https://cosmas2.ids-mannheim.de/cosmas2-web/
52. https://de.wikipedia.org/wiki/Korpuslinguistik
53. Курс «Корпусная лингвистика» (А.Б. Кутузов) http: //lab314 .brsu.by/kmp-lite/kmp2/CL/CorporeLingva.pdf
54. http://www.helsinki.fi/varieng/CoRD/corpora/ CEEM/index.html