АННОТАЦИЯ 2
ВВЕДЕНИЕ 8
ГЛАВА I 15
ТЕОРЕТИЧЕСКИЕ ОСНОВЫ СОЗДАНИЯ ПСИХОЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ RUTURKPSYCHLING 15
1.1.1 Базы данных в психолингвистических исследованиях 15
1.1.2 Классификация баз данных 19
1.1.3 Метод анкетирования при создании психолингвистических БД 22
1.2.1 Общие положения исследования перцептивной семантики 24
1.2.2 Теория воплощенного познания: эмоциональность, пространственная
локализация референта, взаимодействие с референтом при помощи рук (manipulability), соотнесенность с размером, соотнесенность с температурой, знакомость 26
1.3 Общие положения теории лингвистической относительности 30
1.4 Общие положения теории ментального лексикона билингва 31
Выводы по главе I 34
ГЛАВА II 36
СОЗДАНИЕ ПСИХОЛИНГВИСТИЧЕСКОЙ БАЗЫ ДАННЫХ RUTURKPSYCHLING 36
2.1 Проекты RuWordPerception и TurkWordPerception 37
2.1.1 RuWordPerception 37
2.1.2 TurkWordPerception 39
2.2 Проектирование ПБД RuTurkPsychLing 40
2.3 Проведение анкетирования на базе PsychoPy 43
2.4 Проведение анкетирования на базе Google Forms 49
2.5 Сведение индивидуальных оценок в психолингвистическую базу
данных RuTurkPsychLing 53
2.6 Возможность использования RuTurkPsychLing для лингвистических
исследований 57
2.7 Перспективы исследования 59
Выводы по главе II 60
ЗАКЛЮЧЕНИЕ 63
СПИСОК ЛИТЕРАТУРЫ 66
ПРИЛОЖЕНИЕ А 73
ПРИЛОЖЕНИЕ Б 88
ПРИЛОЖЕНИЕ В 101
В данной магистерской диссертации представлено создание психолингвистической базы данных RuTurkPsychLing, содержание которой, помимо создания баз данных, связывает нас с глобальными лингвистическими концепциями, а именно теорией воплощенного познания, гипотезой лингвистической относительности и теорией ментального лексикона билингва.
Ввиду общей теоретической направленности на структуризацию лингвистического знания и споров о концептуализации значения в сознании носителей языка, его форме и содержании, создание психолингвистических баз данных является актуальным уже более 50 лет. Исследование концептуализации значений слов является сложной задачей, поэтому к ней подходят частично, изучаются определенные компоненты семантики в сознании носителей. При решении таких задач целесообразно использовать базы данных как способ хранения собираемой информации (как собственно лингвистической, так и психолингвистической). Базы данных позволяют упорядочить большой объем информации, которую включают единицы языка (от формы до содержания в разных их аспектах, которые могут стать параметрическими характеристиками при описании перцептивной, моторной семантики). Чтобы прийти к объективному описанию концептуализированных в сознании носителей компонентов семантики, исследователи активно прибегают к методу анкетирования и статистической обработки данных при создании психолингвистических баз данных, опираясь на большое количество независимых оценок носителей языка. Нам интересны такие компоненты семантики, как концептуальная знакомость, манипулируемость, соотнесенность с расположением в пространстве, размером, температурой и эмоциональностью. Эти компоненты намного меньше изучены, чем модальности восприятия, однако они с косвенно связаны с разными каналами восприятия и помогают шире изучить перцептивную семантику слов русского, татарского и хакасского языков, как самостоятельно, так и в контрастивных исследованиях.
Актуальность диссертационного исследования определяется активным применением технологий баз данных в психолингвистике в том числе для описания перцептивной семантики, что также является одним из аспектов, формирующих актуальность данной диссертационной работы. Описание перцептивной семантики не произведено в полной мере ни на одном языке, однако имеется большой научный задел при описании перцептивной семантики английского языка, что же касается русского языка, то концептуализация перцептивной семантики в сознании носителей еще мало изучена. Мы вводим также изучение перцептивной семантики малочисленных языков Сибири, т.е. татарского, хакасского, перцептивная семантика единиц которых практически не изучена.
Объектом нашего исследования является перцептивная и пространственная семантика русских, татарских и хакасских слов.
Предмет исследования - способы выявления и репрезентации перцептивной и пространственной семантики слов в сознании носителей перечисленных языков.
Цель исследования - создать психолингвистическую базу данных оценок слов русского, хакасского и татарского языков по 6 психолингвистическим параметрам (знакомость, температура, расположение в пространстве, размер, эмоциональность и манипулируемость) носителями языка как родного и как второго.
Для достижения данной цели были поставлены следующие задачи:
1. Изучить основные принципы и концепции создания психолингвистических баз данных;
2. Разработать системы анкет для сбора оценок русских слов по психолингвистическим параметрам (знакомость, температура, расположение в пространстве, размер, эмоциональность и манипулируемость) носителями русского как родного и хакасско-русскими и татарско-русскими билингвами;
3. Разработать системы анкет для сбора оценок слов татарского и хакасского языков по психолингвистическим параметрам (знакомость, температура, расположение в пространстве, размер, эмоциональность и манипулируемость) носителями татарского и хакасского языков как родных.
4. Собрать оценки русских слов по перечисленным параметрам носителями русского языка как родного, татарско-русскими и хакасско-русскими билингвами;
5. Собрать оценки татарских и хакасских слов по перечисленным параметрам татарско-русскими и хакасско-русскими билингвами;
6. Организовать собранные данные в психолингвистическую базу данных;
7. Охарактеризовать возможности использования данных для психолингвистических исследований и провести предварительный анализ данных.
Материалом исследования послужили 195 имен существительных, 194 имени прилагательных и 200 глаголов русского языка, и их переводные эквиваленты на татарском и хакасском языках. Материал соответствует материалу баз данных RuWordPerception и TurkWordPerception, созданных в проекте «Языковое и этнокультурное разнообразие Южной Сибири в синхронии и диахронии: взаимодействие языков и культур».
Материалом также послужили оценки 100 носителей русского языка как родного (7 мужчин, средний возраст 23) - в сумме 364155 индивидуальные оценки дано носителями русского как родного, 16 татарско-русских билингвов (6 мужчин, средний возраст 29) - 74320 индивидуальных оценок дано татарско- русскими билингвами и 34 хакасского-русских билингвов (14 мужчин, средний возраст 21) - 371200 индивидуальных оценок дано хакасско-русскими
билингвами.
Теоретические основы исследования представляют работы
по созданию баз данных (Beynon-Davies P., Keuleers, E. & Balota, D.A., Codd E. F и др.),
по проведению анкетирования (Warriner, A. B., Kuperman, V., & Brysbaert, M, Резанова З.И., Миклашевский А.А. Matell, M.S., Jacoby, J., Дернеи З. и др.),
а также научные труды в таких областях, как
теория лингвистической относительности (L. Boroditsky, S. Levinson, J. Lucy, B.L. Whorf, J Winawer и др.),
теория воплощенного познания (Simmons, W.K., Barsalou L.W. , Zwaan R.A. и др.) и
теория ментального лексикона билингва (E. Bialystok, J. Mueller, А.А. Залевская и др.).
Методы исследования
На разных этапах исследования были применены следующие методы:
Метод психолингвистического анкетирования (PsychoPy, Google forms), который в рамках данной работы был реализован в последовательности конкретных процедур: разработки анкет для проведения опросов с использованием шкалы Ликерта, а также технической разработки анкет на платформе PsychoPy при локальном лабораторном сборе оценок, и с помощью Google forms при дистанционном сборе оценок онлайн.
Метод баз данных был реализован в последовательности действий: организация собранного материала, включающего оценки слов носителями русского языка как родного и тюркско-русскими билингвами, метод используется на этапе объединения индивидуальных ответов в одну сводную таблицу, описывающую проявленность психолингвистических параметров в исследуемых словах.
На этапе анализа источниковедческих возможностей при обработке материала созданной БД. в поисках подтверждения гипотезы относительно влияния семантических структур родного тюркского языка использовались методы статистического анализа: описательные статистики, определение характера распределения по Пирсону, корреляционный анализ по критерию Спирмена. Различие значений корреляционных связей при оценке одних и тех же слов разными группами респондентов свидетельствует о влиянии родного тюркского языка.
Новизна нашего исследования определяется следующим:
1) введением в научный оборот нового материала - индивидуальных оценок слов трех частей речи русского языка и их переводных аналогов на татарском и хакасском языках носителями русского языка и носителями тюркских языков как родных по шести психолингвистическим параметрам (знакомость, манипулируемость, соотнесенность с размером, температурой, положением в пространстве, эмоциональностью), что значительно расширяет проработанность исследуемого вопроса:
2) полученными первичными результатми; первичная обработка, статистический анализ данных позволил впервые показать, что на материале случайной выборки слов без разделения на семантические группы вклад перцептивных компонентов семантики (кроме концептуальной знакомости) в семантику слов стремится к нулю. Параметр знакомости сильно проявлен на случайной выборке слов, что свидетельствует о том, что в целом общеупотребительные слова достаточно хорошо известны носителям языка.
Теоретическая значимость нашего исследования заключается в получении новых данных, которые значимы для интерпретации и дальнейшего развития всех трех лингвистических концепций, на которые мы опираемся. Мы создаем психолингвистическую базу данных, включающую оценки слов русского, татарского и хакасского языков по шести психолингвистическим параметрам, собирая данные для описания перцептивной семантики русского, а также тюркских языков. Мы прорабатываем теорию воплощенного познания, исследуя степень сходства и различия концептуализрованности моторных и пространственных компонентов в языках разных типов. Мы также расширяем базу исследований проблемы ментального лексикона билингва, внося данные о концептуализации перцептивных компонентов семантики на материале слов родного тюркского и второго русского языков в сознании тюркско-русских херитажных билингвов, у которых второй русский язык - активный и доминирующий. Наша база данных может стать исследовательским инструментом, с помощью которого можно проводить исследования в области гипотезы лингвистической относительности, таким образом, RuTurkPsychLing предоставляет ценные данные для выявления влияния родного языка на восприятие единиц второго, что проявляется в сдвиге оценок единиц второго языка по сравнению с оценками единиц первого языка.
Практическая значимость проекта базы данных: собираемая ПБД может послужить материалом и инструментом для последующих исследований воплощенного познания, перцептивной семантики, теории лингвистической относительности и других экспериментальных и когнитивных исследований. Поскольку в ходе сбора оценок были собраны оценки носителей тюркского языка как родного, конструируемая ПБД может послужить дидактическим материалом или вспомогательным материалом для лингводидактических практик.
Структура работы.
Работа состоит из введения; двух глав, каждая из которых завершается выводами; приложений, заключения и списка использованных источников и литературы. В первой теоретической главе диссертации рассматриваются методы и технологии создания и применения баз данных в психолингвистических исследованиях, объясняется связь нашего исследования с глобальными лингвистическими концепциями: теорией воплощенного познания, теорией лингвистической относительности и теорией ментального лексикона билингва. Глава завершается выводами, в которых перечислены ключевые теоретические положения настоящей работы, обоснован отбор методов и материала исследования.
Во второй главе обосновывается стратегия и описываются результаты проведенного нами исследования, технические особенности составления БД, метод, отбор материала; представляется анализ данных, полученных в результате сбора участников, а также представляются возможные исследования, которые были проведены с помощью созданной БД.
Общий объем исследования составляет 93 страниц; список использованных источников представлен 64 единицами в алфавитном порядке, 48 из которых - на иностранных языках.
Основные результаты исследования были представлены на международных конференциях:
1. Fifth International Conference on Neurobiology of Speech and Language (октябрь 2021, СПбГУ, Россия);
2. XXXI Международная научная конференция «Язык и культура» (октябрь 2021, ТГУ, Россия);
3. VII Международная научная конференция "Славянские языки в условиях современных вызовов" (октябрь 2021, ТГУ, Россия);
4. IX (XXIII) Международная научно-практическая конференция молодых учёных «Актуальные проблемы лингвистики и литературоведения» (апрель 2022, ТГУ, Россия)
5. Международная научная конференция студентов, аспирантов и молодых учёных «Ломоносов-2022» (апрель 2022, МГУ, Россия)
Опубликованы работы:
1. Z. Rezanova, I. Korshunova, V. Palii. Does grammar affect the psycholinguistic assessments of Russian words? The ratio of emotionality and size and location in space // Neurobiology of Speech and Language, Санкт-Петербург, 08-09 октября 2021 года / Proceedings of the 5th International Conference. - Saint Petersburg: ООО "Скифия-принт", 2021. - P. 44-45. - EDN RQILJS.
2. Палий В. Е., Коршунова И.С. Технологии сбора и обработки
больших данных в психолингвистических исследованиях.
Психолингвистические базы данных // Открытые данные - 2021: Материалы форума, Севастополь, 30 сентября - 02 2021 года / Под редакцией А.Ю. Саркисовой. - Томск: Национальный исследовательский Томский
государственный университет, 2021. - С. 82-93. - EDN KZYXYI.
Актуальной задачей современной лингвистики и психолингвистики является накопление объективных данных для изучения и доказательства фундаментальных теорий. Ключевые теоретические положения нашей работы основаны на теории воплощенного познания, гипотезе лингвистической относительности, теории ментального лексикона и методе
психолингвистического анкетирования, в частности, работах Barsalou L.W., Boroditsky L., Levinson S., Lucy J., Warriner A. B., Zwaan R.A., Дернеи З. Языковые и сенсомоторные процессы неразрывно связаны в когнитивной системе носителя языка. Языковые структуры первого родного языка всегда активны и влияют на восприятие мира, в том числе и на концептуализацию перцептивных компонентов. Соответственно, в сознании билингва единицы обои языков взаимно влияют друг на друга и концептуализируются таким образом, что это взаимовлияние отражается в лингвистических исследованиях. Технологии психолингвистических баз данных совместно с методом психолингвистического анкетирования и методикой шкалирования предоставляют очень важную возможность - получать, хранить и анализировать объективные данные с последующим доказательством или опровержением глобальных лингвистических гипотез.
Учитывая лакуны в проработанности исследовательского поля, выявленные в результате анализа литературы, посвященной технологиям баз данных, описанию перцептивной семантики, теории лингвистической относительности и теории ментального лексикона билингва нами были сформулированы требования к материалу и методам, которых мы придерживались при создании БД. Проектируемая БД логично систематизирована, описана в равных долях по всем исследующимся параметрам. Отобранный материал включает как существительные, так и глаголы и прилагательные. Для всех компонентов спроектированы соотносимые инструкции, один и тот же метод и один и тот же языковой материал.
В ходе нашего исследования была разработана
психолингвистическая база данных RuTurkPsychLing в качестве исследовательского продолжения проектов RuWordPerception и TurkWordPerception. Были собраны оценки вклада в семантику следующих перцептивных компонентов знакомость, манипулируемость, соотнесенность с размером и её характер, соотнесенность с температурой и её характер, соотнесенность с положением в пространстве и её характер, соотнесенность с эмоциональностью и её характер. ПБД создана в целях описания вклада перцептивных компонентов в семантику случайной выборки слов, поэтому нами не предполагается, что материал делится на семантические группы по соотносимому объему. ПБД позволяет изучить, во-первых, насколько концептуализированы сенсомоторные механизмы в сознании носителей языков и как они репрезентированы, во-вторых, влияние родного языка при оценивании усвоенного и проследить систему общности и различия концептуализации компонентов семантики на материале обоих языков билингва.
Нами были разработаны:
• калибраторы для проверки респондентов на добросовестность;
• код, который напоминал использовать всю шкалу при часто повторяющихся ответах;
• код, завершающий эксперимент, если человек не знал более 30 слов.
Нами также были приняты дополнительные решения для комфорта участников, которые сокращают время прохождения анкетирования и повышают эффективность сбора оценок.:
• кнопка «я не знаю данное слово», при нажатии на которую шкалы пропадали и можно перейти к следующему слову сразу;
• автоматическое присуждение нулевого значения для характера соотнесенности с параметром, если указано её отсутствие.
Перспективами проекта является создание интерактивной платформы RuTurkPsychLing, а также проведение контрастивных исследований на материалах трех баз данных лаборатории, соотнесенных по материалу и принципам организации данных.
Оценки RuTurkPsychLing показывают, что исследуемые перцептивные компоненты, кроме концептуальной знакомости (он сильно проявлен), проявлены в семантике случайно выбранных слов крайне слабо. Оценки русских слов выявляют общие тенденции для всех типов респондентов, однако при оценке слов татарского и хакасского языков, размах оценок сокращается. Это может быть продиктовано типом билингвизма. Корреляционный анализ также соответствует гипотезе о наличии влияния структур родного тюркского языка.
Созданная ПБД RuTurkPsychLing может использоваться как инструмент для множества различных психолингвистических исследований, основывающихся на тех же лингвистических концепциях, что и психолингвистическая база данных RuTurkPsychLing.
1. Baddeley, A. D. (1990).Human memory: Theory and practice. London: Erlbaum.
2. Balota, D. A., Pilotti, M., & Cortese, M. J. (2001). Subjective frequency estimates for 2,938 monosyllabic words. Memory & Cognition, 29, 639-647. doi:10. 3758/BF03200465
3. Balota, D. A., Yap, M. J., Hutchison, K. A., Cortese, M. J., Kessler, B., Loftis, B.,Treiman, R. (2007). The English lexicon project. Behavior Research Methods, 39(3), 445-459. doi:10.3758/BF03193014
4. Barsalou L.W. Perceptual symbol systems // Behavioral and brain sciences. - 1999. - Vol. 22. - №. 4. - pp. 577-660.
5. Barsalou, L.W., Simmons, W.K., Barbey, A.K., Wilson, C.D. Grounding conceptual knowledge in modality-specific systems //Trends in cognitive sciences. -
2003. - Vol. 7. - №. 2. - pp. 84-91. doi:10.1016/S13646613(02)000293
6. Bialystok, E., Craik, F. I. M., Klein, R., & Viswanathan, M. Bilingualism, aging, and cognitive control: Evidence from the Simon task // Psychology and Aging,
2004. 19, p. 290-303.
7. Bialystok, E., Craik, F. I. M., Luk, G. Cognitive control and lexical access in younger and older bilinguals // Journal of Experimental Psychology: Learning, Memory, and Cognition, 2008. 34, p. 859-873.
8. Brysbaert, M., Warriner, A. B., & Kuperman, V. (2013). Concreteness ratings for 40 thousand generally known English word lemmas. Behavior Research Methods, 1-8.
9. Campanella, F., Shallice, T. Manipulability and object recognition: is manipulability a semantic feature? // Experimental Brain Research. - 2011. - Vol. 208. - №. 3. - pp. 369-383. doi:10.1007/s00221-010-2489-7.
10. Codd E. F. A Relational Model of Data for Large Shared Data Banks //
Commun. ACM. 1983. Т. 26. № 1. С. 64-69.
https://dl.acm.org/doi/10.1145/362384.362685
11. Cowey, A., Small, M., & Ellis, S. (1994). Left visuo-spatial neglect can
be worse in far than in near space. Neuropsychologia, 32(9), 1059-1066.
doi:10.1016/0028-3932(94)90152-X
12. Dudschig, C., Souman, J., Lachmair, M., de la Vega, I., & Kaup, B.
(2013). Reading “sun” and looking up: The influence of language on saccadic eye movements in the vertical dimension. PLoS ONE, 8(2), e56872.
doi:10.1371/journal.pone.0056872
13. ELLIS, A. W., &MORRISON, C. M. (1998). Real age-of-acquisition effects in lexical retrieval.Journal of Experimental Psychology: Learning, Memory, & Cognition,24, 515-523.
14. Estes, Z., Verges, M., & Barsalou, L. W. (2008). Head up, foot down object words orient attention to the objects’ typical location. Psychological Science, 19(2), 93-97. doi:10.1111/j.1467-9280.2008.02051.x
15. Gallese, V. and Lakoff, G. The brain's concepts: The role of the sensory-motor system in conceptual knowledge // Cognitive neuropsychology. - 2005. - Vol. 22. - №. 3-4. - pp. 455-479... 64