Введение 3
Глава 1 Теоретические основы оценки сложности текстовой информации 7
1.1 Сложность текста как лингвистическое понятие 7
1.2 Стандартные формулы оценки сложности текстовой информации 27
1.3 Оценка сложности текста при помощи инструментария Coh-Metrix 36
Выводы по Главе 1 40
Глава 2 Практическое использование Coh-Metrix для анализа текстовых учебных материалов 43
2.1 Цели, задачи, этапы организации опытно-экспериментальной работы .. 43
2.2 Особенности работы ПО Coh-Metrix при анализе текстовых материалов 48
2.3 Экспериментальное модифицирование текстов при помощи специализированного ПО 59
Выводы по главе 2 73
Заключение 76
Список литературы 79
Приложение 87
Несмотря на широкое использование мультимедиа технологий, текст остается одним из основных видов хранения и передачи информации. Разработка эффективных подходов к обработке текстов с целью фильтрации, формирования смыслового портрета, навигации по базе текстов является одним из наиболее актуальных направлений современных информационных технологий. В условиях глобализации образования все чаще встает вопрос о необходимости стандартизации его процессов, требуемой для обеспечения валидности получаемых результатов. Используемые в качестве образовательного материала тексты проходят недостаточный анализ на предмет сложности для чтения и понимания. Результатом становится неравные условия, в которые помещаются обучающиеся при обучении и проверке их языковых умений и навыков. В виду вышесказанного актуальность изучения данной проблемы особенно высока.
Данная тематика рассматривалась как отечественными, так и зарубежными учеными-исследователями: Карпов Н. В., Оборнева И. В., Солнышкина М. И.Усталов Д. А., Филипова А. М., Callan J, Chall J.S., Chissom B.S., Collins-Thompson K., Flesch R., Kincaid J.P., Mcnamara T., Rogers R.L., Schwarm S.E.
Возникает противоречие между необходимостью обеспечения валидности результатов обучения английскому языку и отсутствием процедур, позволяющих корректно оценивать текстовые учебные материалы.
Проблема исследования заключается в вопросе о том, какие характеристики текста следует подвергнуть анализу и при помощи каких средств данный анализ следует проводить для получения достоверных данных об уровне сложности текста для чтения и понимания обучающимися.
Целью исследования являются разработка рекомендаций, позволяющих осуществлять анализ учебного англоязычного текста при помощи программного обеспечения с целью получения достоверных данных, на основе которых можно проводить оценку сложности текста и обеспечить валидность учебных материалов.
Объектом исследования является лингвистические параметры учебного англоязычного текста.
Предметом исследования является оценка сложности текста, создаваемой его параметрами.
Гипотеза исследования предполагает, что использование автоматизированных программных средств позволит обеспечить получение объективной информации о параметрах текста, на основе которой возможно корректное определение сложности текста для чтения и понимания.
Задачи исследования
1. Осветить и систематизировать основные направления в науке, посвященные определению сложности текста;
2. Разработать рекомендации по проведению анализа текста при помощи автоматизированного программного обеспечения;
3. Внедрить разработанные рекомендации в процесс обучения английскому языку с целью выявить и доказать валидность применения нового подхода в оценке уровня сложности текста.
Научная новизна исследования заключается в применении новых методов оценки сложности текста при помощи программного обеспечения, учитывающего ранее не подвергавшиеся анализу параметры учебного англоязычного текста.
Теоретическая значимость исследования:
- Выявлены и экспериментально проверены параметры текста, влияющие на трудность восприятия и сложность текста как речевой единицы;
- Модернизированы требования к списку анализируемых параметров текстов, используемых в обучении и тестированию иностранным языкам;
- Разработаны рекомендации сравнительного анализа учебных англоязычных текстов на предмет сложности.
Практическая значимость исследования. Результаты данного исследования возможно интегрировать в процесс обучения иностранным языкам на всех уровнях с целью обеспечения валидности текстовых учебных материалов. Результаты исследования могут стать компонентом отечественной автоматизированной системы оценки сложности текстов на английском и русском языках;
Для решения поставленных задач применялись следующие методы:
1. анализ научной и научно-методической литературы;
2. педагогический эксперимент (констатирующий и формирующий);
Методы и методологии исследования:
- изучение научно-исследовательских работ отечественных и зарубежных ученых-исследователей (описательно-аналитический метод исследования);
- выдвижение гипотезы исследования (гипотетико-дедуктивный метод исследования);
- определение параметров текстов и контрастивный анализ
параметров посредством программного обеспечения;
- модификация текстов с целью получения текстов с заданной сложностью;
- интеграция экспериментального тестового материала в процесс обручения (эксперимент).
Апробация работы. Результаты проведенного исследования были представлены на международной научно-практической конференции «Русский язык и литература в тюркоязычном мире: современные концепции и технологии» (Казань, 2016), на 15 международной молодежной научно¬исследовательской конференции имени Каюма Насыри (Казань, 2017). По теме диссертации опубликовано 3 печатные статьи, в числе которых 2 статьи в журналах, рекомендованных ВАК, и 3 статьи в журналах, индексируемых в базе данных РИНЦ.
Структура работы состоит из введения, главы 1, главы 2, заключения, библиографии.
В данном исследовании была произведена попытка осветить современное состояние лингвистики по вопросам оценки сложности текстовых материалов. Было обнаружено существенное различие в аутентичных текстах и текстах разработанных или адаптированных для использования в обучении. Данный факт приводит к выводу о необходимости корректной оценки текстовых материалов на предмет сложности. Анализ научной литературы привел к выводу о доминирующем положении стандартных формул удобочитаемости, измеряющих исключительно статистические характеристики текста и не учитывающих иные формы воздействия на читателя. Разработчики учебных материалов изменяют количественные характеристики в целях повышения или понижения сложности того или иного текстового материала. Существующую структурный подход ориентируется на необходимость включения в материалы определенных грамматических структур и лексики, не учитывая их влияния на сложность текста. Интуитивный подход, основанный на сочетании опыта составителя текстов и базовых инструкциях по содержанию также не способен стать полноценным решением, в виду человеческого фактора.
Зарубежными специалистами был разработан иной подход, основанный на учете ранее игнорируемых аспектов. Данный подход основан на главенстве таких понятий как целостность и связность, позволяющих оценивать текстовую информацию с точки зрения когнитивных процессов читателя, что позволяет включить в число параметров такие меры измерения как абстрактность слов, синтаксическая простота, референциальная связность, глубинная связность и повествовательная характеристика.
Изучение работ по продвинутому анализу сложности текстов привел к выводу о необходимости внедрения в процесс автоматизированного программного обеспечения, способного обрабатывать большие массивы данных при помощи методов машинного обучения. Разработка эффективных подходов к обработке текстов с целью анализа и модификации была осуществлена зарубежными специалистами. Результатом работы стала система Coh-Metrix, включающая в себя наработки множества других направлений в когнитивной лингвистике. Данный инструмент позволил решить возникшее в ходе исследования противоречие противоречие между необходимостью обеспечения валидности результатов обучения и отсутствием процедур, позволяющих корректно оценивать текстовые учебные материалы.
Посредством программного обеспечение нами была предпринята попытка ответить на вопрос какие характеристики текста следует подвергнуть анализу и при помощи каких средств данный анализ следует проводить для получения достоверных данных об уровне сложности текста. Эксперименты проводимые с текстами УМК Spolight 11 позволили понять принцип работы ПО и показали взаимосвязи характеристик англоязычного текста в единой структуре связности и целостности. Результаты были проанализированы, на их основе, согласно гипотезе исследования, были выработаны рекомендации по модифицированию текстовых материалов с использованием онлайн интерфейса T.E.R.A инструмента Coh-Metrix.
В целях выявления эффективности разработанных нами рекомендаций нами был проведен педагогический эксперимент в виде системы обеспечения экспериментального обучения, осуществляемой согласно разработанным технологиям. Все данные полученные в ходе эксперимента были систематизированы в соответствие с общедидактическими принципами проведения экспериментальной педагогической работы. На основе проведенного экспериментального исследования мы может подтвердить эффективность применения нового метода в анализе и модифицировании англоязычных текстов, используемых в обучении. Нам удалось при помощи программного обеспечения T.E.R.A. добиться практического результата в снижении и увеличении сложности текстов с закономерным, повторяемым результатом. Разработанные рекомендации проявляют значимую эффективность при обеспечении валидности тестовых результатов с использованием текстовых материалов.
В ходе исследования нами бы выполнены все поставленные теоретические и практические задачи, результатом чего стало освещение и экспериментальное доказательство эффективности нового метода оценки сложности текста при помощи программного обеспечения.
Дальнейшие перспективы научного исследования заключается в попытке модернизировать требования к списку анализируемых характеристик текстов, используемых в обучении и тестированию иностранным языкам. Результаты исследования могу стать компонентом отечественной автоматизированной системы оценки сложности текстов на английском и русском языках. Самостоятельная ценность исследования заключается в возможности интегрирования рекомендаций по анализу и модификации текстов в процесс обучения иностранным языкам на всех уровнях с целью обеспечения валидности результатов.
1. Абрамов В.Е., Абрамова Н.Н., Некрасова Е.В., Росс Г.Н. Статистический анализ связности текстов по общественно-политической тематике // Труды XIII Всероссийской научной конференции "Электронные библиотеки: перспективные методы и технологии, электронные коллекции" - RCDL’2011 (г. Воронеж, 19-22 окт. 2011 г.). Воронеж. 2011. С. 127-133.
2. Аргунова, Е.Р. Активные методы обучения: учебно-метод.
пособие. - М.: Исследовательский центр проблем качества подготовки
специалистов. 2005. 104с.
3. Бархаев, Б.П. Педагогическая психология: учеб. пособие для вузов. - Гриф УМО. - СПб.: Питер, 2009. 444с.
4. Бегтин И.В. Что такое "Понятный русский язык" с точки зрения
технологий. Заглянем в метрики удобочитаемости текстов: блог компании "Информационная культура" [Электронный ресурс]. URL:
http://habrahabr.ru/company/infoculture/blog/238875/ (дата обращения:
05.06.2017).
5. Бирюков Б.В., Тюхтин B.C. О понятии сложности // Логика и методология науки: материалы IV Всесоюзного симпозиума. М.: Наука. 1967. С. 219-231.
6. Гречихин А.А. Социология и психология чтения: учеб. пособие для вузов. М.: МГУП, 2007. 383 с.
7. Данилова Н.Н. Психофизиология:Учебник для вузов. М.: Аспект- Пресс.1998. 373с.
8. Ермаков А.Е., Плешко В. В. Синтаксический разбор в системах статистического анализа текста // Информационные технологии. 2002. № 7. С. 30-34.
9. Зайцева, И.И. Технологическая карта урока. Методические рекомендации // Педагогическая мастерская. Всё для учителя! 2011. Пилотный выпуск. - С. 4-6
10. Зильберглейт М.А., Шпаковский Ю.Ф., Невдах М.М. Повышение качества учебной литературы для вузов // Издательское дело и полиграфия: тезисы 76-й науч.-техн. конф. профессорско-преподавательского состава, научных сотрудников и аспирантов (г. Минск, 13-20 февраля 2012 г.) / отв. за издание И. М. Жарский; УО "БГТУ". Минск: БГТУ, 2012. С. 89-92.
11. Карпов Н.В. Идентификация уровня сложности текста и его
адаптация. URL: http://www.slideshare. net/karpnv/ss-
31225145#14356960593761&fbinitialized (дата обращения: 05.06.2017).
12. Колмогоров А.Н. Три подхода к определению понятия «количество информации»//Проблемы передачи информации 1965. Т.1. N0 1, С.3-11.
13. Криони Н. К., Никин А.Д., Филиппова А.В. Автоматизированная система анализа параметров сложности учебного текста // Технология и организация обучения: науч. издание. Уфа: УГАТУ. 2008. С. 155-161.
14. Лернер И.Я. Критерии сложности некоторых элементов учебника // Проблемы школьного учебника. М.: Просвещение, 1974. Вып. 1. С. 47-58.
15. Лесскис Г.А. О зависимости между размером предложения и его структурой в разных видах текста // Вопросы языкознания. 1964. № 3. С. 99 - 123.
16. Мандель, Б.Р. Интеллектуальная игра: на перекрестке научных дисциплин //Педагогика. 2006. № 7. С. 44-48
17. Мацковский М. С. Проблемы читабельности печатного материала // Смысловое восприятие речевого сообщения в условиях массовой коммуникации / отв. ред. Т. М. Дридзе, А. А. Леонтьев. М.: Наука. 1976. С. 126-142.
18. Микк Я.А. О факторах понятности учебного текста: автореф. дисс. ... к. пед. н. Тарту. 1970. 22 с.
19. Микк Я.А. Оптимизация сложности учебного текста: В помощь авторам и редакторам. М.: Просвещение. 1981. 119с.
20. Невдах М.М. Исследование информационных характеристик учебного текста методами многомерного статистического анализа // Прикладная информатика. 2008. № 4 (16). С. 117-130.
21. Оборнева И.В. Автоматизированная оценка сложности учебных текстов на основе статистических параметров: дисс. ... к. пед. н. М. 2006. 165с.
22. Педагогика: теории, системы, технологии: учеб. для студ. высш. и сред. учеб. заведений /И.Б. Котова [и др.]; под ред. С. А. Смирнова. 8-е изд., стер. М.: Академия. 2008. 510с.
23. Педагогика: учеб. пособие /Б.З. Вульфов [и др.]; под ред. П. И. Пидкасистого. Гриф УМО. - М.: Юрайт, 2009. 430с.
24. Педагогические технологии: учеб. пособие /авт.-сост. Т. П. Сальникова. М.: ТЦ Сфера. 2007. 128с.
25. Пиотровский Р.Г. Математическая лингвистика: учеб. пособие для пед. Институтов/ Р.Г.Пиотровский, К.Б.Бектаев, А.А.Пиотровская. М.: Высшая школа, 1977. 383с.
26. Пушкина Е.С. Теоретико-экспериментальное исследование структурно-семантических параметров текста: дисс. . к. филол. н. Кемерово.
2004. 155с.
27. Разумовский О.С. Оптимология, часть 1. Новосибирск: Изд-во ИДМШ, 1999. Общенаучные и философско-методические основы. 285с.
28. Ребер А.С. Оксфордский толковый словарь по психологии. 2002. URL: http://vocabulary.ru/ dictionary/487/word/chitabelnost (дата обращения: 05.06.2015).
29. Розенберг Н.М. Использование научной терминологии в школьных учебниках // Проблемы школьного учебника: сб. науч. тр. М.: Просвещение. 1978. Вып. 6. С. 73-84.
30. Сластенин В.А. Педагогика: учеб. для вузов /В.А. Сластенин, И. Ф. Исаев, Е. Н. Шиянов; под ред. В.А. Сластенина. 8-е изд., стер.; Гриф МО. М.: Академия. 2008. 567с.
31. Солнышкина М.И., Кисельников А.С. Параметры сложности экзаменационных текстов //Вестник Волгоградского государственного университета. Серия 2. Языкознание. 2015. № 1 (25). С. 99-107.
32. Сохор А.М. Сравнительный анализ учебных текстов (на материале учебников физики) // Проблемы школьного учебника: сб. науч. тр. М.: Просвещение, 1975. Вып. 3. С. 104-117.
33. Томина Ю.А. Объективная оценка языковой трудности текстов (описание, повествование, рассуждение, доказательство): дисс. ... к. пед. н. М., 1985. 226 с.
34. Тулдава Ю.А. Об измерении трудности текстов // Ученые записки Тартуского университета. Тарту: Изд-во Тарт. ун-та, 1975. Вып. 345, IV. Труды по методике преподавания иностранных языков. С. 102-120.
35. Ушаков К.М. О критериях сложности учебного материала школьных предметов // Новые исследования в педагогических науках / сост. И.К. Журавлев, B.C. Шубинский. М.: Педагогика, 1980. Вып. 2 (36). С. 33-35.
36. Филиппова А.В. Управление качеством учебных материалов на основе анализа трудности понимания учебных текстов: автореф. дисс. . к. техн. н. Уфа, 2010. 20 с.
37. Хмелёв Д.В. О лингвоанализаторе 3-эпсилон.
URL: http://www.philol.msu.ru/~lex/khmelev/descrwin.html. (дата обращения: 05.06.2015).
38. Цетлин B.C. Дидактические требования к критериям сложности учебного материала // Новые исследования в педагогических науках / сост. И. К. Журавлев, B. C. Шубинский. М.: Педагогика, 1980. Вып. 1 (35). С. 30-33.
39. Черникова Н.А. Основные направления педагогических
исследований оптимизации процесса обучения //Модернизация профессионального образования в условиях интеграции: проблемы
обеспечения качества. Изд-во СибАДА. 2005. - С. 48-50.
40. Шпаковский Ю.Ф. Оценка трудности восприятия и оптимизация сложности учебного текста (на материале текстов по химии): автореф. дисс. ... к. филол. н. Минск. 2007. 21с.
41. Allen D. A study of the role of relative clauses in the simplification of news texts for learners of English //System. 2009. 37. P.585-599
42. Baker M. In Other Words: a course book on translation. London: Routledge. 1992. 353 p.
43. Concreteness ratings for 40 thousand generally known English word
lemmas. [Электронный ресурс] URL:
https: //link. springer. com/article/ 10.3758/s13428-013-0403-5 (дата обращения: 05.06.2017)
44. Crossley S.A., McNamara D.S. Computational assessment of lexical differences in L1 and L2 writing //Journal of Second Language Writing. 2009. 18(2). P.119-135.
45. Crossley S.A., McNamara D.S. Interlanguage Talk: A computational analysis of non-native speakers’ lexical production and exposure. //Applied natural language processing and content analysis: Identification, investigation, and resolution. 2012. P. 425-437.
46. Crossley S., Cai Z., McNamara D.S. (). Syntagmatic, Paradigmatic, and Automatic N-Gram Approaches to Assessing Essay Quality. //Proceedings of the 25th International Florida Artificial Intelligence Research Society (FLAIRS) Conference. 2012. P. 214-219.
47. Crossley S., Salsbury T.L., McNamara, D.S. The role of lexical cohesive devices in triggering negotiations for meaning //Issues in Applied Linguistics. 2010. 18(1). P.222-240.
48. Duran N.D., Bellissens C., Taylor, R.S., McNamara, D. S. Quantifying text difficulty with automated indices of cohesion and semantics //Proceedings of the 29th annual meeting of the cognitive science society. 2007. P.233-238.
49. Eggins S. An Introduction to Systemic Functional Linguistic. London: Pinter Publsiher. 1994. 384 p.
50. Graesser A.C., Li H., Feng S. Constructing inferences in naturalistic reading contexts. //Inferences during Reading. 2015. P. 290-320.
51. Graesser A.C., McNamara D.S., Louwerse M.M. Methods of automated text analysis //Handbook of Reading Research. 2011. Vol. 4. P.34-53.
52. Graesser A.C., McNamara D.S., Cai Z., Conley M., Li H., Pennebaker J. Coh-Metrix measures text characteristics at multiple levels of language and discourse //Elementary School Journal. 2014. 115. P.210-229.
53. Hall C., McCarthy P.M., Lewis G.A., Lee D.S., McNamara D.S. Coh- Metrix assessment of American and English/Welsh Legal English // Psycholinguistic and Computational Perspectives. 2007. 15. P.40-54.
54. Halliday M.A.K., Hasan R. Cohesion in English. New York: Longman. 1976. 374 p.
55. He X.Y., Yang H., Li H.J., Wei Y.B., McNamara, D.S. Updating the spatial situation model: Effects of cognitive style //Acta Psychologica Sinica. 2011. 43, P.1247-1262.
56. Hempelmann C.F., Rus V., Graesser A.C., McNamara D.S. Evaluating state-of-the-art treebank-style parsers for Coh-metrix and other learning technology environments //Proceedings of the Second Workshop on Building Educational Applications using Natural Language Processing and Computational Linguistics.
2005. P. 69-76.
57. Hill, D. Survey review: Graded readers //ELT Journal. 1997. 51. P.57¬81.
58. Hu X., Cai Z., Graesser A.C., Louwerse M.M., Penumatsa P., Olney A. An improved LSA algorithm to evaluate student contributions in tutoring dialogue. //Proceedings of the eighteenth international joint conference on artificial intelligence. 2003. P. 1489-1491.
59. Hurford Jones R., Heasley B. Semantic: A Coursebook. 1983. London: Cambridge University Press. 366 p.
60. Keshtkar F., Burkett C., Li H., Graesser A.C. Using data mining techniques to detect the personality of players in an educational game //Educational data mining: Applications and trends. 2014. P. 125-150
61. Kincaid J.P. Derivation of New Readability Formulas (Automated Readability Index, Fog Count and Flesch Reading Ease Formula) for Navy Enlisted Personnel (Research Branch Report 8-75)/ J.P. Kincaid, R.P. Fishburne, R.L. Rogers, B.S. Chissom. Memphis. TN: Naval Air Station. 1975. 40 p.
62. Li H., Graesser A.C., Cai, Z. Component model in discourse analysis. //Proceedings of the 6th International Conference on Educational Data Mining. 2013. P. 326-327.
63. Lightman E.J., McCarthy P.M., Dufty D.F., McNamara D.S. (). Using computational text analysis tools to compare the lyrics of suicidal and non-suicidal songwriters. //Proceedings of the 29th annual conference of the Cognitive Science Society. 2007. P.1217-1222.
64. Little, D.G., Devitt, S., Singleton, D. The communicative approach and authentic texts. // Teaching Modern Languages. 1993. P. 43-47.
65. Louwerse M.M., Ventura M. How children learn the meaning of words and how computers do it too //Journal of the Learning Sciences. 2005. 14. P.301¬309.
66. McCarthy P.M., Dufty D., Hempelman C., Cai Z., Graesser A.C., McNamara D.S. Evaluating givenness/newness //Applied natural language processing and content analysis: Identification, investigation, and resolution. 2011. P. 156-163.
67. McCarthy P.M., Lehenbauer B.M., Hall C., Duran N.D., Fujiwara Y., McNamara D.S. A Coh-Metrix analysis of discourse variation in the texts of Japanese, American, and British Scientists //Foreign Languages for Specific Purposes. 2007. 6. P.46-77.
68. McCarthy P.M., Lewis G.A., Dufty D.F., McNamara D.S. Analyzing writing styles with Coh-Metrix //Proceedings of the Florida Artificial Intelligence Research Society International Conference (FLAIRS). 2006. P.764-770
69. McLaughlin G.H. SMOG Grading - a New Readability Formula // Journal of Reading. 1969. № 12(8). P.639-646.
70. McNamara D.S., Floyd R.G., Best R., Louwerse M. World knowledge driving young readers’ comprehension difficulties. //Proceedings of the sixth international conference of the learning sciences: Embracing diversity in the learning sciences. 2004. P.326-333.
71. McNamara D.S., Graesser A.C., McCarthy P.M., Cai Z. Automated evaluation of text and discourse with Coh-Metrix. Cambridge, M.A.: Cambridge University Press. 2014. 278 p.
72. McNamara D.S. IIS: A marriage of computational linguistics, psychology, and educational technologies. //Proceedings of the 20th International Florida Artificial Intelligence Research Society Conference. 2007. P. 15-20.
73. McNamara D.S., Graesser A.C. . Coh-Metrix: An Automated Tool //Applied natural language processing and content analysis: Identification, investigation, and resolution. 2012. P.188-205.
74. McNamara D.S., O’Reilly T. Theories of comprehension skill: Knowledge and strategies versus capacity and suppression //Progress in Experimental Psychology Research. 2009. P.190-198.
75. McNamara D.S., Crossley S.A., McCarthy P.M. Linguistic features of writing quality //Written Communication. 2010. 27(1). P.57-86.
76. O’Reilly T., McNamara D.S. Good texts can be better for skilled comprehenders //Discourse Processes. 2006. 43. P.121-152.
77. Rowe M., Ozuru Y., McNamara D.S. An analysis of a standardized reading ability test: what do questions actually measure? //Proceedings of the Seventh International Conference of the Learning Sciences. 2006. P.627-633.