Введение 4
Глава 1. Учебный текст: понятие и характеристики 8
1.1. Текст как лингвистическая категория 8
1.2. Измерение сложности текста: приемы, подходы, инструменты 14
1.3. Алгоритм автоматической обработки текстов 16
1.3.1. Программное обеспечение при извлечении информации из текстов.... 19
1.3.2. Программа WebFX как инструмент извлечения лингвистических
параметров текста 26
Выводы по Главе 1 29
Глава 2. Количественные и качественные параметры учебных текстов 30
2.1. Сложность текстов: параметр читабельности по Флеш-Кинкейду 30
2.2. Оценка сложности текстов в зависимости от типа чтения 40
2.3. Извлечение лингвистических параметров текстов на основе УМК
Spotlight для 9 класса 47
Выводы по Главе 2 55
Заключение 56
Список литературы 58
Приложение 1 64
Приложение 2 68
Приложение 3 72
Приложение 4 77
Приложение 5 81
Приложение 6 86
Приложение 7 91
Современное обучение иностранному языку требует использования различных методов и приемов, основанных в основном на использование аутентичных или адаптированных текстов. Академические тексты имеют разную степень сложности, поэтому их выбор должен соотноситься с уровнем владения языка обучающимися, т.е. с их языковой компетенцией. Успешное и эффективное овладение иностранным языком происходит тогда, когда тексты в учебно-методическом комплексе (УМК) располагаются в порядке возрастания их уровня сложности, причем порядок возрастания должен быть размеренным и плавным, что облегчает задачу обучающимся в усвоении материала на определенном этапе обучения и переходе на новый уровень владения языком.
Развитие Интернета и вместе тем увеличение количество доступной текстовой информации способствовало развитию такой научной области, как автоматическая обработка текстов (Natural Language Processing) и компьютерная лингвистика (Computational Linguistics), в рамках которой были разработаны приложения и программы, помогающие оценить тексты по различным параметрам.
В области автоматической обработки текстов в качестве объекта обработки используются тексты естественного языка. Для осуществления качественной обработки базовые знания лингвистики являются необходимостью. Кроме того, лингвистика включает такие области, как фонология, морфология, синтаксис, семантика и прагматика, лексикография, поэтому обработка текстов проходит на разных уровнях лингвистики.
Однако, помимо обработки текстов на основных уровнях лингвистики, используются различные формулы читабельности, которые извлекают количественные и качественные параметры текстов. С помощью этих формул читабельности можно оценить уровень сложности текстов, предлагаемых в отечественных УМК. А именно то, что это важно для
Современные реалии обучения представляют огромный спектр учебно - методических комплексов, содержащих тексты, относящихся к различным тематикам, а также характеризующиеся определенной сложностью. При выборе УМК важно обращать внимание на различные параметры текста, которые помогут оценить качество текста, выявить его основные трудности, что предупредит дальнейшие трудности, с которыми могут столкнуться обучающиеся.
В ходе систематизации теоретических основ сложности текста и проведения собственной экспериментальной работы выделяется необходимость более широкого анализа извлечения информации из учебных текстов перед их использованием на уроках английского языка на средней ступени обучения. Крайне важно соотносить тексты с такими понятиями, как «сложность текста», «читабельность текста».
В рамках исследования были определены основные лингвистические и прагматические категории текста, его количественные и качественные параметры; были установлены характеристики, выявленные после автоматических анализов сложности и извлечения информации учебных текстов.
Стоит отметить, что результаты оценивания уровня сложности и извлечение информации можно получить быстро с помощью определенных автоматизированных программ, однако для качественной оценки мы прибегли к сравнительно-сопоставительному анализу и выборке определенных параметров различных программ, что важно для качественного анализа.
В ходе исследования выявленные ранее гипотезы были подтверждены: важно учитывать максимальное количество параметров текста для детального анализа, в отечественном УМК Spotlight для 9-го класса есть тенденция к увеличению сложности тексты от начального до конечного текстов, что соответствует требуемым стандартам. Однако, судя по полученным результатам, количественные и качественные параметры относительно удовлетворяют предполагаемому для 9-го класса уровню сложности, но индекс Флеша-Кинкейда выявил, что большинство текстов не обладают высокими показателями сложности, хотя результаты оценки количественных параметров сложности текстов удовлетворяют ступени обучения, и тексты имеют разные уровни сложности.
Полученные в результате исследования данные можно использовать как основу для создания УМК, полностью соответствующего под требования читабельности, сложности учебных текстов по английскому языку в рамках педагогического процесса. Или поспособствует к заимствованию зарубежного опыта, предусмотренного в учебных заведениях США. Американские лингвисты с помощью формул читабельности установили уровень сложности учебников для того, чтобы учителя сами могли выбрать учебные материалы, доступные для восприятия учениками на определенной этапе обучения. Таким образом, зарубежный опыт наводит на такое решение проблем использования УМК: необязательно каждая школа должна
обучаться при помощи конкретного УМК, как, например, Spotlight. Важно учитывать не сам УМК, его организацию, сложность и доступность, а то, насколько он будет эффективен во время процесса обучения иностранному языку.
Таким образом, компьютерная лингвистика помогает развитию академического обучения, облегчая работу лингвистам, так как автоматизированные программы дают результаты максимально приближенные к действительности и занимают меньше времени оценки сложности текстов.