Тип работы:
Предмет:
Язык работы:


АВТОМАТИЧЕСКАЯ ОБРАБОТКА ТЕКСТОВ: ИЗВЛЕЧЕНИЕ ИНФОРМАЦИИ ИЗ ТЕКСТОВ (НА МАТЕРИАЛЕ УЧЕБНЫХ ТЕКСТОВ)

Работа №39101

Тип работы

Дипломные работы, ВКР

Предмет

педагогика

Объем работы105
Год сдачи2019
Стоимость6500 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
387
Не подходит работа?

Узнай цену на написание


Введение 4
Глава 1. Учебный текст: понятие и характеристики 8
1.1. Текст как лингвистическая категория 8
1.2. Измерение сложности текста: приемы, подходы, инструменты 14
1.3. Алгоритм автоматической обработки текстов 16
1.3.1. Программное обеспечение при извлечении информации из текстов.... 19
1.3.2. Программа WebFX как инструмент извлечения лингвистических
параметров текста 26
Выводы по Главе 1 29
Глава 2. Количественные и качественные параметры учебных текстов 30
2.1. Сложность текстов: параметр читабельности по Флеш-Кинкейду 30
2.2. Оценка сложности текстов в зависимости от типа чтения 40
2.3. Извлечение лингвистических параметров текстов на основе УМК
Spotlight для 9 класса 47
Выводы по Главе 2 55
Заключение 56
Список литературы 58
Приложение 1 64
Приложение 2 68
Приложение 3 72
Приложение 4 77
Приложение 5 81
Приложение 6 86
Приложение 7 91
Приложение 9 101

Современное обучение иностранному языку требует использования различных методов и приемов, основанных в основном на использование аутентичных или адаптированных текстов. Академические тексты имеют разную степень сложности, поэтому их выбор должен соотноситься с уровнем владения языка обучающимися, т.е. с их языковой компетенцией. Успешное и эффективное овладение иностранным языком происходит тогда, когда тексты в учебно-методическом комплексе (УМК) располагаются в порядке возрастания их уровня сложности, причем порядок возрастания должен быть размеренным и плавным, что облегчает задачу обучающимся в усвоении материала на определенном этапе обучения и переходе на новый уровень владения языком.
Развитие Интернета и вместе тем увеличение количество доступной текстовой информации способствовало развитию такой научной области, как автоматическая обработка текстов (Natural Language Processing) и компьютерная лингвистика (Computational Linguistics), в рамках которой были разработаны приложения и программы, помогающие оценить тексты по различным параметрам.
В области автоматической обработки текстов в качестве объекта обработки используются тексты естественного языка. Для осуществления качественной обработки базовые знания лингвистики являются необходимостью. Кроме того, лингвистика включает такие области, как фонология, морфология, синтаксис, семантика и прагматика, лексикография, поэтому обработка текстов проходит на разных уровнях лингвистики.
Однако, помимо обработки текстов на основных уровнях лингвистики, используются различные формулы читабельности, которые извлекают количественные и качественные параметры текстов. С помощью этих формул читабельности можно оценить уровень сложности текстов, предлагаемых в отечественных УМК. А именно то, что это важно для методической науки, т.к. с каждым годом требования к уровню владения иностранным языком повышаются.
Актуальность работы заключается в необходимости оценки и выявления параметров сложности текстов, представленных в учебно- методическом комплексе по обучению иностранного (английского) языка, на основе которых отбираются и адаптируются текстовые учебные материалы при организации учебного процесса.
Целью работы является определение соответствия текстов учебников по английскому языку (УМК ‘Spotlight 9’) когнитивным и лингвистическим способностям учащихся.
Для достижения поставленной цели необходимо решить следующие задачи:
1. Изучить теоретические основы понятий текста, сложности и трудности.
2. Осуществить выборку текстов из выбранного учебно - методического комплекса.
3. Проанализировать выбранные тексты по различным параметрам, используя программы автоматического анализа (Coh-Metrix, Text Inspector, WebFX).
4. Установить соответствие лингвистических параметров с метриками применяемых формул и программ.
5. Проанализировать изменения уровня сложности текстов в УМК, выявить основные тенденции изменения сложности.
Объектом исследования являются количественные и качественные параметры учебного текста УМК ‘Spotlight’ для 9-го класса.
Предметом исследования являются общее и различное количественных и качественных параметров учебных текстов УМК на различных этапах изучения данного курса.
В ходе исследования были применены следующие приемы и методы исследования: метод сплошной выборки, метод статистического анализа, сравнительно-сопоставительный метод, а также автоматизированный анализ, осуществляемый при помощи программ Text Inspector, WebFX, Coh-Metrix.
Проведенное исследование проводилось на материале текстов из УМК Spotlight для 9-го класса. Общий объем рассматриваемого языкового корпуса составил 47 текстов суммарным объемом 13486 словоупотреблений.
В ходе исследования были выведены следующие гипотезы:
1. Специфика любого учебного текста определяется такими параметрами как, повествовательность, конкретность и абстрактность словарного состава, синтаксическая простота, референциальная и глубинная связность.
2. Тексты, предлагаемые в УМК, усложняются от начального текста до конечного, т.е. по мере изучения учебного материала, и соответствуют языковой компетенции обучающихся;
3. В отечественных УМК используются более объемные академические тексты, характеризующиеся менее плавным изменением уровня сложности текстов.
Научная новизна определяется, в первую очередь, доказательством влияния качественных параметров текста, таких как нарративность, конкретность слов, референциальная и глубинная связности, синтаксическая простота, на сложность учебного текста.
Теоретическая значимость работы заключается в том, что разработанный алгоритм анализа определения сложности текста и извлечение количественных и качественных параметров в дальнейшем может применяться в оценке текстов различных жанров и видов, в том числе, способствовать их систематизации и адаптации.
Практическая значимость результатов исследования состоит в их дальнейшем использовании в области языкознания, теории языка, а также при составлении УМК по изучению иностранного языка.
Структура работы: введение, две главы, выводы по главам, заключение, список литературы, приложения, включающие 47 текстов, объединенные по модулям, и упражнения к этим текстам.
Во введении говорится об актуальности выбранной темы, указываются цели, объект и предмет исследования, намечаются основные задачи, анализируется теоретическая значимость, указывается практическая ценность данной работы, разбирается структура данной работы.
В теоретической главе «Учебный текст: понятие и его характеристики» определяются теоретические основы сложности текста, описывается понятие и сущность текста и его сложность, рассматриваются лингвистические параметры извлечения информации из текста.
В практической главе «Количественные и качественные параметры учебных текстов» разбираются виды автоматического анализа текстов, проводится анализ сложности текстов УМК по обучению английскому языку Spotlight для 9-го класса.
В заключение предложены выводы, подтверждающие выведенные к защите гипотезы, а именно, наличие тенденции к усложнению текстов от первого текста УМК до последнего, выявленные в результате осуществленного исследования.


Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Современные реалии обучения представляют огромный спектр учебно - методических комплексов, содержащих тексты, относящихся к различным тематикам, а также характеризующиеся определенной сложностью. При выборе УМК важно обращать внимание на различные параметры текста, которые помогут оценить качество текста, выявить его основные трудности, что предупредит дальнейшие трудности, с которыми могут столкнуться обучающиеся.
В ходе систематизации теоретических основ сложности текста и проведения собственной экспериментальной работы выделяется необходимость более широкого анализа извлечения информации из учебных текстов перед их использованием на уроках английского языка на средней ступени обучения. Крайне важно соотносить тексты с такими понятиями, как «сложность текста», «читабельность текста».
В рамках исследования были определены основные лингвистические и прагматические категории текста, его количественные и качественные параметры; были установлены характеристики, выявленные после автоматических анализов сложности и извлечения информации учебных текстов.
Стоит отметить, что результаты оценивания уровня сложности и извлечение информации можно получить быстро с помощью определенных автоматизированных программ, однако для качественной оценки мы прибегли к сравнительно-сопоставительному анализу и выборке определенных параметров различных программ, что важно для качественного анализа.
В ходе исследования выявленные ранее гипотезы были подтверждены: важно учитывать максимальное количество параметров текста для детального анализа, в отечественном УМК Spotlight для 9-го класса есть тенденция к увеличению сложности тексты от начального до конечного текстов, что соответствует требуемым стандартам. Однако, судя по полученным результатам, количественные и качественные параметры относительно удовлетворяют предполагаемому для 9-го класса уровню сложности, но индекс Флеша-Кинкейда выявил, что большинство текстов не обладают высокими показателями сложности, хотя результаты оценки количественных параметров сложности текстов удовлетворяют ступени обучения, и тексты имеют разные уровни сложности.
Полученные в результате исследования данные можно использовать как основу для создания УМК, полностью соответствующего под требования читабельности, сложности учебных текстов по английскому языку в рамках педагогического процесса. Или поспособствует к заимствованию зарубежного опыта, предусмотренного в учебных заведениях США. Американские лингвисты с помощью формул читабельности установили уровень сложности учебников для того, чтобы учителя сами могли выбрать учебные материалы, доступные для восприятия учениками на определенной этапе обучения. Таким образом, зарубежный опыт наводит на такое решение проблем использования УМК: необязательно каждая школа должна обучаться при помощи конкретного УМК, как, например, Spotlight. Важно учитывать не сам УМК, его организацию, сложность и доступность, а то, насколько он будет эффективен во время процесса обучения иностранному языку.
Таким образом, компьютерная лингвистика помогает развитию академического обучения, облегчая работу лингвистам, так как автоматизированные программы дают результаты максимально приближенные к действительности и занимают меньше времени оценки сложности текстов.



1. Автоматическая обработка текстов на естественном языке и анализ данных : учеб. пособие / Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. - М.: Изд-во НИУ ВШЭ, 2017. - 269 с.
2. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика: учеб. пособие / Большакова Е.И., Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. - М.: МИЭМ, 2011. - 272 с.
3. Азимов, Э. Г. Новый словарь методических терминов и понятий (теория и практика обучения языкам) [Текст] / Э. Г. Азимов, А. Н. Щукин. - М. : ИКАР, 2009. - 448 с.
4. Александров Е.П.Учебный текст и текстовая деятельность в образовательном процессе / Е.П. Александров // Вестник Таганрогского института управления и экономики. - №2. - 2015. - С. 130-136
5. Английский язык. 9 класс : учеб. для общеобразоват. учреждений / [Ю.Е. Ваулина, В. Эванс, Дж. Дули, О.Е. Подоляко]. - 2-изд., доп. и перераб. - М. : Express Publishing : Просвещение, 2010. 216 с.: ил. - (Английский в фокусе)
6. Бабайлова А. Э. Текст как продукт, средство и объект
коммуникации при обучении неродному языку - Саратов: Изд-во
Саратовского университета, 1987. - 130 с.
7. Васильев В. Г., Кривенко М. П. Методы автоматизированной обработки текстов. — М.: ИПИ РАН, 2008. - 305 с.
8. Г альскова Н. Д., Г ез Н. И. Теория обучения иностранным языкам. Лингводидактика и методика учеб. пособие для студ. лингв. Ун-тов и фак. ин. яз. высш. пед. учеб. заведений / Н. Д. Гальскова, Н. И. Гез. - 3-е изд., стер. - М.: Издательский центр «Академия», 2006. - 336 с.
9. Гальперин, И. Р. Текст как объект лингвистического исследования [Текст] / И. Р. Гальперин. - изд. 5-е, стереотипное. М. : Ком Книга, 2007. - 144 с.
10. Глушань, В.М. Компьютерный анализ сложности текстов учебнометодических разработок как средство повышения качества обучения / В.М. Глушань // Вестник Таганрогского института имени А.П. Чехова. - 2016. - С. 71-76
11. Гончарова, Л. В. Актуальные проблемы современного обучения иностранным языкам / Л. В. Гончарова // Вестник Краснодарского университета МВД России. - №4 (22) - 2013. - с. 133-136
12. Жеребило, Т. В. Словарь лингвистических терминов [Текст] / Т.
B. Жеребило. Изд. 5-е, испр-е и дополн. - Назрань : Изд-во "Пилигрим", 2010. - 486 с.
13. Зильберглейт М.А., Шпаковский Ю.Ф., Невдах М.М. Повышение качества учебной литературы / М.А. Зильберглейт, Ю.Ф. Шпаковский, М.М. Невдах // Труды БГТУ. Серия 4: Принт- и медиатехнологии. - 2012. - С.89-92
14. Касевич, В.Б. Элементы общей лингвистики / В.Б. Касевич — М., Наука, 1977. - 183 с.
15. Кисельников А.С. Экзаменационный текст: сущность, специфика, фукнции (на материале русского и английского языков): дис...канд.фил.наук / А.С. Кисельников. - Казань, 2017. - 243 с.
16. Криони Н.К., Никин А.Д., Филиппова А.В. Автоматизированная система анализа сложности учебных текстов / Н.К. Криони, А.Д. Никин, А.В. Филиппова // Вестник УГАТУ. - Управление, ВТиИ. - 2008. - Т.11, №1 (28).
C. 101-107
17. Лапошина, А.Н. Анализ релевантных признаков для автоматического определения сложности русского текста как иностранного /
А.Н. Лапошина // Кафедра компьютерной лингвистики Института лингвистики РГГУ. - Москва. - С.1-7
18. Лернер, И. Я. Критерии сложности некоторых элементов учебника [Текст] / И. Я. Лернер // Проблемы школьного учебника. - М. : Просвещение, 1974. - Вып. 1. - С. 47-58.
19. Мацковский, М. С. Проблемы читабельности печатного материала [Текст] / М. С. Мацковский // Смысловое восприятие речевого сообщения в условиях массовой коммуникации ; отв. ред. Т. М. Дридзе, А. А. Леонтьев. - М. : Наука, 1976. - С. 126-142.
20. Мизернов И.Ю., Гращенко Л.А. Анализ методов оценки сложности текста / И.Ю. Мизернов, Л.А. Гращенко // Новые информационные технологии в автоматизированных системах. - 2015. - С. 572-581
21. Микк, Я. А. О факторах понятности учебного текста [Текст] : автореф. дисс. ... канд. пед. наук : 13.00.00 / Микк Яан Арнольдович. - Тарту, 1970. - 22 с.
22. Микк, Я. А. Методика измерения трудности текста [Текст] / Я. А. Микк // Вопросы психологии. - М. : Педагогика, 1975. - № 3. - С. 147-155.
23. Невдах М. М., Шпаковский Ю. Ф. Новая классификация методов определения понимания текста / М. М. Невдах, Ю. Ф. Шпаковский // Труды БГТУ. Сер. IX. Издат. дело и полиграфия. - 2007. Вып. XV. - c.1-5
24. Невдах, М.М. Повышение качества учебной литературы / М.А. Зильберглейт, Ю.Ф. Шпаковский, М.М. Невдах // Труды Белорусского государственного технологического университета. - 2012. - №9. - С. 89-92
25. Никин, А.Д. Информационная система анализа учебного текста /
А.Д. Никин, Н.К. Криони, А.В. Филиппова // Телематика’2007 : тр. XVI Всерос. Науч.-метод.конф. Т.2 ГосНИИ информ.технол. и телекоммуникаций «Информика», 2007. С.463-465.
26. Обласова, Т.В. Специфика отбора учебных текстов для развития учебно-информационных умений школьников в процессе изучения литературы / Т.В. Обласова // Известия РГПУ им. А.И.Герцена. - 2012. - С. 41-49
27. Оборнева, И.В. Автоматизированная оценка сложности учебных текстов на основе статистических параметров : дис. ... канд. пед. наук / Оборнева Ирина Владимировна. - М., 2006. - 165 с.
28. Оборнева, И.В. Автоматизация оценки качество восприятия текста // Вестник Московского городского педагогического университета. 2005. №2 (5). - С.221-233
29. Солнышкина М.И., Кисельников А.С. Параметры сложности экзаменационных текстов / М.И. Солнышкина, А.С. Кисельников // Вестник Волгоградского государственного университета. Серия 2: Языкознание. №1 (25) - 2015. - С. 99-107
30. Солнышкина С. И., Кисельников А. С. Сложность текста: этапы изучения в отечественном прикладном языкознании / С. И. Солнышкина, А. С. Кисельников // Вестник ТГУ. Филология. - №6 (38). - 2015. - с.86-100
31. Сохор, А.М. Логическая структура учебного материала / А.М. Сохор. М.: Педагогика, 1974. 119с.
32. Сунгатуллина, Д.Д. Специфика экзаменационного текста: вторичность, функции, сложность (на материале русского и английского языков): дис.канд.фил.наук / Д.Д. Сунгатуллина. - Казань, 2018. - 28с.
33. Томина, Ю.А. Объективная оценка языковой трудности текстов (описание, повествование, рассуждение, доказательство) : авторев.дис. ... канд. пед. наук / Томина Юлия Алексеевна. - М., 1985. - 21с.
34. Фоломкина, С.К. Обучение чтению на иностранном языке в неязыковом вузе [Текст] : учеб.-метод. пособие для вузов / С.К. Фоломкина. - Москва : Высшая школа, 1987. - 207с.
35. Шпаковский, Ю. Ф. Оценка трудности восприятия текста / Ю. Ф. Шпаковский // Труды БГТУ. Серия 4: Принт- и медиатехнологии. - 2012. - С. 72-75
36. Яхиббаева, Л.М. Учебный текст как особый вид вторичного текста и составляющая учебного дискурса. Вестник Башкирского университета 2008 - С. 1029-1031
37. Яцко, В.А. Алгоритмы и программы автоматической обработки текста / В.А. Яцко // Вестник Иркутского государственного лингвистического университета. - 2012.- С. 150-161
38. A Psychological and Computational Study of Sub-Sentential Genre Recognition / P.M. McCarthy [et al.] // JLCL. - 2009. - Vol.24 №1. - Р. 23-55
39. Brinton L.J. The structure of modern English [Text] / L.J. Brinton. - Amsterdam; Philadelphia : John Benjamins, 2000. - 335p
40. Graesser, A. C. Coh-Metrix: analysis of text on cohesion and language [Text] / A. C. Graesser, D. S. McNamara, M. M. Louwerse, Z. Cai // Behavioral Research Methods, Instruments and Computers. - Memphis, Tennessee : University of Memphis, 2004. - Р. 193-202.
41. Crossley, S.A. Text Readability and Intuitive Simplification : A Comparison of Readability Formulas/ S.A. Crossley, D.B. Allen, D.S. McNamara // Reading in A Foreign Language. - 2011. - Vol. 23, №1. - P.84-101
42. Flesch R., The Art of Readable Writing, Harper (New York), 1949
43. Graesser,A.C., McNamara,D.S.,& Louwerse,M.M (2003). What do readers need to learn in order to process coherence relations in narrative and expository text. In A.P. Sweet and C.E. Snow (Eds.), Rethinking reading comprehension (pp. 82-98). New York: Guilford Publications
44. Graesser, A. C. Coh-Metrix: Providing multilevel analyses of text characteristics [Text] / A. C. Graesser, D. S. McNamara, & J. Kulikowich // Educational Researcher. - 2011. - Vol. 40 - P. 223-234.
45. Kincaid, J. P. Derivation of new readability formulas (Automated Readability Index, Fog Count and Flesch Reading Ease Formula) for navy enlisted personnel [Text] / J. P. Kincaid, R. P. Fishburne, R. L.Rogers, B. S. Chissom // Naval technical training command. - Memphis, TN : Naval Air Station, 1975. - 40 p.
46. Solnyshkina, M. I., Comparative Coh-Metrix analysis of reading comprehension texts: Unified (Russian) state exam in English vs Cambridge First Certificate in English [Text] / M. I. Solnyshkina, E. V. Harkova, A. S. Kiselnikov // English Language Teaching. - Canada : Canadian Center of Science and Education, 2014. - Vol.7. No. 12. - P. 65-76.
47. Индексы Флеша-Кинкейда - Режим доступа: http://www.cpanel.stpaulsscience.org/gceict/skills/pi/pi01/accuracy/readability/fkg. htm
48. Программа Coh-Metrix - Режим доступа: http://tea.cohmetrix.com/
49. Программа Text Inspector - Режим доступа: https://textinspector.com/
50. Программа WebFX - Режим доступа: https://www.webfx.com/
51. Free Online OCR Service - Режим доступа: https://www.onlineocr.net/


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2024 Cервис помощи студентам в выполнении работ