Тип работы:
Предмет:
Язык работы:


ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОЦЕНКИ СЛОЖНОСТИ ТЕКСТОВОЙ ИНФОРМАЦИИ

Работа №39978

Тип работы

Дипломные работы, ВКР

Предмет

прочее

Объем работы65
Год сдачи2019
Стоимость3900 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
203
Не подходит работа?

Узнай цену на написание


Введение 3
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОЦЕНКИ СЛОЖНОСТИ ТЕКСТОВОЙ ИНФОРМАЦИИ 6
1.1. Сложность текста как лингвистическое понятие 6
1.2. Жанровая классификация учебных текстов 13
1.3. Формулы определения сложности текстовой информации 15
1.4 Методы морфологической автоматической обработки текстов 21
Выводы по Главе 1 26
ГЛАВА 2. МОРФОЛОГИЧЕКИЙ АНАЛИЗ КОРПУСА ТЕКСТОВ 28
2.1 Морфологический анализ как лингвистический метод 28
2.2 Анализ читабельности учебных текстов 34
2.3 Анализ взаимосвязи жанра текста, частей речи и удобочитаемости 36
Выводы по Главе 2 43
Заключение 44
Список литературы 46
Приложение 1 52
Приложение 2 63
Приложение 3 65



Несмотря на глобальное использование современных технологий, текст по-прежнему остается одним из основных видов хранения и передачи информации. Разработка эффективных подходов к обработке текстов с целью фильтрации, навигации по базе текстов является одним из наиболее актуальных направлений современных информационных технологий. В условиях глобализации образования все чаще встает вопрос о необходимости стандартизации его процессов, требуемой для обеспечения валидности получаемых результатов. Используемые в качестве образовательного материала тексты проходят недостаточный анализ на предмет сложности для чтения и понимания. Результатом становится неравные условия, в которые помещаются обучающиеся при обучении и проверке их языковых умений и навыков. Используя такую отрасль науки, как компьютерную, прикладную лингвистику, которая занимается созданием разнообразных систем по обработке языка, современные лингвисты смогут определить валидность результатов. Но эта обработка невозможна без наличия лингвистических информационных ресурсов.
Данная проблема рассматривалась как отечественными, так и зарубежными учеными-исследователями: Карповым Н. В., Оборневой И. В., Солнышкиной М. И., Усталовым Д. А., Филиповой А. М., Callan J, Chall J.S., Chissom B.S., Collins-Thompson K., Flesch R., Kincaid J.P., Mcnamara T., Rogers R.L., Schwarm S.E.
Актуальность исследования обуславливается необходимостью изучения учебных текстов для определения их соответствия уровню знаний и способностей обучающихся.
Объектом исследования является процесс морфологического анализа корпуса текстов Spotlight для 8 класса.
Предметом исследования являются автоматическая обработка учебных текстов, метод морфологического анализа словоформ.
Целью данной дипломной работы является определение соответствия уровня сложности учебника стандартному уровню лингвистического и когнитивного уровня обучающихся.
Достижение поставленной цели предполагает решение следующих задач:
1. Проанализировать современные методы автоматической обработки текста.
2. Рассмотреть и определить понятие «сложность текстов».
3. Создать корпус текстов 8 класса учебника Spotlight.
4. Провести морфологический анализ текстов учебника Spotlight и выявить соотношение частей речи в учебных текстах.
5. Сравнить результаты морфологического анализа и сложности текстов.
Материалом исследования послужили тексты учебника Spotlight для 8 класса. Общий объем рассматриваемого языкового корпуса составил 38 текстов суммарным объемом 7539 словоупотреблений.
В работе использовались такие методы и приемы анализа как логический, дискурсивный, метод корпусной лингвистики, а также автоматизированный анализ, осуществляемый при помощи программ Parts- of-speech.Info и Coh-Metrix.
В ходе исследования была осуществлена верификация следующей гипотезы:
Научная новизна работы определяется тем, что был впервые осуществлен морфологический анализ текстов для чтения учебника Spotlight.
Теоретическая значимость работы состоит в том, что полученные в ходе исследования выводы вносят определённый вклад в развитие компьютерной и корпусной лингвистики.
Практическая значимость данной работы состоит в возможности использования полученных результатов в вузах, компьютерной лингвистике, при автоматической обработке текста, в лексикологии, лексикографии, а также в преподавании английского языка как иностранного.
Цель и задачи исследования определили структуру и объем работы, которая состоит из 2 глав - теоретической и практической, заключения, списка литературы, приложений.
Во введении представлена актуальность выбранной темы, ставятся цели, указываются объект и предмет исследования, перечисляются основные задачи, выдвигается гипотеза, анализируется теоретическая значимость, научная новизна, указывается практическая ценность данной работы, разбирается структура данной работы.
В первой главе «ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОЦЕНКИ СЛОЖНОСТИ ТЕКСТОВОЙ ИНФОРМАЦИИ» сообщается о методах автоматической обработки текста, в том числе морфологического анализа, рассматривается понятие «сложности текстов».
Во второй главе «МОРФОЛОГИЧЕСКИЙ АНАЛИЗ КОРПУСА ТЕКСТОВ» проводится морфологический анализ корпуса текстов, а также сравнение результатов морфологического анализа.
В заключение представлены выводы, подтверждающие гипотезу.
ГЛАВА 1. ТЕОРЕТИЧЕСКИЕ ОСНОВЫ ОЦЕНКИ СЛОЖНОСТИ ТЕКСТОВОЙ ИНФОРМАЦИИ
1.1. Сложность текста как лингвистическое понятие
В работах лингвистов текст рассматривается как одна из основ лингвистических исследований. Определенная часть ученых считает основной единицей языка не слово и предложение, а именно текст. «Именно текст, а не предложение является высшим и независимым языковым единством» [16, с 4]. И. Р. Гальперин в своей монографии «Текст как объект лингвистического исследования» приводит различные определения текста, отмечает многосторонность данного понятия и на основе выделения того, что является ведущим, автор выделяет следующее: «Текст - это произведение речетворческого процесса, обладающее завершенностью, объективированное в виде письменного документа, литературно обработанное в соответствии с типом этого документа, произведение, состоящее из названия (заголовка) и ряда особых единиц (сверхфразовых единств), объединенных разными типами лексической, грамматической, логической, стилистической связи, имеющее определенную целенаправленность и прагматическую установку» [6, с. 18].
В современной концепции обучения иностранным языкам доминирует идея главенства коммуникативной компетенции, широко использующая различные источники для создания учебных материалов. Аутентичные аудио и видеозаписи, а также живое общение с носителями языка чаще становится обязательным компонентом процесса освоения языка. Тем не менее, текстовая информация удерживает ключевую роль в обучении иностранным языкам, поскольку она обеспечивает обучающихся данными языка, на основе которых происходит формирование словарного запаса, приобретаются знания о грамматических и синтаксических структурах языка, возникает осознание того, как в языке осуществляется передача логических связей между идеями.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Разработчикам учебных текстов стоит обращать внимание на жанры текста и количество содержащихся в них различных частей речи, в особенности существительных, прилагательных и глаголов.
В ходе исследования нами были выполнены все поставленные теоретические и практические задачи и цели, результатом которых стало доказательство важности изучения частей речи в текстах различных жанров и их сложности, которые может поспособствовать правильному выбору учебных текстов для обучающихся.
Дальнейшие перспективы научного исследования заключаются в попытке усовершенствовать требования к составлению текстов, используемых в обучении иностранным языкам. Самостоятельная ценность исследования заключается в возможности использования полученных результатов в вузах, компьютерной лингвистике, при автоматической



1. Автоматическая обработка текстов на естественном языке и анализ данных : учеб. пособие / Большакова Е.И., Воронцов К.В., Ефремова Н.Э., Клышинский Э.С., Лукашевич Н.В., Сапин А.С. — М.: Изд-во НИУ ВШЭ, 2017. — 269 с.
2. Автоматическая обработка текстов на естественном языке и
компьютерная лингвистика: учеб. пособие / Большакова Е.И.,
Клышинский Э.С., Ландэ Д.В., Носков А.А., Пескова О.В., Ягунова Е.В. - М.: МИЭМ, 2011. - 272 с.
3. Английский язык. 8 класс : учеб. для общеобразоват. учреждений / Ю.Е. Ваулина, В. Эванс, Дж. Дули, О.Е. Подоляко. - 2-изд., доп. и перераб. - М.
: Express Publishing : Просвещение, 2012. 216 с.: ил. - (Английский в фокусе).
4. Бабайлова А. Э. Текст как продукт, средство и объект коммуникации при обучении неродному языку - Саратов: Изд-во Саратовского университета, 1987. - 130 с.
5. Васильев В. Г., Кривенко М. П. Методы автоматизированной обработки текстов. — М.: ИПИ РАН, 2008. - 305 с.
6. Гальперин, И. Р. Текст как объект лингвистического исследования [Текст] / И. Р. Гальперин. - изд. 5-е, стереотипное. М. : Ком Книга, 2007. - 144 с. с. 18.
7. Глушань, В.М. Компьютерный анализ сложности текстов учебнометодических разработок как средство повышения качества обучения / В.М. Глушань // Вестник Таганрогского института имени А.П. Чехова. -
2016. - С. 71-76.
8. Компьютерная лингвистика и интеллектуальные технологии: По
материалам ежегодной Международной конференции «Диалог» (Бекасово, 25-29 мая 2011 г.). / Bocharov V., Bichineva S., Granovsky D.,
Ostapuk N., Stepanova M. Quality assurance tools in the OpenCorpora project // Вып. 10 (17). — М.: РГГУ, 2011.
9. Лернер И.Я. Критерии сложности некоторых элементов учебника: Проблемы школьного учебника. / И.Я. Лернер. - М.: Просвещение, 1974. Вып. 1. - С. 47-58.
10. О понятии сложности // Логика и методология науки: материалы IV Всесоюз. симпоз. (Москва, 1967) / Бирюков Б.В., Тюхтин B.C. - С. 219231.
11. Пруцков А. В. Генерация и определения форм слов естественных языков на основе их последовательных преобразований// Вестник Рязанского государственного радиотехнического университета. — 2009. — № 27. —
С. 51-58.
12. Пушкина Е.С. Теоретико-экспериментальное исследование структурносемантических параметров текста: автореф. дис. ... канд. филол. наук / Е.
С. Пушкина. - Кемерово, 2004. - 155 с.
13. Сокирко А.В. Морфологические модули на сайте www.aot.ru // Труды международной конференции «Диалог-2004. Компьютерная лингвистика и интеллектуальные технологии». М.: Наука, 2004. — С. 559.
14. Солнышкина С. И., Кисельников А. С. Сложность текста: этапы изучения в отечественном прикладном языкознании / С. И. Солнышкина, А. С. Кисельников // Вестник ТГУ. Филология. - №6 (38). - 2015. - с.86-100.
15. Томина, Ю.А. Объективная оценка языковой трудности текстов (описание, повествование, рассуждение, доказательство) : авторев.дис. ... канд. пед. наук / Томина Юлия Алексеевна. - М., 1985. - 21с.
16. Тураева З. Я. Лингвистика текста. Текст: структура и семантика: учеб. пособие. Изд-е 2-е, доп. М.: Книжный дом "ЛИБРОКОМ", 2009. 144 с.]
17. Ушаков К.М. О критериях сложности учебного материала школьных предметов // Новые исследования в педагогических науках. № 2 (36) / сост. И.К. Журавлев, B.C. Шубинский. - М.,1980. - С. 33-35.
18. Шпаковский, Ю. Ф. Оценка трудности восприятия текста / Ю. Ф. Шпаковский // Труды БГТУ. Серия 4: Принт- и медиатехнологии. - 2012.
- С. 72-75.
19. Яцко, В.А. Алгоритмы и программы автоматической обработки текста / В.А. Яцко // Вестник Иркутского государственного лингвистического университета. - 2012. - С. 150-161.
20. Biber D. Using register-diversified corpora for general language studies / D. Biber. - Computational Linguistics. - vol. 19 no. 2. - 1993. - p.219-242.
21. Crossley S. A. Computational assessment of lexical differences in L1 and L2 writing. / S. A. Crossley, & D. S. McNamara // Journal of Second Language Writing, 18(2). - 2009. - p. 119-135.
22. Crossley, S.A. / Interlanguage Talk: A computational analysis of non-native speakers’ lexical production and exposure. / S. A. Crossley, & D. S. McNamara // In P.M. McCarthy & C. Boonthum-Denecke (Ed.), Applied natural language processing and content analysis: Identification, investigation, and resolution. -
2012. - p. 425-437.
23. Crossley S.A., The role of lexical cohesive devices in triggering negotiations for meaning. / S. A. Crossley, Scott, T.L. Salsbury & D.S. McNamara // Issues in Applied Linguistics, 18(1) - 2010.
24. Fielding G. Language and Interpersonal Relations. / G.Fielding, C. Fraser// In
I. Markova (ed.), The Social Context of Language, Chichester: Wile, 1978. - p. 217-232.
25. Flesch R. A new readability yardstick / R. Flesch - Journal of Applied Psychology, 32, 1948. — С. 221—233.
26. Gorfein, D.S. ed. 1989. Resolving Semantic Ambiguity. / New York: Springer Verla.
27. Hasan, R. Ways of saying: ways of meaning. In R. P. Fawcett, M.A.K. Halliday, S.M. Lamb, A. Makkai (eds.), The semiotics of Culture and Language. Vol. 1 Language as Social Semiotic, London & Dover: Pinter, 1984,
- p. 105-162.
28. Halliday M.A.K. Spoken and written language. / Oxford: Oxford University Press, 1985.
29. Heylighen F. Formality of Language: Definition, Measurement and Behavioral Determinants / F. Heylighen and J.M. Dewaele // Technical Report. - Free University of Brussels. - Brussels, Belgium. - 1999.
30. Heylighen F. Variation in the Contextuality of Language: An Empirical Measure. / F. Heylighen and J.M. Dewaele // Foundations of Science 7. - 2002.
- p. 293-340.
31. Iyer R. Relevance weighting for combining multi-domain data for n-gram language modeling / R. Iyer, M. Ostendorf // Computer Speech and Language
- vol. 13, no. 3. - 1999. - p. 267-282.
32. Lahiri S. Informality judgment at sentence level and experiments with formality score. / S. Lahiri, P. Mitra, X. Lu. // Computational Linguistics and Intelligent Text Processing. - 2011. - p. 446-457.
33. Leckie-Tarry H. Language and context. A functional linguistic theory of register. / London-New York: Pinter, 1995.
34. Lim C. S., Automatic genre detection of web documents / C.S. Lim, K. J. Lee, and G. C. Kim // in IJCNLP - 2004.
35. McNamara Linguistic features of writing quality. / McNamara, S. Danielle, S.
A. Crossley, & P. M. McCarthy // Written Communication, 27(1), 2010. - p. 57-86.
36. McNamara Natural language processing in an intelligent writing strategy tutoring system. / McNamara, S. Danielle, S.A. Crossley, R. Roscoe // Behavior Research Methods, 45(2), 2013. - p. 499-515.
37. McNamara World knowledge driving young readers’ comprehension difficulties. / McNamara, S. Danielle, R.G. Floyd, R. Best, M. Louwerse.// In Proceedings of the 6th international conference on Learning sciences. 2004. - p. 326-333.
38. Porter M.F. An algorithm for suffix stripping / M.F. Porter // Program, 14(3),
p. 130-137.
39. Santini M. A shallow approach to syntactic feature extraction for genre classification / CLUK 7: The UK special-interest group for computational linguistics. - 2004.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ