Тип работы:
Предмет:
Язык работы:


ГЕНЕРАЦИЯ УЧЕБНЫХ МАТЕРИАЛОВ ПО МЕТОДУ ПАЛМЕРА С РАСПОЗНАВАНИЕМ ОМОНИМОВ МЕТОДОМ КОМПОНЕНТНОГО АНАЛИЗА

Работа №23177

Тип работы

Магистерская диссертация

Предмет

информатика

Объем работы70
Год сдачи2016
Стоимость5700 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
450
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 Анализ и сравнение разработок в области автоматической генерации осмысленного текста 7
1.1 Обзор предметной области 7
1.2 Основные определения 8
1.3 Сравнение функционала аналогичных разработок 9
1.3.1 Программа SeoGenerator 9
1.3.2 Программа GeneratingtheWeb 11
1.3.3 Программа Delirium 1.8 13
1.3.4 Программа ArticleCloneEasy 13
1.3.5 Программа СинонимайзерM1pluss 14
1.3.6 Программа SyMonym 16
1.3.7 Программа MonkeyWrite 17
1.3.8 Вывод по рассмотренным аналогам 18
2 Разработка программы генерации учебных материалов 20
2.1 Методы и средства разработки программы автоматической генерации
осмысленного текста для учебных материалов 20
2.1.1 Метод Палмера и необходимость генерации учебных заданий по этому
методу 21
2.1.2 Метод компонентного анализа и его применение для распознавания
омонимических групп 23
2.1.3 Генерация подстановочных таблиц с фонетическими пояснениями ... 25
2.1.4 Принцип использования реляционных баз данных в работе алгоритма
генерации подстановочных таблиц 30
2.1.5 Частотный и грамматический анализ как этапы работы алгоритма
генерации подстановочных таблиц 30
2.1.6 Семантический анализ как этап работы алгоритма генерации
подстановочных таблиц 32
2.1.7 Общая схема разрабатываемой программы «Генератор
подстановочных таблиц» 33
2.2 Интерфейс программы«Генератор подстановочных таблиц» 34
3 Интеграция программы «Генератор подстановочных таблиц» в ряд
программных продуктов 40
3.1 Описание программы Automatic Mouse and Keyboard 40
3.2 Генерация учебных материалов 41
3.3 Описание основных используемых программ 43
3.4 О системе электронного обучения Сибирского федерального университета 52
3.5 Наполнение электронного курса заданиями на основе сгенерированных
материалов для системы дистанционного обучения СФУ 55
ЗАКЛЮЧЕНИЕ 57
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
ПРИЛОЖЕНИЕ


Проблемной областью является разработка системы автоматической генерации учебных материалов, обеспечения образовательного процесса учебными материалами, а так же повышения эффективности языковой подготовки в техническом вузе в целях индивидуализации траекторий обучения.
Актуальность работы. С развитием вычислительных технологий стали актуальны такие проблемы как построение экспертных систем, синтез и генерация осмысленной речи компьютером на различных языках. Для решения выше представленных проблем применяются различные средства и методы: реляционные таблицы, графы, декларативное программирование, порождающие грамматики и многие другие. По этим методам семантику можно раскладывать, решать конкретную задачу или делать конкретный программный продукт. Например: синонимизатор, «технический справочник», системы диалога с пользователем, экспертные системы, программы электронного перевода.
Также информационные технологии широко используются в сфере образования. Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Электронные образовательные ресурсы - важные компоненты, образующие информационно¬образовательную среду. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса [1].
В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы или издания. В традиционном учебном процессе активно используется интеграция электронных образовательных ресурсов на базе сетевых технологий.
В данной работе рассматривается использование генератора подстановочных таблиц, для обучения студентов по дисциплине английский язык, с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков.
Компьютерная лингвистика, информатика, математика и математическая логика - такие аспекты предметных областей затрагивают данное исследование.
Поэтому актуальна задача разработки системы генерации учебных материалов по методу Палмера с распознаванием омонимов методом компонентного анализа. Она поможет решить такие проблемы как:
1) Снижение количества рутиной работы преподавателей за счет ее автоматизации, генерация учебных материалов;
2) Снижение не продуктивных затрат на монотонные действия пользователя при создании электронных ресурсов;
3) Решение проблемы разработки электронных курсов в кратчайшие сроки с учетом регулярного обновления ФОС;
4) Улучшение усвоения материала учащимися.
Новизна работы заключается в алгоритмизации методов компонентного анализа, при выборе омонимических групп слов, для генерации подстановочных таблиц на основе текста на естественном языке.
Цель диссертации: разработать алгоритмическую реализацию системы построения учебных подстановочных таблиц на основе произвольных предложений естественного языка на входе системы.
Задачи диссертации состоят в:
1) распознавании омонимов;
2) разработке алгоритмов построения подстановочных таблиц;
3) разработке алгоритмов оценки предпочтения омонимических групп;
4) разработка программной реализации построения учебных подстановочных таблиц на выходе, на основе произвольных предложений естественного языка на входе системы;
5) разработка программной системы «Генератор подстановочных таблиц»;
6) пополнение базы данных дефинонимов английского языка;
7) переводе данных программ в единую систему с использованием общего формата данных с программами по компьютерной лингвистике магистратуры ИКИТ СФУ.
Необходимо описать метод компонентного анализа, который может быть использован для выявления соответствий смысловых признаков в омонимических группах, позволяющий ранжировать слова в порядке большего совпадения в каждом столбце для всех вариантов в омонимических группах генерируемой таблицы по методу Палмера.
Основная идея работы состоит в создании генератора подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков, также именуемый как «Генератор подстановочных таблиц» и в использовании полученных подстановочных таблиц для системы сопутствующих программных продуктов, учитывая их совместимость. Например, при использовании материалов полученных из программы «Генератор большого объема текстов по стандартным шаблонам» программный продукт «Text-BasedTaskGenerator» составит разнообразные варианты текстовых заданий на основе входного текста.
Назначение программы - необходимость преодоления недостаточно высокого уровня навыков аудирования у студентов высших учебных заведений, что не дает возможность осуществления беглой коммуникации в англоязычной среде с минимальным количеством фонетических ошибок.
Разработанная программа генератор подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков поможет лицам изучающим английский язык быстрое усваивать материал. Решит проблему затруднения изучения, понимания языка и преодоление трудности перевода. По ним учащийся может составить свое первое предложение с возможными ошибками, выбирая из каждой колонки предложенные варианты. Также пополнить свой словарный запас и изучить различные взаимозаменяемые слова в конкретном контексте.
Данные факторы обеспечивают возможность выбора учащимся индивидуальной траектории обучения в зависимости от поставленных задач, что дает возможность достижения более качественного восприятия материала учащимися.
Подстановочные таблицы можно сохранить в текстовом документе и использовать при необходимости для повторения и закрепления пройденного материала.
Объектом исследования является системы генерации учебных материалов для обучения иностранным языкам.
Предметом исследования является средства генерации подстановочных таблиц с учетом преодоления сопутствующий проблем компьютерной лингвистике.

Возникли сложности?

Нужна помощь преподавателя?

Помощь студентам в написании работ!


Была разработана программа «Генератор подстановочных таблиц», а так же алгоритм системы построения учебных подстановочных таблиц на основе произвольных предложений естественного языка на входе системы.
Для улучшения качества обработки строк используется частотный, семантический, грамматический анализы. Их применение и описание изложено во второй главе.
Был описан метод компонентного анализа, который используется для выявления соответствий смысловых признаков в омонимических подгруппах генерируемых таблиц по методу Палмера, используемый для распознавания омонимов и оценки их предпочтения.
Разработан алгоритм построения подстановочных таблиц и расширена база комбинонимов и дефинонимов английского языка. Разработана база семантического анализа слов.
Также в работе рассматривается принцип реляционных баз данных, лежащие в основе генерации подстановочных таблиц, на основе произвольных входных предложений.
Для разработки программы «Генератор подстановочных таблиц» было выбрано решение объединения всех методов и разработана формула, описывающая данное решение.
Реализован перевод выходных данных программ в единую систему с использованием общего формата, с программами по компьютерной лингвистике магистратуры ИКИТ СФУ по средствам использования агентов.
В результате получен качественный программный продукт, отвечающий поставленным целям и задачам.



1. Личаргин, Д. В. К проблеме генерации расширенной фонетической транскрипции на основе векторных порождающих грамматик. [Электронный ресурс] / Д. В Личаргин, В. В. Сотникова, А. А. Усова, В. В. Бутовченко // Современные проблемы науки и образования. - 2015. № 2. . - Режим доступа: http://www.science-education.ru/ru/article/view?id=20933.
2. Усова, А. А. Разработка веб-приложения по генерации учебных заданий к тексту на естественном языке на основе порождаемых шаблонов. / А. А. Усова, В. В. Сотникова, Д. В. Личаргин // Красноярск: Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный- 2015», посвященная 70-летию Великой Победы. - 2015. - С. 7-10.
3. Borko, Н. Abstracting Concepts and Methods / H. Borko, C.L. Bernier // - New York: Academic Press, 1975. - P. 140.
4. Carbonell, J. G. The Use of MMR, Diversity-Based Reranking for Reordering Documents and Producing Summaries / J. G. Carbonell, J. Goldstein // 21st International ACM SIGIR Conference Research and Development in Information Retrieval. - New York, ACM Press, 1998. - P. 335-336.
5. Личаргин, Д. В. Векторные порождающие грамматики и их применение для генерации учебных материалов по фонетике языка. / А. А. Усова, В. В. Сотникова, И. В. Колбасина, Е. Д. Старовойт // Новосибирск: Х Международная научно-практическая конференция: «Научные перспективы XXI века. Достижения и перспективы нового столетия». - 2015. - С. 60-62.
6. Ando, R. K. Multidocument Summarization by Visualizing Topical Content / R. K. Ando // ANLP/NAACL 2000 Workshop on Automatic Summarization, 2000. - P. 79-88.
7. Higashinaka R., Miyazaki N., Nakano M., Aikawa K. Evaluating Discourse Understanding in Spoken Dialogue Systems // ACM Translation on Speech and Language Processing. 2004. Vol. 1. P. 1-20.
8. SeoGenerator [сайт]. - Режим доступа: http://seogenerator.ru/
9. Generating The Web [сайт]. - Режимдоступа: http://www.generating- the-web.com/generating-the-web.shtml.
10. Delirium 1.8 [сайт]. - Режим доступа: http://softsearch.ru/programs/143-408-delirium-download.shtml.
11. Мой SEO Гид [сайт]. - Режим доступа: http://myseogid.ru/tools/196- article-clone-easy.html.
12. TemplateBest [сайт]. - Режим доступа:
http://www.templatebest.ru/prog01.php.
13. SyMonym [сайт]. - Режим доступа: http://www.seosin.ru/page/6/.
14. ProWebber [сайт]. - Режим доступа:
15. Grosz-Ngate, M. Collaborative Design in a Networked Multimedia Environment: Emerging Communication Patterns / M. Grosz-Ngate // Journal of Research on Computing in Education, Vol.26, Iss.3, 1994. - P. 418-419.
16. Hahn, U. Knowledge-Based Text Summarization: Salience and Generalization Operators for Knowledge-Based Abstraction / U. Hahn, U. Reimer //
- USA, Massachussets, Cambridge, MIT Press, 1999. - P. 215-232.
17. Hopfield, J. J. Neural networks and physical systems with emergent collective computational abilities. / J. J. Hopfield // - National Academy Science, 1982. - P. 254-258.
18. DeVito, J. A. The communication handbook: A dictionary / J. A. DeVito // - New York: Harper&Row, 1986. - P. 4-10.
19. Everett, D. R. Computer-Mediated Communication as a Teaching Tool: a Case Study / D. R. Everett, T.C. Ahern // Journal of Research on Computing in Education, Vol.26, Iss.3, 1994. - P. 336-337.
20. Francis, W. N. Manual of Information to accompany A Standard Corpus of Present-Day Edited American English, for use with Digital Computers / W. N. Francis, H. Kucera // - Brown University Providence, Rhode Island Department of Linguistics Brown University, 1979 - Р. 18-21.
21. Goldstein, J. External and Internal Noises [Электронныйресурс] / J. Goldstein // The institute for strategic clarity. - 2007. -Режимдоступа: http://www.instituteforstrategicclarity.org/epnoise.htm.
22. Goodfellow, R. CALL Programs for Vocabulary Instruction / R. Goodfellow // Computer Assisted Language Learning Journal, Vol.8, №2, 1995. - P. 205-226.
23. Graziadei, W. D. Virtual Instructional Classroom Environment in Science (VICES) in Research, Education, Service & Teaching (REST) / W. D. Graziadei // - New York: SUNY Press, 1993. - P. 257- 258.
24. Личаргин, Д. В. Разработка приложения по генерации учебных заданий к тексту на естественном языке на основе порождаемых шаблонов. / А. А. Усова, В. В. Сотникова, С. А. Липман, В. В. Бутовченко. // Современные проблемы науки и образования. - 2015. № 6. - Режим доступа: http://www.science-education.ru/ru/article/view?id=22636.
25. Личаргин, Д. В. К вопросу об упорядочении многоуровневой семантической сети на дереве семантической классификации. / Д. В. Личаргин, К. В. Сафонов, О. И. Егорушкин, Е. П. Бачурина // Вестник СибГАУ. - 2014. №2. С. 44-50.
26. Hutchins, J. Summarization: Some Problems and Methods / J. Hutchins, K. Jones // Informatics: Meaning the Frontier of Informatics. - London, Aslib, 1987.
- P. 151-173.
27. Chomsky, N. Syntatic Structures: Mouton de Gruyter. 2002/ P. 119
28. Comrie, В. Language Universals and linguistic typology / B. Comrie // University Of Chicago Press, 2nd edition, 1989. - P.230-239.
30. Crystal, D., English Language / D. Crystal // Wikipedia. Free Encyclopedia, режимдоступа http://en.wikipedia.org/wiki/English_language.
31. Филатова, Н. Н. Центр «Компьютерные технологии образования» [Текст] / Н. Н. Филатова, О. Л. Ахремчик // EducationalTechnology&Society, №3, 2000, режим доступа: http://ifets.ieee.org/russian/depository/v3_i2/html/5.html.
32. Хомский, Н. Синтаксическиеструтуры. В кн.: Новое в зарубежной лингвистике. Вып. V. Москва, 1962.
33. Беляков, В. М. Разработка функциональной модели автоматизированной обучающей системы по русскому языку как иностранному: автореферат диссертации к.ф.н. / В. М. Беляков // - Москва, 1996. - С. 45-47.
34. Штрик, А. C. CASE: автоматизированное проектирование программного обеспечения [Текст] / А. C. Штрик // Монитор, №4, 1992. - С. 4¬
6.
35. Личаргин, Д. В. Статистические методы анализа естественного языка как способ повышения эффективности его генерации на основе семантических шаблонов / Д. В. Личаргин, А. Ю. Маглинец, М. В. Рыбков, Е. П. Бачурина. // Информатизация образования и науки. -2014. №4(24). - С. 92-103.
36. СТО 4.2-07-2014 Система менеджмента качества. Общие требования к построению, изложению и оформлению документов учебной деятельности. - введ. 09.01.2014. - Красноярск: ИПК СФУ, 2014. - 60 с.
37. Терехина, А. Ю. Анализ данных методами многомерного шкалирования [Текст] / А. Ю. Терехина // - Москва: Наука, 1986. - 168 с.
38. Терехов, С. А. Нейросетевые информационные модели сложных инженерных систем. Нейроинформатика [Текст] / С. А. Терехов // - Новосибирск. Наука. 1998. - С.101-136.
39. All-freeload.net [сайт]. - Режим доступа: http://all-
freeload.net/avtoklikery/1948-automatic-mouse-and-keyboard.
40. Сотникова, В. В. Векторные порождающие грамматики и их применение для генерации учебных материалов по фонетике языка. / В. В. Сотникова, А. А. Усова, Д. В. Личаргин //Красноярск: Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный- 2015», посвященная 70-летию Великой Победы. - 2015. - С. 0-92.
41. Личаргин, Д. В. Разработка веб-приложения по генерации учебных заданий к тексту на естественном языке на основе порождаемых шаблонов. / В. В. Сотникова, А. А. Усова, И. В. Колбасина, Е. Д. Старовойт // Новосибирск: X Международная научно-практическая конференция: «Научные перспективы XXI века. Достижения и перспективы нового столетия». - 2015. - С. 57-60.
42. Домрачев, В. Г. О классификации компьютерных образовательных информационных технологий / В.Г. Домрачев, И.В. Ретинская // Информационные технологии, №2, 1996. - С. 10-14.
43. Moodlearn.ru [сайт]. - Режим доступа:
http://moodlearn.ru/course/view.php?id=18 


Работу высылаем на протяжении 30 минут после оплаты.




©2024 Cервис помощи студентам в выполнении работ