ВВЕДЕНИЕ 4
1 Обзор аналогичных разработок 6
1.1 Сравнение функционала аналогичных разработок 6
1.2 Онлайн программа Textivate 6
1.3 Программа QuickWorksSheets 9
1.3 Программа WorksSheet Generator 12
1.4 Программа LearnClick 16
2 Методы и средства разработки 19
2.1 Порождающая грамматика над многомерными базами данных 19
2.2 OLAP технологии и применение многомерных баз данных при генерации
осмысленной речи 23
2.3 Использование метрики Хэмминга для оценки близости генерируемых
заданий к тексту 25
2.4 Семантический шум 27
2.5 Математическая модель 29
3 Описание используемых программ в среде mouse auto clicker 3 3
3.1 Описание программы «Electronic Dictionary» 33
3.2 Описание программы «Асареіа» 38
3.3 О системе электронного обучения Сибирского федерального
университета 40
3.4 Описание работы программы «Mouse auto clicker» 43
4 Программное обеспечение естественно-языковых интерфейсов 46
4.1 Разработка системы «Генератор учебных заданий» и «Генератор
порождаемых шаблонов» 46
4.2 Назначение системы «Генератор учебных заданий» 47
4.3 Функции системы «Генератор учебных заданий» 48
4.4 Состав и структура системы «Генератор учебных заданий» 49
4.5 Входные и выходные данные 5 1
4.6 Функционирование системы «Генератор учебных заданий» 52
4.7 Программная система «Генератор порождаемых шаблонов» 53
4.7.1 Назначение программы «Генератор порождаемых шаблонов» 54
4.7.2 Функции программы «Генератор порождаемых шаблонов» 54
4.7.3 Структура программы «Генератор порождаемых шаблонов» 55
4.7.4 Входные и выходные данные программы «Генератор порождаемых шаблонов» 56
4.7.5 Описание работы программы «Генератор порождаемых шаблонов» 56
5 Описание разработанных программ 58
5.1 Визуальное отображение программы «Генератор порождаемых шаблонов» 58
5.2 Визуальное отображение программы «Генератор учебных заданий». 59
ЗАКЛЮЧЕНИЕ 64
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 65
ПРИЛОЖЕНИЕ
Задачей данного проекта является решение проблемы повышения эффективности языковой подготовки в техническом вузе, разработка средств генерации большего по мощности и более осмысленного множества учебных материалов в целях индивидуализации траекторий обучения.
Актуальность работы состоит в повышении эффективности работы преподавателей, снижении временных затрат, увеличении объемов генерируемых материалов, что обеспечит возможность построения множества индивидуальных траекторий обучения с целью повышения качества обучения. Разработка электронных обучающих ресурсов требует от преподавателя увеличения затрат временных ресурсов на создание учебного материала, что затрудняет реализацию индивидуальной траектории обучения студентов. В процессе создания современных систем электронного обучения требуется интеграция знаний из разнородных источников и решение задач тиражирования знаний.
Поэтому актуальна задача разработки ресурса, который может помочь преподавателям иностранного языка, генерировать тестовые материалы, для проверки знаний в целях повышения эффективности процесса составления учебных материалов.
Цель работы: Разработка программы повышения вариативности генерируемых фраз естественного языка, на основе гибридизации порождающих грамматик и многомерных баз данных. Обеспечение интеграции этой программы с сопутствующим комплексом программных продуктов на основе сценариев автоматической работы управляющих агентов.
Научная новизна: достижение определенного высокого уровня на основе использования модели гибридизации многомерных баз данных и порождающих грамматик.
Задачи диссертационной работы состоят в:
• разработке правил порождающей грамматики;
• разработке многомерных баз данных на основе бесплатного программного обеспечения;
• разработке модулей, позволяющих осуществить гибридизацию многомерных баз данных и порождающих грамматик;
• создании программного продукта позволяющего вариативно
использовать данный унифицированный алгоритм;
• апробации данного программного продукта для разработки электронного курса «английский язык для академических целей» курса магистратуры.
Назначение программы - помочь преподавателям автоматизировать работу по разработке электронных образовательных курсов, а так же ускорить процесс разработки тестов на основе печатных материалов.
Объектом исследования являются автоматизированные обучающие системы иностранным языкам (на примере английского языка).
Предмет исследований - виды и методы автоматического анализа и автоматической компрессии текстов.
Значение для теории. Разработаны алгоритмы гибридизации порождающих грамматик и многомерных баз данных, применительно к генерации естественного языка и модели многомерного лексико-грамматического пространства.
Практическая ценность. Разработанная в диссертации программа генерации учебных заданий позволяет экономить временные и человеческие ресурсы при разработке учебных тестов.
Область потенциального применения. Разработанная программа может быть использована в Сибирском федеральном университете на кафедре «Разговорного иностранного языка» и в Сибирском государственном аэрокосмическом университете на кафедре «Прикладной математики» для автоматизации работы преподавателей при составлении учебных заданий к тексту.
Была разработана программа «Генератор учебных заданий», а так же модуль, который позволяет осуществить гибридизацию многомерных баз данных и порождающих грамматик. «Генератор учебных заданий», позволит автоматизировать работу преподавателей, а так же ускорить процесс разработки тестов.
Так же была разработана программа «Генератор порождаемых шаблонов», которая позволяет создавать различные шаблоны для генерации заданий.
Получены следующие результаты: были разработаны правила порождающей грамматики, многомерные базы данных на основе бесплатных источников, разработаны модули, которые позволяют осуществить гибридизацию многомерных баз данных и порождающих грамматик, а так же программа генерации шаблонов, позволяющая порождать учебные задания по английскому языку на основе входного текста.
Была предложена модель гибридизации многомерных баз данных и порождаемых шаблонов. Данная модель помогает сделать задания уникальными, а так же разнообразить их содержание.
На основе предложенной модели был разработан генератор заданий, который позволяет автоматически генерировать учебные материалы, при этом данная программа помогает экономить время преподавателя, а благодаря множеству различных вариантов заданий, предотвратить списывание и повысить качество обучения.
Данные продукты могут быть внедрены в будущем в высших учебных заведениях, школах и других организациях.
1. Borko, Н. Abstracting Concepts and Methods / H. Borko, C.L. Bernier // - New York: Academic Press, 1975. - P. 140.
2. Comrie, В. Language Universals and linguistic typology / B. Comrie // University Of Chicago Press, 2nd edition, 1989. - P.230-239.
3. Cornelius, T. Leondes Intelligent systems: technology and applications. / T. Cornelius // - CRC Press, 2002. - P. 127-128.
4. Everett, D. R. Computer-Mediated Communication as a Teaching Tool: a Case Study / D. R. Everett, T.C. Ahern // Journal of Research on Computing in Education, Vol.26, Iss.3, 1994. - P. 336-337.
5. Francis, W. N. Manual of Information to accompany A Standard Corpus of Present-Day Edited American English, for use with Digital Computers / W. N. Francis, H. Kucera // - Brown University Providence, Rhode Island Department of Linguistics Brown University, 1979 - Р. 18-21.
6. Hahn, U. Knowledge-Based Text Summarization: Salience and Generalization Operators for Knowledge-Based Abstraction / U. Hahn, U. Reimer // - USA, Massachussets, Cambridge, MIT Press, 1999. - P. 215-232.
7. Hopfield, J.J. Neural networks and physical systems with emergent collective computational abilities. / J.J. Hopfield // - National Academy Science, 1982. - P. 254-258.
8. Hutchins, J. Summarization: Some Problems and Methods / J. Hutchins, K. Jones // Informatics: Meaning the Frontier of Informatics. - London, Aslib, 1987. - P. 151-173.
9. Ingraham, B. Language Training for Various Purposes in Several Languages on a Common Hypermedia Framework / B. Ingraham, T. Chanier, C. Emery // Computer & Education, Vol.23, Iss. 1,2, 1994. - Р. 107-115.
10. Jones, G. Computer Simulations in Language Teaching - the Kingdom Experiment / G. Jones // System, Iss.17, 1986. - P. 35-47.
11. Kupiec, J. A Trainable Document Summarizer / J. Kupiec, J. Pedersen, F. Chen // 18th International ACM SIGIR Conference: Research and Development in Information Retrieval. - New York, ACM Press, 1995. - P. 68-73.
12. Levy, M. Computer Assisted Language Learning: Context and Conceptualization / M. Levi // - Oxford: Clarendon Press, 1997. - P. 130-133.
13. Mani, I. Text Summarization Evaluation / I. Mani // 9th European Conference, 2000. - P. 101-107.
14. McQuail, D. Models of communication / D. McQuail, S. Windahl // - New York: Oxford University Press, vol. 3, pp. 36-44, 1989.
15. Nagata, N. Computer vs. Wordbook Instruction in Second Language Acquisition / N. Nagata // CALICO Journal, Vol.14, №1, 1996. - P. 53-76.
16. Radev, D.R. Generating Natural Language Summaries from Multiple Online Sources / D.R. Radev, K.R. McKeown, // Computational Linguistics, Vol. 24, No. 3, 1998. - P. 469-500.
17. Salton, G. Automatic Text Structuring and Summarization / G. Salton // Information Processing & Management, Vol. 33, No. 2, 1997. - P. 193-207.
18. Shannon, C.E. A Mathematical Theory of Communication / C. E. Shannon // The Bell System Technical Journal, №27, 1948. - Р. 379-423, 623-656.
19. Smith, S. Educational Uses of the PLATO Computer System / S. Smith,
B. Sherwood // - Science, 1976. - P. 82-83.
20. Weaver, W. The mathematics of communication / W. Weaver // Scientific American, Vol.181, Iss.11-15, 1949. - P. 30-40.
21. Wyllys, R.E. Extracting and Abstracting by Computer Automated Language Processing / R.E. Wyllys, H. Borko, John Wiley // - New York, 1967. - P. 127-179.
22. Агапова, О.И. О трех поколениях компьютерных технологий обучения / О.И. Агапова, А.О. Кривошеев, А.С. Ушаков // Информатика и образование, №2, 1994. - С. 34-40.
23. Азимов, Э.Г. К типологии обучающих компьютерных программ по русскому языку как иностранному. Современные технические средства в
24. Айвазян С.А. Прикладная статистика. Статистическое оценивание зависимостей / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин // 2-е изд. - Москва: Финансы и статистика, 1991.- 512 с.
25. Айвазян, С.А. Прикладная статистика. Статистическое оценивание зависимостей / С.А. Айвазян, И.С. Енюков, Л.Д. Мешалкин // - Москва: Финансы и статистика, 1-е изд-е, 1985. - 484 с.
26. Александров, Г.Н. Программированное обучение и новые информационные технологии обучения / Г.Н. Александров // Информатика и образование, №5, 1993. - C.7 -19.
27. Атанов, Г.А. Структурирование понятий предметной области с помощью методов представления знаний. / Г.А. Атанов, И.Н. Пустынникова // Искусственный интеллект, №2, 1997. - С. 29-40.
28. Башмаков, А.И. Технология и инструментальные средства проектирования тренажерно-обучающих комплексов для профессиональной подготовки и повышения квалификации. Часть 1. / А.И. Башмаков // Информационные технологии, №6, 1999. - С. 40-45.
29. Башмаков, А.И. Технология и инструментальные средства проектирования тренажерно-обучающих комплексов для профессиональной подготовки и повышения квалификации. Часть 2. / А.И. Башмаков // Информационные технологии, №7, 1999. - С. 39-45.
30. Бирюков, Р.А. Некоторое методы автоматического реферирования / Р.А. Бирюков // Открытые Системы, № 12, 2000. - С. 30-35.
31. Бовтенко, М.А. Компьютерная лингводидактика: учеб.пособие / М.А. Бовтенко // - Новосибирск: Изд-во НГТУ, 2000. - C. 45-47.
32. Брусиловский, П.Л. Интеллектуальные обучающие системы / П.Л. Брусиловский // Информатика. Информационные технологии. Средства и системы, №2, 1990. - С. 3-22.
33. Власов, Е.А. Компьютеры в обучении языку: проблемы и решения / Е.А. Власов, Т.Ф. Юдина // - Москва, 1990. - 112 c.
34. Дейвисон, М. Многомерное шкалирование: методы наглядного представления данных / М. Дэйвисон // - Москва: Финансы и статистика, 1988. - 154 с.
35. Довгялло, А.М. Обучающие системы нового поколения / А.М. Довгялло, Е.Л. Ющенко // УсиМ, №1, 1988. - С. 83-86.
36. Домрачев, В.Г. О классификации компьютерных образовательных информационных технологий / В.Г. Домрачев, И.В. Ретинская // Информационные технологии, №2, 1996. - С. 10-14.
37. Жарков, И.В. Автоматизированные обучающие системы / И.В. Жарков, под ред. Гердт А.С. // - СПб., 1996. - C. 59-68.
38. Зиновьев, А.Ю. Визуализация многомерных данных: монография /
А.Ю. Зиновьев // Красноярск: Изд-во КГТУ, 2000. - 168 с.
39. Кларлащук, В.И. Обучающие программы / В.И. Кларлащук // - Москва: Солон-Р, 2001. - 94 с.
40. Кручинин, В.В. Разработка компьютерных учебных программ / В.В. Кручинин // - Томск, 1998. - 120 с.
41. Лаутербах, Р.Н. Программное обеспечение процесс обучения. Перспективы / Р.Н. Лаутербах, К.К. Фрей // Вопросы образования, 1988, №3. -
С. 70-79.
42. Лбов, Г.С. Методы обработки разнотипных экспериментальных данных / Г.С. Лбов // - Новосибирск: Наука, 1981. - 157 с.
43. Личаргин, Д. В. К проблеме генерации расширенной фонетической транскрипции на основе векторных порождающих грамматик. [Электронный ресурс] / Д. В Личаргин, В. В. Сотникова, А. А. Усова, В. В. Бутовченко // Современные проблемы науки и образования. - 2015. № 2. . - Режим доступа: http://www.science-education.ru/ru/article/view?id=20933.
44. Личаргин Д. В. Разработка веб-приложения по генерации учебных заданий к тексту на естественном языке на основе порождаемых шаблонов. / В.
В. Сотникова, А. А. Усова, И. В. Колбасина, Е. Д. Старовойт // Новосибирск: Х Международная научно-практическая конференция: «Научные перспективы ХХІ века. Достижения и перспективы нового столетия». - 2015. - С. 57-60.
45. Личаргин Д.В. Разработка приложения по генерации учебных
заданий к тексту на естественном языке на основе порождаемых шаблонов. / А.
А. Усова, В. В. Сотникова, С. А. Липман, В. В. Бутовченко. // Современные проблемы науки и образования. - 2015. № 6. - Режим доступа:
http://www.science-education.ru/ru/article/view?id=22636.
46. Маклюэн, М. Понимание медиа: внешние расширения человека / М. Маклюэн // - Москва, 2003. - С.24-29.
47. Машбиц, Е.И. Диалог в обучающей системе / Е.И. Машбиц // - Киев, 1989. - 88 с.
48. Назаров, М.М. Массовая коммуникация и общество. Введение в теорию и исследования / М.М. Назаров // - Москва, 2004. - 235 с.
49. Науменко, Т.В. Социология массовой коммуникации / Т.В. Науменко // - Москва, 2005. - 167 с.
50. Ножов, И.М. Синтаксический анализ / И.М. Ножов // Компьютерра, № 21 (446), 2002 - С.42-49.
51. Ножов, И.М. Морфологическая и синтаксическая обработка текста (модели и программы): интернет публикация / И.М. Ножов // - Москва, 2003. - 22 с.
52. Околелов, Г.Н. Программированное обучение и новые информационные технологии обучения / Г.Н. Околелов // Информатика и образование, №5, 1993. - С. 7-19.
53. Полиниченко, Д.Ю. Естественный язык как лингвокультурный семиотический концепт: автореф. дис... канд. филол. наук / Д.Ю. Полиниченко // - Волгоград, 2004. - 22 с.
54. Растригин, Л.А. Адаптация сложных систем. Методы и приложения / Л.А. Растригин // - Рига: Зинатне, 1981, - 124 с.
55. Савельев, А.Я. Подготовка информации для автоматизированных обучающих систем / А.Я. Савельев, В.А. Новиков, Ю.И. Лобанов // - Москва: Высшая школа, 1986. - 243 с.
56. Соловов, А.В. Проектирование компьютерных систем учебного назначения: учебное пособие / А.В. Соловов // - Самара: СГАУ, 1995.
57. Сотникова В. В. Векторные порождающие грамматики и их применение для генерации учебных материалов по фонетике языка. / В. В. Сотникова, А. А. Усова, Д. В. Личаргин //Красноярск: Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный- 2015», посвященная 70-летию Великой Победы. - 2015. - С. 0-92.
58. Терехина, А.Ю. Анализ данных методами многомерного шкалирования / А.Ю. Терехина // - Москва: Наука, 1986. - 168 с.
59. Терехов, С.А. Нейросетевые информационные модели сложных инженерных систем. Нейроинформатика / С.А. Терехов // - Новосибирск. Наука. 1998. - С.101-136.
60. Усова А. А. Разработка веб-приложения по генерации учебных заданий к тексту на естественном языке на основе порождаемых шаблонов. / А.
А. Усова, В. В. Сотникова, Д. В. Личаргин // Красноярск: Международная конференция студентов, аспирантов и молодых ученых «Проспект Свободный- 2015», посвященная 70-летию Великой Победы. - 2015. - С. 7-10.