ГЕНЕРАЦИЯ УЧЕБНЫХ МАТЕРИАЛОВ ПО МЕТОДУ ПАЛМЕРА С РАСПОЗНАВАНИЕМ ОМОНИМОВ МЕТОДОМ КОМПОНЕНТНОГО АНАЛИЗА
|
ВВЕДЕНИЕ 4
1 Анализ и сравнение разработок в области автоматической генерации осмысленного текста 7
1.1 Обзор предметной области 7
1.2 Основные определения 8
1.3 Сравнение функционала аналогичных разработок 9
1.3.1 Программа SeoGenerator 9
1.3.2 Программа GeneratingtheWeb 11
1.3.3 Программа Delirium 1.8 13
1.3.4 Программа ArticleCloneEasy 13
1.3.5 Программа СинонимайзерM1pluss 14
1.3.6 Программа SyMonym 16
1.3.7 Программа MonkeyWrite 17
1.3.8 Вывод по рассмотренным аналогам 18
2 Разработка программы генерации учебных материалов 20
2.1 Методы и средства разработки программы автоматической генерации
осмысленного текста для учебных материалов 20
2.1.1 Метод Палмера и необходимость генерации учебных заданий по этому
методу 21
2.1.2 Метод компонентного анализа и его применение для распознавания
омонимических групп 23
2.1.3 Генерация подстановочных таблиц с фонетическими пояснениями ... 25
2.1.4 Принцип использования реляционных баз данных в работе алгоритма
генерации подстановочных таблиц 30
2.1.5 Частотный и грамматический анализ как этапы работы алгоритма
генерации подстановочных таблиц 30
2.1.6 Семантический анализ как этап работы алгоритма генерации
подстановочных таблиц 32
2.1.7 Общая схема разрабатываемой программы «Генератор
подстановочных таблиц» 33
2.2 Интерфейс программы«Генератор подстановочных таблиц» 34
3 Интеграция программы «Генератор подстановочных таблиц» в ряд
программных продуктов 40
3.1 Описание программы Automatic Mouse and Keyboard 40
3.2 Генерация учебных материалов 41
3.3 Описание основных используемых программ 43
3.4 О системе электронного обучения Сибирского федерального университета 52
3.5 Наполнение электронного курса заданиями на основе сгенерированных
материалов для системы дистанционного обучения СФУ 55
ЗАКЛЮЧЕНИЕ 57
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
ПРИЛОЖЕНИЕ
1 Анализ и сравнение разработок в области автоматической генерации осмысленного текста 7
1.1 Обзор предметной области 7
1.2 Основные определения 8
1.3 Сравнение функционала аналогичных разработок 9
1.3.1 Программа SeoGenerator 9
1.3.2 Программа GeneratingtheWeb 11
1.3.3 Программа Delirium 1.8 13
1.3.4 Программа ArticleCloneEasy 13
1.3.5 Программа СинонимайзерM1pluss 14
1.3.6 Программа SyMonym 16
1.3.7 Программа MonkeyWrite 17
1.3.8 Вывод по рассмотренным аналогам 18
2 Разработка программы генерации учебных материалов 20
2.1 Методы и средства разработки программы автоматической генерации
осмысленного текста для учебных материалов 20
2.1.1 Метод Палмера и необходимость генерации учебных заданий по этому
методу 21
2.1.2 Метод компонентного анализа и его применение для распознавания
омонимических групп 23
2.1.3 Генерация подстановочных таблиц с фонетическими пояснениями ... 25
2.1.4 Принцип использования реляционных баз данных в работе алгоритма
генерации подстановочных таблиц 30
2.1.5 Частотный и грамматический анализ как этапы работы алгоритма
генерации подстановочных таблиц 30
2.1.6 Семантический анализ как этап работы алгоритма генерации
подстановочных таблиц 32
2.1.7 Общая схема разрабатываемой программы «Генератор
подстановочных таблиц» 33
2.2 Интерфейс программы«Генератор подстановочных таблиц» 34
3 Интеграция программы «Генератор подстановочных таблиц» в ряд
программных продуктов 40
3.1 Описание программы Automatic Mouse and Keyboard 40
3.2 Генерация учебных материалов 41
3.3 Описание основных используемых программ 43
3.4 О системе электронного обучения Сибирского федерального университета 52
3.5 Наполнение электронного курса заданиями на основе сгенерированных
материалов для системы дистанционного обучения СФУ 55
ЗАКЛЮЧЕНИЕ 57
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 58
ПРИЛОЖЕНИЕ
Проблемной областью является разработка системы автоматической генерации учебных материалов, обеспечения образовательного процесса учебными материалами, а так же повышения эффективности языковой подготовки в техническом вузе в целях индивидуализации траекторий обучения.
Актуальность работы. С развитием вычислительных технологий стали актуальны такие проблемы как построение экспертных систем, синтез и генерация осмысленной речи компьютером на различных языках. Для решения выше представленных проблем применяются различные средства и методы: реляционные таблицы, графы, декларативное программирование, порождающие грамматики и многие другие. По этим методам семантику можно раскладывать, решать конкретную задачу или делать конкретный программный продукт. Например: синонимизатор, «технический справочник», системы диалога с пользователем, экспертные системы, программы электронного перевода.
Также информационные технологии широко используются в сфере образования. Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Электронные образовательные ресурсы - важные компоненты, образующие информационно¬образовательную среду. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса [1].
В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы или издания. В традиционном учебном процессе активно используется интеграция электронных образовательных ресурсов на базе сетевых технологий.
В данной работе рассматривается использование генератора подстановочных таблиц, для обучения студентов по дисциплине английский язык, с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков.
Компьютерная лингвистика, информатика, математика и математическая логика - такие аспекты предметных областей затрагивают данное исследование.
Поэтому актуальна задача разработки системы генерации учебных материалов по методу Палмера с распознаванием омонимов методом компонентного анализа. Она поможет решить такие проблемы как:
1) Снижение количества рутиной работы преподавателей за счет ее автоматизации, генерация учебных материалов;
2) Снижение не продуктивных затрат на монотонные действия пользователя при создании электронных ресурсов;
3) Решение проблемы разработки электронных курсов в кратчайшие сроки с учетом регулярного обновления ФОС;
4) Улучшение усвоения материала учащимися.
Новизна работы заключается в алгоритмизации методов компонентного анализа, при выборе омонимических групп слов, для генерации подстановочных таблиц на основе текста на естественном языке.
Цель диссертации: разработать алгоритмическую реализацию системы построения учебных подстановочных таблиц на основе произвольных предложений естественного языка на входе системы.
Задачи диссертации состоят в:
1) распознавании омонимов;
2) разработке алгоритмов построения подстановочных таблиц;
3) разработке алгоритмов оценки предпочтения омонимических групп;
4) разработка программной реализации построения учебных подстановочных таблиц на выходе, на основе произвольных предложений естественного языка на входе системы;
5) разработка программной системы «Генератор подстановочных таблиц»;
6) пополнение базы данных дефинонимов английского языка;
7) переводе данных программ в единую систему с использованием общего формата данных с программами по компьютерной лингвистике магистратуры ИКИТ СФУ.
Необходимо описать метод компонентного анализа, который может быть использован для выявления соответствий смысловых признаков в омонимических группах, позволяющий ранжировать слова в порядке большего совпадения в каждом столбце для всех вариантов в омонимических группах генерируемой таблицы по методу Палмера.
Основная идея работы состоит в создании генератора подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков, также именуемый как «Генератор подстановочных таблиц» и в использовании полученных подстановочных таблиц для системы сопутствующих программных продуктов, учитывая их совместимость. Например, при использовании материалов полученных из программы «Генератор большого объема текстов по стандартным шаблонам» программный продукт «Text-BasedTaskGenerator» составит разнообразные варианты текстовых заданий на основе входного текста.
Назначение программы - необходимость преодоления недостаточно высокого уровня навыков аудирования у студентов высших учебных заведений, что не дает возможность осуществления беглой коммуникации в англоязычной среде с минимальным количеством фонетических ошибок.
Разработанная программа генератор подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков поможет лицам изучающим английский язык быстрое усваивать материал. Решит проблему затруднения изучения, понимания языка и преодоление трудности перевода. По ним учащийся может составить свое первое предложение с возможными ошибками, выбирая из каждой колонки предложенные варианты. Также пополнить свой словарный запас и изучить различные взаимозаменяемые слова в конкретном контексте.
Данные факторы обеспечивают возможность выбора учащимся индивидуальной траектории обучения в зависимости от поставленных задач, что дает возможность достижения более качественного восприятия материала учащимися.
Подстановочные таблицы можно сохранить в текстовом документе и использовать при необходимости для повторения и закрепления пройденного материала.
Объектом исследования является системы генерации учебных материалов для обучения иностранным языкам.
Предметом исследования является средства генерации подстановочных таблиц с учетом преодоления сопутствующий проблем компьютерной лингвистике.
Актуальность работы. С развитием вычислительных технологий стали актуальны такие проблемы как построение экспертных систем, синтез и генерация осмысленной речи компьютером на различных языках. Для решения выше представленных проблем применяются различные средства и методы: реляционные таблицы, графы, декларативное программирование, порождающие грамматики и многие другие. По этим методам семантику можно раскладывать, решать конкретную задачу или делать конкретный программный продукт. Например: синонимизатор, «технический справочник», системы диалога с пользователем, экспертные системы, программы электронного перевода.
Также информационные технологии широко используются в сфере образования. Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Электронные образовательные ресурсы - важные компоненты, образующие информационно¬образовательную среду. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса [1].
В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы или издания. В традиционном учебном процессе активно используется интеграция электронных образовательных ресурсов на базе сетевых технологий.
В данной работе рассматривается использование генератора подстановочных таблиц, для обучения студентов по дисциплине английский язык, с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков.
Компьютерная лингвистика, информатика, математика и математическая логика - такие аспекты предметных областей затрагивают данное исследование.
Поэтому актуальна задача разработки системы генерации учебных материалов по методу Палмера с распознаванием омонимов методом компонентного анализа. Она поможет решить такие проблемы как:
1) Снижение количества рутиной работы преподавателей за счет ее автоматизации, генерация учебных материалов;
2) Снижение не продуктивных затрат на монотонные действия пользователя при создании электронных ресурсов;
3) Решение проблемы разработки электронных курсов в кратчайшие сроки с учетом регулярного обновления ФОС;
4) Улучшение усвоения материала учащимися.
Новизна работы заключается в алгоритмизации методов компонентного анализа, при выборе омонимических групп слов, для генерации подстановочных таблиц на основе текста на естественном языке.
Цель диссертации: разработать алгоритмическую реализацию системы построения учебных подстановочных таблиц на основе произвольных предложений естественного языка на входе системы.
Задачи диссертации состоят в:
1) распознавании омонимов;
2) разработке алгоритмов построения подстановочных таблиц;
3) разработке алгоритмов оценки предпочтения омонимических групп;
4) разработка программной реализации построения учебных подстановочных таблиц на выходе, на основе произвольных предложений естественного языка на входе системы;
5) разработка программной системы «Генератор подстановочных таблиц»;
6) пополнение базы данных дефинонимов английского языка;
7) переводе данных программ в единую систему с использованием общего формата данных с программами по компьютерной лингвистике магистратуры ИКИТ СФУ.
Необходимо описать метод компонентного анализа, который может быть использован для выявления соответствий смысловых признаков в омонимических группах, позволяющий ранжировать слова в порядке большего совпадения в каждом столбце для всех вариантов в омонимических группах генерируемой таблицы по методу Палмера.
Основная идея работы состоит в создании генератора подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков, также именуемый как «Генератор подстановочных таблиц» и в использовании полученных подстановочных таблиц для системы сопутствующих программных продуктов, учитывая их совместимость. Например, при использовании материалов полученных из программы «Генератор большого объема текстов по стандартным шаблонам» программный продукт «Text-BasedTaskGenerator» составит разнообразные варианты текстовых заданий на основе входного текста.
Назначение программы - необходимость преодоления недостаточно высокого уровня навыков аудирования у студентов высших учебных заведений, что не дает возможность осуществления беглой коммуникации в англоязычной среде с минимальным количеством фонетических ошибок.
Разработанная программа генератор подстановочных таблиц с функцией выбора омонимов и лексико-семантических вариантов на основе вектора смысловых признаков поможет лицам изучающим английский язык быстрое усваивать материал. Решит проблему затруднения изучения, понимания языка и преодоление трудности перевода. По ним учащийся может составить свое первое предложение с возможными ошибками, выбирая из каждой колонки предложенные варианты. Также пополнить свой словарный запас и изучить различные взаимозаменяемые слова в конкретном контексте.
Данные факторы обеспечивают возможность выбора учащимся индивидуальной траектории обучения в зависимости от поставленных задач, что дает возможность достижения более качественного восприятия материала учащимися.
Подстановочные таблицы можно сохранить в текстовом документе и использовать при необходимости для повторения и закрепления пройденного материала.
Объектом исследования является системы генерации учебных материалов для обучения иностранным языкам.
Предметом исследования является средства генерации подстановочных таблиц с учетом преодоления сопутствующий проблем компьютерной лингвистике.
Была разработана программа «Генератор подстановочных таблиц», а так же алгоритм системы построения учебных подстановочных таблиц на основе произвольных предложений естественного языка на входе системы.
Для улучшения качества обработки строк используется частотный, семантический, грамматический анализы. Их применение и описание изложено во второй главе.
Был описан метод компонентного анализа, который используется для выявления соответствий смысловых признаков в омонимических подгруппах генерируемых таблиц по методу Палмера, используемый для распознавания омонимов и оценки их предпочтения.
Разработан алгоритм построения подстановочных таблиц и расширена база комбинонимов и дефинонимов английского языка. Разработана база семантического анализа слов.
Также в работе рассматривается принцип реляционных баз данных, лежащие в основе генерации подстановочных таблиц, на основе произвольных входных предложений.
Для разработки программы «Генератор подстановочных таблиц» было выбрано решение объединения всех методов и разработана формула, описывающая данное решение.
Реализован перевод выходных данных программ в единую систему с использованием общего формата, с программами по компьютерной лингвистике магистратуры ИКИТ СФУ по средствам использования агентов.
В результате получен качественный программный продукт, отвечающий поставленным целям и задачам.
Для улучшения качества обработки строк используется частотный, семантический, грамматический анализы. Их применение и описание изложено во второй главе.
Был описан метод компонентного анализа, который используется для выявления соответствий смысловых признаков в омонимических подгруппах генерируемых таблиц по методу Палмера, используемый для распознавания омонимов и оценки их предпочтения.
Разработан алгоритм построения подстановочных таблиц и расширена база комбинонимов и дефинонимов английского языка. Разработана база семантического анализа слов.
Также в работе рассматривается принцип реляционных баз данных, лежащие в основе генерации подстановочных таблиц, на основе произвольных входных предложений.
Для разработки программы «Генератор подстановочных таблиц» было выбрано решение объединения всех методов и разработана формула, описывающая данное решение.
Реализован перевод выходных данных программ в единую систему с использованием общего формата, с программами по компьютерной лингвистике магистратуры ИКИТ СФУ по средствам использования агентов.
В результате получен качественный программный продукт, отвечающий поставленным целям и задачам.



