АВТОМАТИЧЕСКИЙ ПАРСИНГ УЧЕБНЫХ МАТЕРИАЛОВ НА ОСНОВЕ ПРИНЦИПОВ МАШИНЫ КИРДИНА ДЛЯ ПОВЫШЕНИЯ ИХ ВАРИАТИВНОСТИ
|
ВВЕДЕНИЕ 3
1 Парсинг строк 8
1.1 Обзор аналогов 9
1.2 Алгоритмы парсинга аналогов 10
1.3 Модель учебного процесса на основе деревьев 14
1.4 Многомерная база данных учебных материалов 17
2 Парсинг текста на основе машины Кирдина 28
2.1 Кинетическая машина Кирдина 29
2.2.1 Последовательная модель 35
2.2.2 Последовательно-параллельная модель 36
2.2.3 Максимальная параллельно-последовательная модель 36
2.2.4 Критерий финитности распада 37
2.2.5 Описание программы Automatic Mouse and Keyboard 38
3 Программа автоматического парсинга на основе машины Кирдина 42
3.1 Математическая модель 42
3.2 Алгоритмическая модель 43
3.3 Основные особенности программы 45
3.4 Структура программы 46
4 Применение результатов 49
4.1 Программное обеспечение обучения, принципы и требования 50
4.2 Обучение иностранному языку с использованием генерируемых
учебных материалов 51
4.3 Совместимость с другими программами 51
ЗАКЛЮЧЕНИЕ 52
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 53
ПРИЛОЖЕНИЕ А 56
ПРИЛОЖЕНИЕ Б
1 Парсинг строк 8
1.1 Обзор аналогов 9
1.2 Алгоритмы парсинга аналогов 10
1.3 Модель учебного процесса на основе деревьев 14
1.4 Многомерная база данных учебных материалов 17
2 Парсинг текста на основе машины Кирдина 28
2.1 Кинетическая машина Кирдина 29
2.2.1 Последовательная модель 35
2.2.2 Последовательно-параллельная модель 36
2.2.3 Максимальная параллельно-последовательная модель 36
2.2.4 Критерий финитности распада 37
2.2.5 Описание программы Automatic Mouse and Keyboard 38
3 Программа автоматического парсинга на основе машины Кирдина 42
3.1 Математическая модель 42
3.2 Алгоритмическая модель 43
3.3 Основные особенности программы 45
3.4 Структура программы 46
4 Применение результатов 49
4.1 Программное обеспечение обучения, принципы и требования 50
4.2 Обучение иностранному языку с использованием генерируемых
учебных материалов 51
4.3 Совместимость с другими программами 51
ЗАКЛЮЧЕНИЕ 52
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ 53
ПРИЛОЖЕНИЕ А 56
ПРИЛОЖЕНИЕ Б
Лингвистическая, или языковая, компетенция предполагает владение системой сведений об изучаемом языке на разных уровнях - фонетическом, лексическом, уровне состава слова и словообразования, морфологическом, уровне синтаксиса простого и сложного предложения, стилистическом. Учащийся обладает лингвистической компетенцией, если он имеет представление о системе изучаемого языка и может пользоваться этой системой на практике.
Предметное содержание обучения профессиональному иностранному языку является важным в обучении, решения для более эффективного обучения невозможно без активного участия профильных кафедр. Кафедры иностранных языков технических вузов ищут пути максимально эффективного преподавания иностранного языка и профессионального иностранного языка при минимальном количестве выделенных на данную дисциплину часов и низком уровне владения языком.
И здесь для вуза, для профильных кафедр и кафедр иностранных языков есть широкое поле деятельности в сфере налаживания международных образовательных и исследовательских контактов, совместных международных проектов, академических обменов и пр.
Важную роль в освоении изучаемого языка играет самостоятельная работа студентов. Поэтому большой объем учебного материала по иностранному языку выносится на самостоятельную работу студента. Для этого разработаны интернет-версии лабораторных работ различных уровней, как для студентов младших курсов, так и для студентов, изучающих профессиональный иностранный язык. В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы. Поэтому ежегодно происходят нововведения в процессе обучения, интегрируются более современные и продуктивные системы. Повсеместное использование информационных технологий в сфере образования обуславливается необходимостью поддержания современного высокого уровня подготовки специалистов, как результат совершенствования методики обучения.
Актуальность работы.
Повсеместное использование информационных технологий в сфере образования обуславливается необходимостью поддержания современного высокого уровня подготовки специалистов, как результат совершенствования методики обучения.
Актуальность данной работы состоит в разработке алгоритмического и математического аппарата для парсинга строк, что позволит решить проблему порождения разностных документов схожего содержания. С учетом привлечения иерархии учебного курса.
Необходимость использования индивидуальной адаптивной траектории обучения для учащихся вузов по дисциплине «Иностранный язык», в необходимости генерации больших объемов учебных материалов с учетом ограничений на временные и человеческие ресурсы, частая сменяемость платформ электронного обучения, и невозможность привлечения материалов из конкурирующих платформ.
Использование информационных технологий в образовании определяется следующими причинами:
- широкими возможностями информационных технологий по индивидуализации образования;
- повышением мотивации обучающихся при использовании информационных технологий и усилением эмоционального фона образования;
- предоставлением широкого поля для активной самостоятельной деятельности обучающихся;
- высокой наглядностью представления учебного материала, особенно при моделировании явлений в динамике;
- все возрастающими интерактивными возможностями информационных технологий;
- доступностью информационных технологий в любое удобное обучающемуся время.
Новизна данной работы состоит в разработке алгоритмического и математического аппарата для парсинга строк, что позволит решить проблему порождения разностных документов схожего содержания. С учетом привлечения иерархии учебного курса.
Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Одним из которых являются электронные образовательные ресурсы. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса.
Цель диссертации:
Разработка модели и программы автоматического парсинга учебных материалов на основе принципов машины Кирдина для их вариативности, трансляции различных типов электронных курсов на основе универсальной модели дерева парсинга, системы генерации дерева учебного курса с возможностью его конвертирования в различные виды учебных пособий - Generation Office Converter. Подготовка новых учебных материалов, для электронного курса, используя более совершенные методы генерации учебных заданий, что должно повысить качество обучения. Встроить данную программу в систему программных продуктов Generation Office с учетом их совместимости, для автоматической генерации учебных заданий, с интеграцией всех программ на основе единого формата файлов, которая объединит в себе такие ранее созданные программы как:
1. Open - and - Read Generator предназначен для генерации учебных материалов по методу Ильи Франка;
2. Text-Based Task Generator - составление большого объема вариантов текстовых заданий на основе входного текста;
3. Semantic Electronic Dictionary - Обеспечивает возможность выбора материалов из семантической классификации: в форме списков слов, подстановочных таблиц, с транскрипцией, без транскрипции, в алфавитном, в семантическом порядке и другими заданными параметрами;
4. Patterns Maker - программа, дающая возможность ранжирования и выборки учебных заданий к текстам, рисункам, аудио;
5. Генератор осмысленных фраз на основе векторов признаков - генерация однотипных фраз, относящихся к разным темам на основе метода декларативного программирования;
6. Генератор текстовых заданий по стандартным шаблонам - генерация предложений на основе шаблонов и составление учебных заданий на основе данных предложений. Заданий типа: выбор правильного варианта, множественный выбор и ранжирование слов в предложении;
7. Генератор большого объема текстов по стандартным шаблонам - генерация большого объема ассоциативно связанных предложений в текст на основе различных шаблонов;
8. Transcription Generated - генерация транскрипции на основе различных европейских языков, с генерацией ошибочных вариантов для их исправления в качестве учебных заданий.
Задачи диссертации состоят в:
1. Наполнении курса электронными новыми материалами в различных форматах;
2. Разработке математической модели;
3. Разработка алгоритмической модели;
4. Разработка модели и программы автоматического парсинга учебных материалов на основе принципов машины Кирдина;
5. Описании синтаксиса дерева парсинга электронного курса;
6. Разработке алгоритм парсинга html, xml, moodle, xml и других форматов для приведения кодировки электронного курса к выбранному приведенному виду.
Назначение программы - генерация учебных заданий для обучения иностранному языку, что позволит помочь студентам и лицам, изучающим иностранные языки, овладеть навыками чтения текста на иностранном языке за минимальное время, на основе опоры в виде практической или (на выбор пользователя) международной транскрипции.
Предметное содержание обучения профессиональному иностранному языку является важным в обучении, решения для более эффективного обучения невозможно без активного участия профильных кафедр. Кафедры иностранных языков технических вузов ищут пути максимально эффективного преподавания иностранного языка и профессионального иностранного языка при минимальном количестве выделенных на данную дисциплину часов и низком уровне владения языком.
И здесь для вуза, для профильных кафедр и кафедр иностранных языков есть широкое поле деятельности в сфере налаживания международных образовательных и исследовательских контактов, совместных международных проектов, академических обменов и пр.
Важную роль в освоении изучаемого языка играет самостоятельная работа студентов. Поэтому большой объем учебного материала по иностранному языку выносится на самостоятельную работу студента. Для этого разработаны интернет-версии лабораторных работ различных уровней, как для студентов младших курсов, так и для студентов, изучающих профессиональный иностранный язык. В настоящее время практически в каждой научной дисциплине применяют электронные ресурсы. Поэтому ежегодно происходят нововведения в процессе обучения, интегрируются более современные и продуктивные системы. Повсеместное использование информационных технологий в сфере образования обуславливается необходимостью поддержания современного высокого уровня подготовки специалистов, как результат совершенствования методики обучения.
Актуальность работы.
Повсеместное использование информационных технологий в сфере образования обуславливается необходимостью поддержания современного высокого уровня подготовки специалистов, как результат совершенствования методики обучения.
Актуальность данной работы состоит в разработке алгоритмического и математического аппарата для парсинга строк, что позволит решить проблему порождения разностных документов схожего содержания. С учетом привлечения иерархии учебного курса.
Необходимость использования индивидуальной адаптивной траектории обучения для учащихся вузов по дисциплине «Иностранный язык», в необходимости генерации больших объемов учебных материалов с учетом ограничений на временные и человеческие ресурсы, частая сменяемость платформ электронного обучения, и невозможность привлечения материалов из конкурирующих платформ.
Использование информационных технологий в образовании определяется следующими причинами:
- широкими возможностями информационных технологий по индивидуализации образования;
- повышением мотивации обучающихся при использовании информационных технологий и усилением эмоционального фона образования;
- предоставлением широкого поля для активной самостоятельной деятельности обучающихся;
- высокой наглядностью представления учебного материала, особенно при моделировании явлений в динамике;
- все возрастающими интерактивными возможностями информационных технологий;
- доступностью информационных технологий в любое удобное обучающемуся время.
Новизна данной работы состоит в разработке алгоритмического и математического аппарата для парсинга строк, что позволит решить проблему порождения разностных документов схожего содержания. С учетом привлечения иерархии учебного курса.
Применение программного и технического обеспечения предоставляет большие возможности в традиционном обучении. Одним из которых являются электронные образовательные ресурсы. Именно образовательные ресурсы представляют собой базу для обеспечения высокого качества прохождения учащимися учебного процесса.
Цель диссертации:
Разработка модели и программы автоматического парсинга учебных материалов на основе принципов машины Кирдина для их вариативности, трансляции различных типов электронных курсов на основе универсальной модели дерева парсинга, системы генерации дерева учебного курса с возможностью его конвертирования в различные виды учебных пособий - Generation Office Converter. Подготовка новых учебных материалов, для электронного курса, используя более совершенные методы генерации учебных заданий, что должно повысить качество обучения. Встроить данную программу в систему программных продуктов Generation Office с учетом их совместимости, для автоматической генерации учебных заданий, с интеграцией всех программ на основе единого формата файлов, которая объединит в себе такие ранее созданные программы как:
1. Open - and - Read Generator предназначен для генерации учебных материалов по методу Ильи Франка;
2. Text-Based Task Generator - составление большого объема вариантов текстовых заданий на основе входного текста;
3. Semantic Electronic Dictionary - Обеспечивает возможность выбора материалов из семантической классификации: в форме списков слов, подстановочных таблиц, с транскрипцией, без транскрипции, в алфавитном, в семантическом порядке и другими заданными параметрами;
4. Patterns Maker - программа, дающая возможность ранжирования и выборки учебных заданий к текстам, рисункам, аудио;
5. Генератор осмысленных фраз на основе векторов признаков - генерация однотипных фраз, относящихся к разным темам на основе метода декларативного программирования;
6. Генератор текстовых заданий по стандартным шаблонам - генерация предложений на основе шаблонов и составление учебных заданий на основе данных предложений. Заданий типа: выбор правильного варианта, множественный выбор и ранжирование слов в предложении;
7. Генератор большого объема текстов по стандартным шаблонам - генерация большого объема ассоциативно связанных предложений в текст на основе различных шаблонов;
8. Transcription Generated - генерация транскрипции на основе различных европейских языков, с генерацией ошибочных вариантов для их исправления в качестве учебных заданий.
Задачи диссертации состоят в:
1. Наполнении курса электронными новыми материалами в различных форматах;
2. Разработке математической модели;
3. Разработка алгоритмической модели;
4. Разработка модели и программы автоматического парсинга учебных материалов на основе принципов машины Кирдина;
5. Описании синтаксиса дерева парсинга электронного курса;
6. Разработке алгоритм парсинга html, xml, moodle, xml и других форматов для приведения кодировки электронного курса к выбранному приведенному виду.
Назначение программы - генерация учебных заданий для обучения иностранному языку, что позволит помочь студентам и лицам, изучающим иностранные языки, овладеть навыками чтения текста на иностранном языке за минимальное время, на основе опоры в виде практической или (на выбор пользователя) международной транскрипции.
Поставленные вначале проектирования задачи были реализованы в результате выполнения выпускной квалификационной работы.
В данной работе приведен анализ проблемы автоматического парсинга учебных материалов на основе принципов машины Кирдина. Предложена алгоритмическая и математическая модель. Рассматриваются возможности применения этих методов для автоматической парсинга в текстах на естественном языке. Разработан программный продукт, осуществляющий автоматический парсинг учебных материалов на естественном языке.
В заключение необходимо отметить, что предложенных формулы, алгоритмы и реализации являются эффективным средством обеспечения для обучения иностранному языку.
Материал в проекте изложен с соблюдением внутренней логики, между разделами существует взаимосвязь. Поставленные задачи были решены.
В данной работе приведен анализ проблемы автоматического парсинга учебных материалов на основе принципов машины Кирдина. Предложена алгоритмическая и математическая модель. Рассматриваются возможности применения этих методов для автоматической парсинга в текстах на естественном языке. Разработан программный продукт, осуществляющий автоматический парсинг учебных материалов на естественном языке.
В заключение необходимо отметить, что предложенных формулы, алгоритмы и реализации являются эффективным средством обеспечения для обучения иностранному языку.
Материал в проекте изложен с соблюдением внутренней логики, между разделами существует взаимосвязь. Поставленные задачи были решены.



