Тема: Разработка конвертера с кириллической графики на латинскую графику для татарского языка
Закажите новую по вашим требованиям
Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
📋 Содержание
Глава 1. Теоретико-нормативные основы использования и конвертации
кириллицы на латиницу для татарского языка 9
1.1 Теоретические аспекты использования латинской графики в
татарском языке 9
1.2 Анализ существующих разработок 17
Выводы по первой главе 22
Глава 2. Проектирование, разработка и тестирование конвертера
кириллицы на латиницу для татарского языка 23
2.1. Описание алгоритмической модели 23
2.2. Исследование различных методов распознавания этимологии 29
2.3. Реализация программного продукта и его возможности 47
2.4. Тестирование готового программного продукта 61
Выводы по второй главе 69
Заключение 70
Список использованной литературы 71
Приложения
📖 Введение
компьютерные технологии как язык хранения, обработки и передачи информации.
Очевидно, чем ближе алфавит языка к алфавиту языка мировых информационных технологий, каковой сегодня является латиница, и чем меньше промежуточных конвертаций - тем он эффективнее, так как это приводит к экономии памяти для хранения и сокращению времени обработки - а значит и выгодно экономически. Уменьшение промежуточных модулей (конверторов, таблиц перехода) приводит к увеличению надежности системы (меньше деталей - больше надежность). Как известно, в технических системах, время, память, надежность - это одни из самых критичных и важных показателей. Многие из тюркоязычных стран решили вернуться к латинице. И это понятно, так как латинская азбука позволила тюркским языкам, в том числе и татарскому языку, создать удобную систему чтения и письма. Она соответствует канонам тюркского языка и несложна для освоения. Латиница одна из наиболее употребляемых график в мире. У многих народов Европы (кроме болгар) латинское письмо. У родственной с нами малой Азии, Северной и Южной Америки тоже латинская графика. Латиница позволяет сохранить обычаи и традиции, язык народа.
В Республике Татарстан (РТ) ведутся масштабные работы по сохранению и развитию языка как основы татарской письменности. РТ является одним из лидирующих субъектов федерации по темпам компьютеризации и информатизации. Государственные структуры РТ, а также энтузиасты вовлечены в процесс разработки различных проектов, цель которых - интеграция татарского языка и культуры с информационно-коммуникационными технологиями. За свою историю татарский язык несколько раз менял свою письменность, в разное время использовались разные системы письма. Арабское письмо - до 1927 года. Данным видом письма пользуются немногочисленные татары Китая и в наше время.
• Латиница - в 1927-1939 годах. В настоящее время Латиницу используют татары Турции, Финляндии, Чехии, Польши, США и Австралии.
• Кириллица - с 1939 года по настоящее время. Крещеные татары пользовались кириллицей с XIX века.
Данную письменность пытались возродить на рубеже ХХ-ХХ1 веков. В тридцатые годы 20 века был принят новый алфавит “Яцалиф”, который позволил показать положительные стороны использования латинской графики в татарском языке, а именно:
• Стало проще усваивать европейский язык
• Сохранилось возможность чтения книг, понимания между собой среди тюркских языков еще со времен использования арабской графики. Т.к. после принятия единой графики многие книги были переведены и написаны с использованием латинских букв.
Использование единой графики выгодно с точки зрения межкультурного взаимодействия, так как латиница позволяет сохранить обычаи и традиции, язык народа.
В ситуации, когда параллельно происходит использование двух алфавитов — латиницы и кириллицы — возникает необходимость в конвертации сообщений между двумя типами график. Разрабатывается специальное программное обеспечение, предназначенное для конвертации текстов на татарском языке с кириллицы на латиницу. Этими вышестоящими причинами обусловлено создание конвертера с кириллической графики на латинскую графику для татарского языка.
Выбор темы исследования обозначен противоречием между необходимостью в программном продукте, реализующим процесс
конвертации, и отсутствием соответствующих решений на рынке программного обеспечения.
Цель исследования заключается в разработке программного продукта, предназначенного для конвертации кириллической графики на латинскую графику для татарского языка.
Объект исследования: компьютерная обработка естественного языка.
Предмет исследования: разработка конвертера с кириллической графики на латинскую графику для татарского языка.
Гипотеза: процесс конвертации кириллической графики на
латинскую графику для татарского языка может быть эффективнее, если:
• исследованы правила использования латинской графики в татарском языке и проанализированы принципы конвертации татарской кириллицы в татарскую латиницу;
• разработано программное обеспечение, осуществляющее конвертацию татарской кириллицы в татарскую латиницу;
• апробирован и опубликован готовый программный продукт.
Задачи исследования:
• Изучить аспекты конвертации татарской кириллицы в татарскую латиницу;
• Разработать программное обеспечение, осуществляющее конвертацию татарской кириллицы в татарскую латиницу;
• Протестировать, опубликовать и апробировать готовый программный продукт.
В ходе работы были использованы главным образом следующие методы исследования: теоретические (анализ научной литературы, посвященной особенностям конвертации татарской кириллицы в татарскую латиницу, теории алгоритмов, теории вероятностей); статистические (качественный анализ результатов исследования); эмпирические (методы математического моделирования, линейного программирования, анализа вычислительных алгоритмов, методы объектно-ориентированного программирования, методы применения шаблонов проектирования, тестирование программного обеспечения).
База исследования — экспериментальная работа проводилась на базе кафедры образовательных технологий и информационных систем в филологии Института филологии и межкультурной коммуникации имени Льва Толстого федерального государственного автономного образовательного учреждения высшего образования «Казанский (Приволжский) федеральный университет».
Научная новизна:
1. Изучены особенности использования латинской графики в татарском языке, а также сформулированы принципы конвертации татарской кириллицы в татарскую латиницу. В основе использования латинской графики для татарского языка лежит обновленный вариант латинского алфавита и принцип соответствия фонемы и графемы. Данный принцип применяется лишь для конвертации родных слов татарского языка, для конвертации заимствованных слов применяется принцип конвертации, основанный на механической транслитерации.
2. Разработана алгоритмическая модель конвертации с кириллицы на латиницу, ключевой особенностью которой является модуль определения этимологии обрабатываемых слов. Функционирование модуля основано на применении статистических методов, а также методов линейного программирования: комбинированный биграммный анализ, наивный байесовский классификатор, прямой перебор.
3. Протестировано и опубликовано программное обеспечение, позволяющее производить конвертацию текстовых сообщений на татарском языке с кириллицы на латиницу. В основу разработки программного обеспечения легли принципы модульности и расширяемости, которые позволяют улучшать качество работы программного продукта, а также применять его для конвертации других тюркских языков.
Теоретическая значимость: Исследованы современные правила и принципы преобразования кириллической графики на латинскую графику для татарского языка. Обобщены и представлены в виде алгоритмической модели правила конвертации кириллической графики на латинскую графику для татарского языка. Результаты исследования могут быть использованы в процессе разработки аналогичных программных решений для других тюркских языков.
Практическая значимость: разработанный конвертер откроет
новые возможности по использованию татарского языка в сфере коммуникации, ИТ-индустрии. Материалы диссертации могут использоваться при преподавании дисциплины «Информационные технологии в профессиональной деятельности» для магистрантов, обучающихся по специальности «Информационные технологии в филологии и образовании» Института филологии и межкультурной коммуникации имени Льва Толстого федерального государственного автономного образовательного учреждения высшего образования «Казанский (Приволжский) Федеральный университет»
✅ Заключение
Были рассмотрены аспекты использования латиницы в татарском языке. Было создано программное обеспечение для автоматической конвертации сообщения записанного с помощью татарской кириллицы в сообщение, записанное с помощью татарской латиницы.
Разработанное программное обеспечение показало высокую точность и скорость конвертации, что подтверждает нашу гипотезу. Программное обеспечение было протестировано и опубликовано. Модульность и расширяемость программного продукта позволяют улучшать качество работы программного продукта, а также применять его для конвертации других тюркских языков.



