Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
ℹ️Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.
ВВЕДЕНИЕ 3
Глава 1. Информационная безопасность 4
Глава 2. Уникальность почерка 5
Глава 3. Машинное обучение 9
3.1 Сверточные сети 10
Глава 4. Данные для обработки 12
Глава 5. Реализация 13
5.1 Выбор инструментов 13
5.2. Предобработка данных 14
5.3. Выбор и построение модели 19
ЗАКЛЮЧЕНИЕ 31
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 33
ПРИЛОЖЕНИЕ
📖 Аннотация
Работа посвящена разработке модели для идентификации автора по рукописному тексту с использованием методов машинного обучения. Актуальность задачи обусловлена необходимостью повышения точности процедур идентификации личности в системах информационной безопасности, где традиционные методы не всегда обеспечивают требуемую надежность, а уникальность почерка каждого человека позволяет использовать его в качестве биометрического признака. В ходе исследования были изучены принципы машинного обучения и архитектуры нейронных сетей, разработаны методы сбора и обработки признаков рукописного текста, в частности характеристик петель в прописных буквах. Реализованы и протестированы несколько моделей классификации, одна из которых продемонстрировала достаточно высокие результаты, подтвердив потенциал применения сверточных нейронных сетей для данной задачи. Выявлено, что точность работы моделей существенно зависит как от параметров обучения, так и от качества и объема исходных данных. Практическая значимость работы заключается в возможности использования разработанной модели для аутентификации и авторизации пользователей в информационных системах, а также в перспективах её дальнейшего совершенствования за счет увеличения объема данных и комбинирования различных классификационных признаков.
📖 Введение
В современном мире остро стоят вопросы информационной безопасности как безопасности общества. Очень важно сохранять приватность пользователей информационных систем, соблюдать выполнение трех аспектов информационной безопасности: конфиденциальности, целостности, доступности. Способы идентификации личности становятся всё более сложными, разнообразными и точными. Один из способов идентификации проводится по почерку, так как он уникален у каждого человека. С высокой вероятностью можно определить авторство и использовать эту информацию для дальнейшей аутентификации и авторизации. При сочетании с другими способами определения подлинности личности можно повышать вероятность правильной идентификации.
Цель проекта - разработать модель для идентификации автора по рукописному тексту. Поставленные задачи:
1) выделение значимых признаков рукописного текста;
2) сбор и обработка признаков текста;
3) изучение принципов машинного обучения;
4) изучение алгоритмов и архитектур нейронных сетей, а также способов их тренировки;
5) разработка и реализация различных моделей.
Актуальность задачи состоит в постоянной потребности обеспечения информационной безопасности и корректности процедуры идентификации как её составляющей, а также повсеместном применении машинного обучения, которое может обеспечить более высокие результаты решения задач, чем стандартные приёмы.
✅ Заключение
Машинное обучение получает всё большее развитие и применение в разных сферах и задачах. Появляются инструменты, позволяющие относительно быстро и легко внедрить методы машинного обучения в поставленную задачу и сравнить скорость и качество решения с другими методами. В этой работе алгоритмы машинного обучения были применены для такой задачи, как идентификация автора по рукописному тексту. В ходе работы были изучены темы машинного обучения, обработки данных и нейронных сетей. Были разработаны методы для сбора определенного типа данных из изображений текста, а именно характеристики петель в прописных буквах. Было выяснено, что для обучения модели очень важны как её параметры, так и данные, на которых она проводит обучение, так как это серьезно сказывается на точности работы модели. Были реализованы модели для классификации данных и идентификации автора по рукописному тексту. Были изучены способы повышения точности работы нейронных сетей.
Одна из реализованных моделей показала достаточно высокие результаты и может применяться на практике. Можно проверить её производительность и точность на более большом объеме данных и большем количестве авторов, а также поменять тип данных с изображения строки на изображение целого листа. Так сверточной сети удастся выделить больше индивидуальных признаков, потому что текстура текста проявится в полной мере и станет более очевидной. Для повышения точности можно комбинировать классификацию по разным параметрам и затем объединять результаты.
Модели, созданные для анализа текста на основе петель, показали невысокие результаты. Для улучшения их производительности необходимо поработать над набором данных для обучения и верификации; но исключать эти методы как неработоспособные не следует. Для этого случая нужен более аккуратный и специфичный сбор данных: требуется обработка не целого текста, а отдельно прописанных букв, у которых есть петли и признаки которых можно собрать без больших погрешностей. Таким образом можно заключить, что все методы имеют потенциал и множество вариантов модернизации, и при дальнейшей разработке результаты могут стать лучше.