Представленный материал является образцом учебного исследования, примером структуры и содержания учебного исследования по заявленной теме. Размещён исключительно в информационных и ознакомительных целях.
Workspay.ru оказывает информационные услуги по сбору, обработке и структурированию материалов в соответствии с требованиями заказчика.
Размещение материала не означает публикацию произведения впервые и не предполагает передачу исключительных авторских прав третьим лицам.
Материал не предназначен для дословной сдачи в образовательные организации и требует самостоятельной переработки с соблюдением законодательства Российской Федерации об авторском праве и принципов академической добросовестности.
Авторские права на исходные материалы принадлежат их законным правообладателям. В случае возникновения вопросов, связанных с размещённым материалом, просим направить обращение через форму обратной связи.
ℹ️Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.
ВВЕДЕНИЕ 3
Глава 1. Информационная безопасность 4
Глава 2. Уникальность почерка 5
Глава 3. Машинное обучение 9
3.1 Сверточные сети 10
Глава 4. Данные для обработки 12
Глава 5. Реализация 13
5.1 Выбор инструментов 13
5.2. Предобработка данных 14
5.3. Выбор и построение модели 19
ЗАКЛЮЧЕНИЕ 31
СПИСОК ИСПОЛЬЗОВАННОЙ ЛИТЕРАТУРЫ 33
ПРИЛОЖЕНИЕ 3
📖 Введение
В современном мире остро стоят вопросы информационной безопасности как безопасности общества. Очень важно сохранять приватность пользователей информационных систем, соблюдать выполнение трех аспектов информационной безопасности: конфиденциальности, целостности, доступности. Способы идентификации личности становятся всё более сложными, разнообразными и точными. Один из способов идентификации проводится по почерку, так как он уникален у каждого человека. С высокой вероятностью можно определить авторство и использовать эту информацию для дальнейшей аутентификации и авторизации. При сочетании с другими способами определения подлинности личности можно повышать вероятность правильной идентификации.
Цель проекта - разработать модель для идентификации автора по рукописному тексту. Поставленные задачи:
1) выделение значимых признаков рукописного текста;
2) сбор и обработка признаков текста;
3) изучение принципов машинного обучения;
4) изучение алгоритмов и архитектур нейронных сетей, а также способов их тренировки;
5) разработка и реализация различных моделей.
Актуальность задачи состоит в постоянной потребности обеспечения информационной безопасности и корректности процедуры идентификации как её составляющей, а также повсеместном применении машинного обучения, которое может обеспечить более высокие результаты решения задач, чем стандартные приёмы
✅ Заключение
Машинное обучение получает всё большее развитие и применение в разных сферах и задачах. Появляются инструменты, позволяющие относительно быстро и легко внедрить методы машинного обучения в поставленную задачу и сравнить скорость и качество решения с другими методами. В этой работе алгоритмы машинного обучения были применены для такой задачи, как идентификация автора по рукописному тексту. В ходе работы были изучены темы машинного обучения, обработки данных и нейронных сетей. Были разработаны методы для сбора определенного типа данных из изображений текста, а именно характеристики петель в прописных буквах. Было выяснено, что для обучения модели очень важны как её параметры, так и данные, на которых она проводит обучение, так как это серьезно сказывается на точности работы модели. Были реализованы модели для классификации данных и идентификации автора по рукописному тексту. Были изучены способы повышения точности работы нейронных сетей.
Одна из реализованных моделей показала достаточно высокие результаты и может применяться на практике. Можно проверить её производительность и точность на более большом объеме данных и большем количестве авторов, а также поменять тип данных с изображения строки на изображение целого листа. Так сверточной сети удастся выделить больше индивидуальных признаков, потому что текстура текста проявится в полной мере и станет более очевидной. Для повышения точности можно комбинировать классификацию по разным параметрам и затем объединять результаты.
Модели, созданные для анализа текста на основе петель, показали невысокие результаты. Для улучшения их производительности необходимо поработать над набором данных для обучения и верификации; но исключать эти методы как неработоспособные не следует. Для этого случая нужен более аккуратный и специфичный сбор данных: требуется обработка не целого текста, а отдельно прописанных букв, у которых есть петли и признаки которых можно собрать без больших погрешностей. Таким образом можно заключить, что все методы имеют потенциал и множество вариантов модернизации, и при дальнейшей разработке результаты могут стать лучше.