Тип работы:
Предмет:
Язык работы:


Поиск дубликатов изображений на примере Instagram

Работа №131611

Тип работы

Бакалаврская работа

Предмет

программирование

Объем работы37
Год сдачи2016
Стоимость4550 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
61
Не подходит работа?

Узнай цену на написание


Введение 3
Постановка задачи 4
Используемые термины 5
Обзор литературы 7
Глава 1. Примеры существующих систем поиска дубликатов изображений 9
1.1 Google Images 9
1.2 Яндекс.Картинки 10
1.3 TinEye 11
1.4 ReportStatistics 12
Глава 2. Перцептуальные хэш-алгоритмы 13
2.1 aHash (Average hash или простой перцептуальный хэш) 14
2.2 pHash (Perceptive Hash или Перцептивный хэш) 15
2.3 dHash (Difference Hash) 17
2.4 gHash (Gradient Hash) 17
Глава 3. Реализация алгоритмов 19
Глава 4. Создание веб-сервиса на базе Microsoft Azure 24
Выводы 27
Заключение 28
Источники и литература 29
Приложение 31

В нашем обществе использование чужих идей с указанием источника или официально приобретенных продуктов не запрещается. Но существует проблема нарушения авторских прав, незаконного использования, обусловленная прогрессом современных информационных технологий и широким использованием сети Интернет. Интернет помогает стремительно развиваться не только авторству, но и плагиату. В настоящее время в большинстве стран мира существуют законы, защищающие авторские права. Несоблюдение этих законов может приводить к серьёзным последствиям, вплоть до тюремного заключения.
Плагиат фотографий является не меньшей проблемой чем, например, плагиат авторских текстов. Данная проблема весьма насущна для Instragram - социальной сети для обмена фотографиями и видеозаписями, которая достигла огромной популярности за последние 5 лет. Кража и повторная публикация чужих фотографий в Instagram является не только нарушением авторских прав, но и кражей личной собственности.
Целью данной выпускной квалификационной работы является создание прототипа системы поиска дубликатов изображений на примере социальной сети Instagram. Подобная система будет полезна людям, которые беспокоятся о том, что кто-то присваивает их авторство себе, и людям, которые хотят получить информацию о первоисточнике фотографии. Также она окажет большое содействие в борьбе со спамом - навязчивой нежелательной рекламой.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Проблема поиска дубликатов изображений в настоящее время остается одной из самых интересных и по-своему сложных задач. На сегодняшний день не существует такого алгоритма, который бы справился с ней на все 100%. Но современные информационные технологии не стоят на месте и постоянно развиваются. И, кто знает, возможно в недалеком будущем такая проблема будет абсолютно разрешима.
Автор данной ВКР в полной мере справился с поставленной задачей создания системы поиска дубликатов изображений для социальной сети Instagram. В дальнейшем планируется создать систему автозаполнения и обновления базы данных для фотографий из инстаграма и реализовать гибкий поиск в ней. Также возможно применение алгоритмов перцептуального хэширования не только для фотографий, но и для видео и аудио файлов, о чем рассказывается в работах [11] и [12]. Таким образом, станет возможным поиск не только дубликатов фотографий, но и поиск похожих видеозаписей в инстаграме.


1. Kind of Like That // The Hacker Factor Blog. URL: http://www.hackerfactor.eom/blog/7/archives/529-Kind-of-Like-That.html (дата обращения 11.12.2015).
2. Looks Like IT // The Hacker Factor Blog. URL: http://www.hackerfactor.com/blog/index.php7/archives/432-Looks-Like- It.html (дата обращения 11.12.2015).
3. Перцептуальные хэши для сравнения изображений // IT Sector Blog von Alexandr M. URL: http://malexit.ru/7p=93 (дата обращения 13.12.2015).
4. Niu Xia-mu, Jlao Yu-hua An Overview of Perceptual Hashing // ACTA ELECTRONICA SINICA. China, Beijing, July, 2008, Vol.36, No. 7, p. 1405-1411.
5. Zauner C. Implementation and Benchmarking of Perceptual Image Hash Functions. Master’s thesis, 2010.
6. Hamming Distance. // Wikipedia. URL: https://en.wikipedia.org/wiki/Hamming distance (дата обращения 11.12.2015).
7. Сибирь (технология Яндекса) // Wikipedia. URL: https: //ru. wikipedia. org/wiki/Сибирь(технология Яндекса) (дата обращения 16.04.2016).
8. The Discrete Cosine Transform (DCT) // Cardiff School of Computer Science & Informatics. URL: http://www.cs.cf.ac.uk/Dave/Multimedia/node231 .html (дата обращения 11.12.2015).
9. Новый поиск похожих картинок // Блог Яндекса. URL: https://yandex.ru/blog/company/90100 (дата обращения 16.04.2016).
10. R. Venkatesan, S.-M. Koon, M. H. Jakubowski and P. Moulin Robust image hashing // Proc. IEEE ICIP, Vancouver, Canada, September, 2000.
11. M. K. Mihgak and R. Venkatesan A perceptual audio hashing algorithm: a tool for robust audio identification and information hiding // Inf. Hiding 2001, p. 51-65.
12. O. Kjelsrud Using Perceptual Hash Algorithms to Identify Fragmented and Transformed Video Files, Master’s thesis, 2014.
13. Центр документации // Microsoft Azure. URL: https://azure.microsoft.com/ru-ru/documentation/ (дата обращения 22.04.2016).
14. pHash Demo // pHash, the open source perceptual hash library. URL: http: //www. phash. org (дата обращения 11.12.2015).


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ