Тип работы:
Предмет:
Язык работы:


Система сжатия информации с выбором оптимального алгоритма

Работа №180498

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы51
Год сдачи2019
Стоимость4600 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
0
Не подходит работа?

Узнай цену на написание


Введение 5
1 Обзор алгоритмов 7
1.1 LZMA2 7
1.2 BZip2 8
1.3 Deflate 10
1.4 PPMD 10
2 Функционал приложения 12
3 Анализ результатов тестирования по степени сжатия 14
4 Разница между doc и docx 18
5 Сжатие изображений 20
6 Функция принадлежности 21
7 Анализ результатов тестирования по скорости сжатия 23
Заключение 25
Список использованных источников и литературы 26
Приложение А. Код графического интерфейса 28
Приложение Б. Код логики программы 33

Количество информации постоянно растёт, в связи с чем нам приходится иметь дело с огромным объёмом данных, которые необходимо хранить и обрабатывать. Возможность эффективно использовать дисковое пространство рассматривалось ещё при рождении электронно -вычислительных систем. На протяжении всего времени эта проблема решалась различными алгоритмами сжатия данных.
Главный принцип сжатия основывается на том, что в любом файле, который содержит случайные данные, информация частично повторяется. А используя статистико-математические модели, можно выявить вероятность повторного вхождения определённой комбинаций символов.
В настоящее время существует множество алгоритмов сжатия информации, а также множество программ, которые используют данные алгоритмы. Но среднестатистический пользователь не владеет информацией о том, какой алгоритм более других подходит для того или иного файла.
Очевидно, что эффективность алгоритма должна зависеть от типа и объёма файла. Основываясь на результатах тестов, мы разработали приложение, которое, в зависимости от этих двух параметров, рекомендует пользователю оптимальный алгоритм, также предоставляя выбор приоритета по скорости или наилучшей степени сжатия.
В данной работе рассматривается исключительно сжатие без потерь. При таком сжатии закодированные данные восстанавливаются однозначно с точностью до бита. К таким алгоритмам относятся: LZMA2, BZip2, Deflate, PPMd. Именно их мы взяли за основу программы, ввиду их распространённости в наши дни и превосходством над более ранними и менее распространёнными алгоритмами современности.
Создание визуальной и функциональной оболочки программы происходило на языке программирования Python с использованием набора привязок графического фреймворка PyQt в среде программирования PyCharm от компании по производству программного обеспечения JetBrains.
Выбор этого программного обеспечения обусловлен следующими факторами:
1. Python ориентирован на повышение производительности пользователей и читаемость кода: синтаксис ядра минималистичен в то время, как стандартная библиотека содержит огромное количество полезных методов [6];
2. Среда разработки PyCharm обеспечивает простую организацию файлов и быструю скорость работы по сравнению с другими средами для программирования на языке Python [7];
3. PyQt представляет собой смесь языка программирования Python и библиотеки Qt. В то время как Qt - одна из самых мощных библиотек, которая содержит более 300 классов и почти 6000 функций и методов. Также эта библиотека является кроссплатформенной [9].


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В настоящей работе были рассмотрены различные способы компрессии. Все они при тестировании дали разные показатели времени и степени сжатия. Таким образом, можно рекомендовать для фалов .txt алгоритм сжатия PPMd для наилучшей компрессии, но не лучшей скорости, и метод LZMA2, как лидер среди сжатия данных с таблицами, документами и презентациями. Как самый быстрый алгоритм, чаще всего показывает себя Deflate.
Для архивирования изображений предпочтительнее использовать кодирование без сжатия, то есть такие форматы, как .tar, который содержит в себе общий архив, состоящий чаще всего из нескольких файлов.
Проанализировав все эти данные, было запрограммировано приложение, которое может помочь пользователю оптимально использовать два важных ресурса - дисковое пространство и время, которое тратится не только на ожидание завершения выполнения задачи, но и на понимание того, как работать с данной программой. Интуитивно-понятный интерфейс приложения позволяет любому пользователю легко разобраться в его эксплуатации.



1. Habr [Электронный ресурс] : Алгоритмы сжатия данных без потерь, часть 2 - 2014. - URL: https://habr.com/post/235553/.
2. Habr [Электронный ресурс] : Простейшие алгоритмы сжатия: RLE и LZ77 - 2012. - URL: https://habr.com/post/141827/.
3. Академик [Электронный ресурс] : Дельта-кодирование - 2014. - URL: http s ://dic. ac ademic. ru/dic. ns f/ruwiki/41976.
4. Wikipedia [Электронный ресурс] : Алгоритм сжатия PPM - 2018. - URL: http s ://ru. wikipedia. o гд^кРАлгоритм_сжатия_РРМ.
5. Habr [Электронный ресурс ] : Алгоритмы сжатия данных без потерь - 2014. - URL: https://habr.com/ru/post/231177/.
6. Wikipedia [Электронный ресурс] : Python - 2019. - URL:
https://ru.wikipedia.org/wiki/Python#Возможности.
7. Habr [Электронный ресурс ] : 10 причин, почему мы перешли на Py- Charm - 2011. - URL: https://habr.com/ru/post/122018/.
8. Wikipedia [Электронный ресурс] : PyCharm - 2019. - URL:
https://ru. wikipedia. org/wiki/PyCharm.
9. Habr [Электронный ресурс] : PyQt4 - Введение - 2008. - URL: https://habr. com/ru/post/31684/.
10. Habr [Электронный ресурс ] : Алгоритм Хаффмана на пальцах - 2012.
- URL: https://habr.com/ru/post/144200/.
11. Habr [Электронный ресурс ] : Алгоритмы LZW, LZ77 и LZ78 - 2011.
- URL: https://habr.com/ru/post/132683/.
12. Wikipedia [Электронный ресурс ] : Энтропийное кодирование - 2017.
- URL: https://ru.wikipedia.org/wiki/Энтропийное_кодирование.
13. ПетроЛинк [Электронный ресурс ] : Модели и алгоритмы принятия
решений в нечётких условиях - 2002. - URL:
http://dit.isuct.ru/IVT/BOOKS/IS/Model/cont.htm.
14. Об отличиях [Электронный ресурс ] : Разница между doc и docx - 2013. - URL: https://thedifference.ru/chem-otlichaetsya-doc-ot-docx/.
15. Starus recovery [Электронный ресурс ] : В чем разница между Doc и
DocX файлами и как их восстановить? - 2019. - URL:
https://www.starusrecovery.ru/articles/the-difference-between-doc-and-docx-files- how-to-recover. html... 17

Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ