Тип работы:
Предмет:
Язык работы:


Разработка ПО для преобразования шаблона в формате pdf и текстового файла в документ формата docx

Работа №140053

Тип работы

Бакалаврская работа

Предмет

математика и информатика

Объем работы48
Год сдачи2023
Стоимость4650 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
27
Не подходит работа?

Узнай цену на написание


Аннотация 2
Abstract 3
Введение 6
Глава 1 Основные понятия и типовые способы выделения данных из pdf файл .9
1.1 Файл формата pdf 9
1.2 Типовые способы выделения данных из PDF файла 12
1.3 Обоснование выбора выделения данных с помощью Python 13
1.4 Выбор шаблона в формате PDF и текстового листа с данным для
заполнения 14
Глава 2 Поиск подходящих библиотек, для разбора pdf документа, формирования файла в формате docx и графического интерфейса 17
2.1 Поиск библиотек языка Python для реализации ПО 17
2.2 Библиотека для форматирования и извлечения текста из PDF 20
2.3 Библиотека для работы с DOCX-файлами 24
2.4 Библиотека для создания графического интерфейса 27
Глава 3 Разработка программного обеспечение и тестирование 32
3.1 Выбор средств разработки 32
3.2 Функционал программного обеспечения 34
3.3 Реализация программного обеспечения 36
3.4 Разработка пользовательского интерфейса 41
Заключение 46
Список используемой литературы и используемых источников 47


Документооборот, это неотъемлемая часть рабочего процесса любой организации. Один из пунктов заполнение различных справок или шаблонов. Как правило пользователю предлагается набор инструментов (word, libre office) для создания текстового документа с нуля. Актуально иметь ПО которое автоматически заполняет документ данными из заданного шаблона, это позволит сократить время на заполнение и получение такого документа. Наличие такого ПО позволит внедрить автоматическое заполнение документа в электронной системе, например, из базы данных можно по запросу извлечь необходимые поля и сформировать заполненный документ или справку, либо форму, соответствующую заданному стандарту.
В последнее время все растет востребованность в преобразовании одних фалов в другие. На сегодняшний день формат документов PDF является одним из самых надежных и важным форматов для передачи и распространения информации в сети Интернет и по электронной почте. Однако и им присуще свои недостатки, особенно при изменении и редактировании. Чтобы избежать таких проблем, пользователям может понадобится программное обеспечение, которое способно преобразовать PFD в формат, который легко редактируется, как например DOCX.
Таким образом, актуальность данной темы моей выпускной квалификационной работы объясняется необходимостью разработки программного обеспечения, для преобразования файлов.
Целью данной выпускной квалификационной работы (ВКР) является создание программного обеспечения, способного преобразовать файлы, а именно шаблоны в формате PDF и текстовые фалы, в формат DOCX, на примере титульного листа.
Программное обеспечение извлекает тест и форматирование шаблона PDF, соединяет данные с текстового документ и заполняет их в необходимом формате, преобразовывает полученное в документ формата DOCX.
Для достижения поставленной цели необходимо решить следующие
задачи:
• Рассмотреть типовые способы выделения особенностей из формата PDF;
• Выбрать титульный лист формата PDF и текстовый файл с данными;
• Выбрать средства разработки программы;
• Разработать программное обеспечение;
• Реализовать графический интерфейс.
Практическая значимость работы заключается в создании программного обеспечения.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Разработанное программное обеспечение позволяет автоматизировать заполнение шаблона в формате pdf данными из текстового файла и сформировать заполненный документ в формате docx.
В результате постановки задачи выполнен обзор предметной области, сформированы требования к программному обеспечению и способ его реализации.
Рассмотрены необходимые библиотеки для написание программного обеспечения, описаны характеристики и возможности, способ их установки.
Произведен выбор среды разработки и описан функционал программного обеспечения. Описан пользовательский интерфейс. Произведен текст программного обеспечения.
Таким образом, все поставленные задачи были успешно выполнены, цель работы - достигнута.


1. Portable Document Format (PDF) [Электронный ресурс]. URL: https: //ru. wikipedia. org/wi ki/Portable Document F ormat (дата обращения 25.02.2023)
2. Использование PDF в России [Электронный ресурс]. URL:
https://www.tadviser.ru/index.php/%D0%A1%D1%82%D0%B0%D1%82%D1 %8C%D 1 %8F: PDF(Portable Document Format) (дата обращения
25.02.2023)
3. Информация о репозитории PyPi [Электронный ресурс]. URL: https://pypi.org/ (дата обращения 25.04.23)
4. Работа с файлами MS Word в Python [Электронный ресурс]. URL: https://tokmakov.msk.ru/blog/item/78 (дата обращения 25.04.23)
5. Лучшие инструменты Python: IDE и редакторы коды
[Электронный ресурс] URL: https: //eternalhost.net/blo g/razrabotka/python-ide (дата обращения 05.05.2023)
6. Создание и преобразование PDF в Docx через библиотеку Open
Source Python [Электронный ресурс] URL:
https://products.fileformat.com/ru/pdf/python/pdf2docx/ (дата обращения 25.04.23)
7. Глоссарий основных терминов IT [Электронный ресурс] URL: https://itglobal.com/ru-ru/company/glossary/gui/ (дата обращения 25.04.23)
8. PySimpleGUI [Электронный ресурс] URL:
https://pypi.org/project/PySimpleGUI/ (дата обращения 25.04.23)
9. Python API для создания и редактирования документов Microsoft Word [Электронный ресурс] URL: https://products.fileformat.com/ru/word- processing/python/python-docx/ (дата обращения 26.04.23)
10. Превращаем Python-скрипт в исполняемый файл [Электронный ресурс] URL: https://thecode.media/pyinstaller/ (дата обращения 27.04.23)
11. Pdf2docx [Электронный ресурс] URL:
https: //pypi. org/proj ect/pdf2docx/ (дата обращения 26.04.23)
12. Python-docx [Электронный ресурс] (дата обращения 25.04.23)
13. Объект Document модуля python-docx в Python [Электронный
ресурс] URL: https://docs-python.ru/packages/modul-python-docx-
python/klass-document/ (дата обращения 29.04.23)
14. Python-docx documentation [Электронный ресурс] URL: https: //pypi. org/proj ect/python-docx/ (дата обращения 29.04.23)
15. Pdf2docx documentation [Электронный ресурс] URL:
https: //dothinking. github .io/pdf2docx/quickstart.convert.html (дата обращения 29.04.23)...20


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ