📄Работа №214494

Тема: Разработка и внедрение скрипта для автоматизированного парсинга данных с сайтов по продаже автозапчастей

📝
Тип работы Бакалаврская работа
📚
Предмет информатика
📄
Объем: 59 листов
📅
Год: 2024
👁️
Просмотров: 4
Не подходит эта работа?
Закажите новую по вашим требованиям
Узнать цену на написание
ℹ️ Настоящий учебно-методический информационный материал размещён в ознакомительных и исследовательских целях и представляет собой пример учебного исследования. Не является готовым научным трудом и требует самостоятельной переработки.

📋 Содержание

Аннотация
Введение 5
Глава 1 Функциональное моделирование процесса автоматизации поиска автозапчастей для закупок в компании ООО «Торговый дом Токус» 7
1.3 Анализ бизнес-процесса закупки автозапчастей 11
1.4 Обоснование необходимости автоматизированного варианта
решения и формирование требований системы закупки автозапчастей 15
1.5 Анализ методов и инструментов для автоматизированного парсинга
данных с сайтов по продаже автозапчастей 17
1.6 Обзор технологий и языков программирования для разработки
скрипта парсинга данных 19
1.8 Функциональное моделирование бизнес-процесса «Применение автоматизированного парсинга данных с сайтов по продаже автозапчастей»
26
Глава 2 Логическое проектирование скрипта для автоматизированного парсинга данных с сайтов по продаже автозапчастей 28
2.1 Анализ потенциальных источников данных, включая сайты по
продаже автозапчастей 28
2.2 Идентификация основных сущностей и полей данных для сбора 29
2.3 Выбор и обоснование алгоритмов и методов парсинга данных 32
2.4 Моделирование функциональных требований АПД «SIMON» 34
Глава 3 Физическое проектирование АПД «SIMON» 39
3.1 Разработка архитектуры клиент-серверной системы 39
3.2 Разработка и отладка скрипта 40
3.3 Разработка и отладка пользовательского интерфейса T elegram бота.... 46
3.4 Тестирование скрипта на различных источниках данных 51
3.5 Оценка производительности и эффективности скрипта 53
Заключение 56
Список используемой литературы и используемых источников 58

📖 Введение

Актуальность разработки информационных систем для
автоматизированного парсинга данных с сайтов по продаже автозапчастей обусловлена необходимостью оптимизации работы специалистов, осуществляющих поиск и закупку деталей для машин на сайтах по продаже автозапчастей, работу с приходными закупочными накладными. Внедрение автоматизированного парсинга данных в процесс поиска необходимых комплектующих для заказчика по оптимальной цене и дате доставки позволяет сократить время на обработку одной заявки.
Объект исследования: закупочная деятельность в ООО «Торговый дом Токус».
Предметом исследования выпускной квалификационной работы является анализ, разработка и внедрение скрипта для автоматизированного парсинга данных с веб-сайтов, специализирующихся на продаже автозапчастей в условиях компании ООО «Торговый дом Токус».
Целью данной работы является разработка и внедрение скрипта для автоматизированного парсинга данных с сайтов по продаже автозапчастей.
Задачи работы: _
1. Исследование деятельности компании ООО «Торговый дом Токус», в частности отдела закупок;
2. Изучение основных принципов парсинга данных, методов и инструментов, обзор;
3. Определение функциональных и нефункциональных требований к скрипту парсинга данных;
4. Выбор средств реализации и обоснование выбора;
5. Разработка логической модели данных;
6. Написание и отладка скрипта;
7. Тестирование скрипта на различных источниках данных;
8. Разработка механизмов обработки ошибок и обновления данных;
9. Оценка производительности и эффективности скрипта.
В первой главе было проведено функциональное моделирование процесса закупки автозапчастей. Была рассмотрена организационная структура компании, детально описаны процессы ведения закупок. Выполнено построение модели бизнес-процессов закупочной деятельности, а также проанализирован перечень недостатков, связанных с ручным режимом поиска автозапчастей на различных сайтах. В результате анализа существующих систем автоматизации поиска автозапчастей на сайтах было выявлено, что их функционал не полностью соответствует специфике исследуемой организации и требуется разработка и внедрение скрипта для автоматизированного парсинга данных с сайтов по продаже автозапчастей.
Во второй главе было проведено построение логической модели информационной системы, направленной на оптимизацию процессов закупки автозапчастей. Эта модель включает различные типы связей между сущностями и определяет классификаторы, играющие важную роль в функционировании системы. Особое внимание было уделено выходным документам: их структуре, содержанию и назначению. Отдельным этапом было определение реквизитного состава информационных объектов, что позволило учесть все детали и особенности, связанные с данными, обрабатываемыми в системе.
В третьей главе была выполнена разработка архитектуры клиент- серверной системы, написан и отлажен скрипт на языке программирования Python; выполнено тестирование и отладка скрипта на различных источниках данных; разработаны механизмы обработки ошибок, а также выполнена оценка производительности и эффективности скрипта. 

Возникли сложности?

Нужна качественная помощь преподавателя?

👨‍🎓 Помощь в написании

✅ Заключение

В ходе выполнения данной работы были решены все поставленные задачи, что позволило всесторонне исследовать деятельность компании ООО «Торговый дом Токус», а также разработать и внедрить скрипт для парсинга данных. В результате проведенных исследований и разработки были достигнуты следующие цели:
Проведено тщательное исследование операционных процессов в отделе закупок компании ООО «Торговый дом Токус». В рамках этого этапа были изучены текущие методы работы отдела, выявлены основные проблемы и потребности в автоматизации процессов, связанных с обработкой и анализом данных. Это исследование стало фундаментом для последующей разработки скрипта для парсинга данных, позволяющего автоматизировать рутинные задачи и улучшить эффективность работы отдела.
В рамках второй задачи были рассмотрены современные подходы к парсингу данных. Изучены различные методы извлечения данных из веб-источников, включая HTML-разметку, XPath, CSS-селекторы и API. Были также проанализированы инструменты, такие как BeautifulSoup, Scrapy и Selenium, что позволило сделать обоснованный выбор оптимальных средств для реализации проекта.
На третьем этапе сформулированы функциональные требования, включающие необходимость извлечения данных из различных источников, гибкость настройки параметров парсинга, и возможность регулярного обновления данных. Нефункциональные требования касались производительности, устойчивости к ошибкам, безопасности и легкости в использовании скрипта.
На основе проведенного обзора инструментов для парсинга данных, было принято решение использовать комбинацию библиотек BeautifulSoup для парсинга HTML и Selenium для работы с динамическими веб-страницами. Такой выбор был обоснован необходимостью обеспечения высокой производительности и гибкости решения.
Для эффективной организации и хранения извлекаемых данных была разработана логическая модель данных. Она включала определение основных сущностей и их взаимосвязей, что позволило структурировать данные таким образом, чтобы облегчить их дальнейшую обработку и анализ.
Был разработан и отлажен скрипт для парсинга данных. Реализованы основные функциональные возможности, предусмотренные требованиями, и проведены тестирование на нескольких контрольных примерах для
Проведено тестирование скрипта на различных веб-источниках для проверки его универсальности и способности корректно обрабатывать данные из разных структур и форматов. В результате тестирования были выявлены и устранены ошибки, что позволило повысить надежность и точность работы скрипта.
Были разработаны и внедрены механизмы обработки ошибок, что позволило обеспечить устойчивость работы скрипта в случае возникновения непредвиденных ситуаций.
В заключительной части работы была проведена оценка производительности и эффективности разработанного скрипта. Результаты показали, что скрипт успешно справляется с задачами парсинга данных, обеспечивая высокую скорость обработки и точность извлечения информации. Благодаря внедрению данного решения, отдел закупок ООО «Торговый дом Токус» получил инструмент для автоматизации рутинных операций, что позволило значительно улучшить оперативность и качество работы.
Таким образом, все задачи, поставленные в начале работы, были успешно выполнены. Проведенные исследования и разработка скрипта для парсинга данных позволили не только автоматизировать процессы обработки информации в отделе закупок, но и создать основу для дальнейшего улучшения и расширения функциональности системы.

Нужна своя уникальная работа?
Срочная разработка под ваши требования
Рассчитать стоимость
ИЛИ

📕 Список литературы

1. Бердников, Иван. "Python для анализа данных: основы." Ленанд, 2019. - 224 с.
2. Введение в Requests - Текст: электронный // digitalocean.com: [сайт]. - URL: https://www.digitalocean.com/community/tutorials/how-to-get- started-with-the-requests-library-in-python-ru
3. Дронов, В.А. Программирование. — СПб.: БХВ-Петербург, 2006. — 706 с.: ил.
4. Кнут, Д.Э. Искусство программирования: учеб. пособие: в 3 т.: пер. с англ. Т. 1: Основные алгоритмы. - 3-е изд. - М. и др.: Вильямс, 2000. - 720 с.
5. Методы парсинга сайтов [Электронный ресурс]. — Режим доступа: http://seodrom.ru/parsing-saitov
6. Особенности HTML [Электронный ресурс]. — Режим доступа: http://lpgenerator.ru/blog/2013/10/21/chto-takoe-html-korotko-o-glavnom
7. Оценка трудозатрат - Текст: электронный // studwood.net: [сайт]. - URL:
https://studwood.net/1990257/informatika/otsenka_trudozatrat_razrabotki_novogo _programmnogo_obespecheniya_osnove_modeli_sosomo
8. Панфилов, К. По ту сторону веб-страницы. — М.: ДМК Пресс, 2008. — 440 с.: ил.
9. Парсинг [Электронный ресурс]. — Режим доступа: https://www.seonews.ru/glossary/parsing/ (дата обращения: 28.05.2019)
10. Парсинг данных с сайта [Электронный ресурс]. — Режим доступа: https://semantica.in/blog/chto-takoe-parsing.html (дата обращения: 10.06.2019)
11. Парсинг сайтов. Описание принципов [Электронный ресурс]. — Режим доступа: http://web2033.com/parsing-basis
12. Поляков, Андрей. "Программирование на Python 3: курс для начинающих." ДМК Пресс, 2019. - 320 с.
13. Типичная структура web-сайта - Текст: электронный // cyberleninka.ru: [сайт]. - URL: https://cyberleninka.ru/articleZn/aktualnost- sozdaniya-itipichnaya-struktura-web-sayta-kinoteatra/viewer (дата обращения: 01.05.2022)
14. Файл robots.txt - Текст: электронный // convertmonster.ru: [сайт]. -
URL: https://convertmonster.ruZblog/seo-blog/kak-sozdat-pravilnyj-fajl-robots-
txtnastroj ka-direktivy/
15. Чтение и запись текстовых файлов. StreamReader и StreamWriter
[Электронный ресурс]. — Режим доступа:
https://metanit.eom/sharp/tutorial/5.5.php (дата обращения: 06.06.19)..25

🖼 Скриншоты

🛒 Оформить заказ

Работу высылаем в течении 5 минут после оплаты.

©2026 Cервис помощи студентам в выполнении работ