Тип работы:
Предмет:
Язык работы:


РАЗРАБОТКА ШЛЮЗА К CLICKHOUSE В СИСТЕМЕ ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ A/В-ТЕСТИРОВАНИЯ

Работа №185207

Тип работы

Бакалаврская работа

Предмет

информатика

Объем работы50
Год сдачи2022
Стоимость4290 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
20
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 4
1 ПРЕДМЕТНАЯ ОБЛАСТЬ 5
1.1 ОСНОВЫ A/B-ТЕСТИРОВАНИЯ 5
1.2 A/B-ТЕСТИРОВАНИЕ В ЯНДЕКСЕ 6
2 АНАЛИЗ ТРЕБОВАНИЙ 10
2.1 ФУНКЦИОНАЛЬНЫЕ ТРЕБОВАНИЯ 10
2.2 НЕФУНКЦИОНАЛЬНЫЕ ТРЕБОВАНИЯ 11
3 АНАЛИЗ ТЕКУЩЕГО РЕШЕНИЯ 12
3.1 СИСТЕМА ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ 12
3.2 ВОЗМОЖНОСТИ И НЕДОСТАТКИYT 13
4 АНАЛИЗ АЛЬТЕРНАТИВНЫХ РЕШЕНИЙ 15
4.1 ВЫБОР АЛЬТЕРНАТИВНОГО РЕШЕНИЯ 15
4.2 СРАВНЕНИЕ СУБД 17
4.3 СРАВНЕНИЕYT И CLICKHOUSE 22
5 ТЕХНОЛОГИЧЕСКИЙ СТЕК 24
5.1 PYTHON 24
5.1.1 Python-библиотека requests 24
5.1.2 Python-библиотека json 25
5.2 CLICKHOUSE 25
5.2.1 OLAP-сценарии работы 27
5.2.1 Формат выходных данных в ClickHouse 28
6 ПРОЕКТИРОВАНИЕ 31
6.1 CLICKHOUSE В ОКРУЖЕНИИ СИСТЕМЫ ОБРАБОТКИ РЕЗУЛЬТАТОВ
ЭКСПЕРИМЕНТОВ 31
6.2 СИСТЕМА ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ ДО ИЗМЕНЕНИЙ 32
6.3 СИСТЕМА ОБРАБОТКИ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТОВ ПОСЛЕ ИЗМЕНЕНИЙ . 33
6.4 ПАТТЕРН ШЛЮЗ 34
6.4 ШЛЮЗ К CLICKHOUSE 35
6.5 КОНСОЛЬНАЯ УТИЛИТА 37
ЗАКЛЮЧЕНИЕ 40
СПИСОК ИСПОЛЬЗОВАННЫХ ИСТОЧНИКОВ И ЛИТЕРАТУРЫ 41

Яндекс - это большая технологическая компания, широко известная в России и странах СНГ.
У компании Яндекс существует множество внешних продуктов, такие как поиск, Яндекс.Такси, Яндекс.Еда, Яндекс.Дзен и многие другие. Помимо внешних продуктов у компании есть ряд внутренних продуктов для собственного использования. В частности, у Яндекса есть собственные наработки в сфере A/B-тестирования.
Уже не первый год с помощью A/B-тестирования компания Яндекс улучшает собственные продукты. При этом сами инструменты A/B- тестирования постоянно развиваются внутри компании.
В данной работе будет описано очередное улучшение инструментов A/B-тестирования. Цель работы - разработать шлюз к ClickHouse в системе обработки результатов экспериментов A/B-тестирования.
В ходе работы будет выполнен анализ требований, составлена модель предметной области. Будет рассмотрена проблема, из-за которой потребовались изменения в системе, а также альтернативные способы решения данной проблемы.
В результате система обработки результатов экспериментов A/B- тестирования станет более гибкой в выборе источника данных. А также получит ряд функциональный возможностей, связанных с выбором в качестве источника данных ClickHouse, о чем будет описано в данной работе.


Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


В рамках данной работы был выполнен анализ требований, составлена модель предметной области. Были выявлены проблемы в текущем решение, рассмотрены способы решения описанных проблем. В качестве решения поставленных проблем была выбрана СУБД ClickHouse. На основе полученной модели предметной области был cпроектирован и реализован шлюз к ClickHouse. Все поставленные цели и задачи были достигнуты в соответствии со сформулированными требованиями.
В момент написания данной работы 4 проекта используют ClickHouse в своих расчетах, это 8% от общего числа проектов. При этом было добавлено 30 расчетов, написанных к ClickHouse, что составляет 15% от общего количества расчетов.
В результате можно сказать, что внедрение шлюза к ClickHouse было проведено успешно, а данная функциональность нашла своих пользователей.



1. Google Analytics Experiments [Электронный ресурс]: Google аналитика - URL:
https://developers.google.com/analytics/devguides/collection/analyticsjs/exp eriments?hl=ru (дата обращения: 20.05.2022).
2. MapReduce [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/MapReduce(дата обращения: 20.05.2022).
3. Apache Hadoop [Электронный ресурс]: Википедия - свободная
энциклопедия - URL: https://ru.wikipedia.org/wiki/Hadoop(дата
обращения: 20.05.2022).
4. Apache Spark [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/Apache_Spark(дата обращения: 20.05.2022).
5. Yandex Cloud [Электронный ресурс]: Официальный сайт Yandex Cloud
- URL: https://console.cloud.yandex.ru(дата обращения: 20.05.2022).
6. Redis [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/Redis(дата обращения: 20.05.2022).
7. ClickHouse [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/ClickHouse(дата обращения: 20.05.2022).
8. PostgreSQL [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/PostgreSQL(дата обращения: 20.05.2022).
9. MySQL [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/MySQL(дата обращения: 20.05.2022).
10. MongoDB [Электронный ресурс]: Википедия - свободная энциклопедия
- URL: https://ru.wikipedia.org/wiki/MongoDB(дата обращения: 20.05.2022).
11. Greenplum [Электронный ресурс]: Wikipedia, the free encyclopedia -
URL: https://en.wikipedia.org/wiki/Greenplum (дата обращения:
20.05.2022).
12. Типы данных PostgreSQL [Электронный ресурс]: Документация к PostgreSQL - URL: https://postgrespro.rU/docs/postgresql/9.6/datatype(дата обращения: 20.05.2022).
13. Тест производительности ClickHouse в сравнение с другими СУБД [Электронный ресурс]: Официальный сайт ClickHouse - URL: https://clickhouse.com/benchmark/dbms/#[100000000,[%22ClickHouse%22 ,%22MySQL%22,%22Greenplum%22,%22PostgreSQL%22],[%220%22]] (дата обращения: 20.05.2022).
14. Python [Электронный ресурс]: Википедия - свободная энциклопедия - URL: https://ru.wikipedia.org/wiki/Python(дата обращения: 20.05.2022).
15. C++ [Электронный ресурс]: Википедия - свободная энциклопедия -
URL: https://ru.wikipedia.org/wiki/C%2B%2B (дата обращения:
20.05.2022).
16. Requests [Электронный ресурс]: Wikipedia, the free encyclopedia - URL:
https://en.wikipedia.org/wiki/Requests_(software) (дата обращения:
20.05.2022).
17. Json в Python [Электронный ресурс]: Документация к Python -https://docs.python.org/3/library/json.html(дата обращения: 20.05.2022).
18. Что такое ClickHouse [Электронный ресурс]: Документация к ClickHouse - URL: https://clickhouse.com/docs/ru(дата обращения: 20.05.2022).
19. Форматы входных и выходных данных в ClickHouse [Электронный
ресурс]: Документация к ClickHouse - URL:
https://clickhouse.com/docs/en/interfaces/formats/ (дата обращения: 20.05.2022).
20. Паттерн шлюз [Электронный ресурс]: Сайт Мартина Фаулера - URL: https://martinfowler.com/articles/gateway-pattern.html(дата обращения: 20.05.2022).
21. Linux [Электронный ресурс]: Википедия - свободная энциклопедия -
URL: https://ru.wikipedia.org/wiki/Linux(дата обращения: 20.05.2022).


Работу высылаем на протяжении 30 минут после оплаты.




©2025 Cервис помощи студентам в выполнении работ