Тип работы:
Предмет:
Язык работы:


Анализ базы данных траекторий автомобилей

Работа №74895

Тип работы

Дипломные работы, ВКР

Предмет

информатика

Объем работы34
Год сдачи2016
Стоимость4760 руб.
ПУБЛИКУЕТСЯ ВПЕРВЫЕ
Просмотрено
28
Не подходит работа?

Узнай цену на написание


ВВЕДЕНИЕ 5
1. ОБЗОР ЛИТЕРАТУРЫ 7
2. ОПИСАНИЕ ИСХОДНЫХ ДАННЫХ 10
2.1. ФОРМАТ ДАННЫХ 10
2.2. ВЫДЕЛЕНИЕ ТРАЕКТОРИЙ 11
2.3. ИСПОЛЬЗОВАНИЕ MAPREDUCE 13
3. МОДЕЛЬ НА ГРАФАХ 15
3.1. ПОСТРОЕНИЕ ГРАФА ВЕРОЯТНОСТЕЙ 15
3.2. ПОСТРОЕНИЕ ВЕРОЯТНОЙ ТРАЕКТОРИИ 16
3.3. ОПРЕДЕЛЕНИЕ ПРЕДПОЧТЕНИЙ 16
4. ОПРЕДЕЛЕНИЕ МЕСТ ДЛЯ ЗАПРАВОК 19
4.1. ПОСТРОЕНИЕ ОБОБЩАЮЩЕГО ГРАФА 19
4.2. КЛАССИФИКАЦИЯ 20
4.2.1. СЛУЧАЙНЫЙ ЛЕС 21
4.2.2. МЕТОД K БЛИЖАЙШИХ СОСЕДЕЙ 23
4.2.3. ЛОГИСТИЧЕСКАЯ РЕГРЕССИЯ 24
4.2.4. МЕТОД ОПОРНЫХ ВЕКТОРОВ 26
4.3. АНАЛИЗ РЕЗУЛЬТАТОВ 28
ЗАКЛЮЧЕНИЕ 32
Список литературы


В настоящее время определить целевую аудиторию и выявить причины экономических предпочтений покупателей не так сложно. Количество людей, осознанно или случайно пополняющих Интернет данными, постоянно растет. Существует огромный объем, анализируя которые можно многое узнать о пользователях – где они работают, что
предпочитают, какие товары их интересуют, узнать в целом о человеческом поведении.
В данной дипломной работе была поставлена цель - определить экономические предпочтения автомобилистов Москвы на примере заправок. Была выдана база данных с gps координатами траекторий водителей, а также некоторыми показателями вождения.
Для достижения цели были поставлены следующие задачи:
1. Для каждой заправки определить траекторию движения автомобиля, которая с большой вероятностью гарантирует, что этой заправкой воспользуются.
2. Разработать алгоритм, позволяющий для произвольной траектории движения определять подходящие заправки.
3. Построить модель определяющую наилучшие места для установки
новых заправок.
Не существует единого алгоритма, который бы смог по любым данным классифицировать объекты, предсказывать поведение и решать
5другие задачи области анализа данных. Часто то, что нужно анализировать представлено в виде на первый взгляд не пригодном для анализа. В таких случаях необходимо провести дополнительную обработку
данных, которая может оказаться не менее сложной задачей. Особенностью работы стало то, что необходимо было анализировать траектории
для определения экономических предпочтений. Для решения этой задачи была построена модель на графах.
Разработка велась на языке Python, база данных MS SQL.

Возникли сложности?

Нужна помощь преподавателя?

Помощь в написании работ!


Данная работа посвящена выявлению экономических предпочтений
автомобилистов, в частности выявление предпочитаемых ими заправок.
Для ее реализации были выданы не обычные для подобной задачи данные: не было ни информации о марке автомобиле, никакой информации
об автомобилистах, только траектории движения и оценки вождения
за некоторый промежуток времени. Получилась задача Data Mining об
обнаружении в данных ранее неизвестных знаний.
В результате работы была придумана модель в виде графа, позволяющая представлять траектории движения в формате удобном для
дальнейшего анализа. Это структура, которая сохраняет координаты
“важных” (вероятных) в движении точек, их связь и вероятность перемещения из одной точки в другую.
Такая модель позволила для каждой заправки определить траекторию движения автомобиля, которая с большой вероятностью гарантирует, что этой заправкой воспользуются. Кроме того, основываясь
на полученных графах можно определять траектории движения для
произвольных траекторий движения автомобилистов в Москве.
Проанализировав имеющиеся данные, был построен классификатор,
способный определять наилучшие места для установки новых заправок.


[1] National Highway Traffic Safety Administration (NHTSA). The Impact of Driver Inattention on Near-Crash/Crash Risk: An Analysis Using the 100 Car Naturalistic Driving Study Data. U.S. department of transportation, 2006.
[2] D. Douglas and T. Peucker. Algorithms for the reduction of the number of points required to represent a digitized line or its caricature. 1973.
[3] Han J. Lee, J.-G. and K.-Y. Whang. Trajectory clustering: a partition- andgroup framework. 2007.
[4] Diansheng Guo. A graph-based approach to vehicle trajectory analysis. 2010.
[5] Weibel R. Dodge, S. and E. Forootan. Revealing the physics of movement: comparing the similarity of movement characteristics of different types of moving objects. 2009.
[6] et al. Tiakas, E. Searching for similar trajectories in spatial networks. 2009.
[7] K Fukunaga. A branch and bound algorithm for computing k-nearest neighbors. 1975.
[8] M. Wiener A. Liaw. Classification and regression by RandomForest.
2002.
[9] S Lemeshow DW Hosmer Jr. Applied logistic regression. 2004.
[10] Jeffrey Dean and Sanjay Ghemawat. MapReduce: Simplified Data Processing on Large Clusters. 2004.
[11] C. Cortes and V. Vapnik. Support Vector Machine. 1995.
[12] Goadrich M. Davis J. The Relationship Between Precision-Recall and ROC Curves. 2006.
[13] Воронцов К.В. Coursera. Введение в машинное обучение. Алго¬ритм построения решающего дерева. 2016.
[14] Воронцов К.В. Coursera. Введение в машинное обучение, Бэггинг и случайный лес. 2016.
[15] Тоби Сегаран. Программируем коллективный разум. 2008.
[16] Халафян А.А. Статистический анализ данных. 3-е издание. 2007.
[17] Google Places API. https://developers.google.com/places/1hMru.
[18] KNN. http://www.machinelearning.ru/wiki/index.php?title=knn.
[19] Логистическая регрессия. http://www.machinelearning.ru/wiki/ index.php?title=Логистическая_регрессия.
[20] Основы анализа данных на python с использованием pandas и sklearn. https://habrahabr.ru/post/202090/.


Работу высылаем на протяжении 30 минут после оплаты.



Подобные работы


©2025 Cервис помощи студентам в выполнении работ