Введение 3
Цели и задачи исследования 5
Классы рассматриваемых задач 5
Обзор литературы 6
Глава 1 . Определение объёма выборки на основании гипотезы, что две выборки подчиняются одному закону распределения 9
1.1. Постановка задачи 9
1.2. Способы выбора элементов для удаления 11
1.3. Дополнительные ограничения 12
Глава 2: Определение минимального объёма выборки 14
2.1. Нахождение минимального количества элементов 14
2.2. Алгоритм приближения по значениям в каждом из интервалов 16
2.3. Насыщенность выборки 18
2.4. Вычисления 19
2.5. Оценка алгоритма 24
2.6. Применение алгоритма для других классов задач 26
Выводы 27
Заключение 28
Список литературы 29
Приложения
В качестве введения стоит дать несколько основных определений, которые будут использоваться в дальнейшем.
Маркетинг - вид человеческой деятельности, направленной на удовлетворение нужд и потребностей посредством обмена
Маркетинговое исследование - это систематический поиск, сбор, анализ и представление данных и сведений, относящихся к конкретной рыночной ситуации, с которой пришлось столкнуться предприятию. [1]
Любое маркетинговое исследование преследует одну или несколько целей. В связи с этим можно подразделить их на несколько групп:
1. Поисковые цели — поиск информации, предназначенный для получения представления о структуре проблемы;
2. Описательные цели — описание интересующих событий и факторов, оказывающих на них влияние;
3. Каузальные цели — поиск ответа на вопрос: «есть ли некая причинно-следственная связь между событиями?»;
4. Тестовые цели — определение предположительных вариантов развития и оценка принятых решений;
5. Прогнозные цели — построение прогноза события.
По существу, цели исследования можно сформулировать с помощью пяти основных вопросов: «кто?», «что?», «когда?», «где?» и «как?» вместе с сопутствующим им вопросом «почему?», который связывает исследование с социологией и психологией.
Генеральная совокупность —вся изучаемая выборочным методом статистическая совокупность объектов и/или явлений обществ, жизни (единиц отбора), имеющих общие качественные признаки или количественные переменные. [2]
Выборка - это некоторое количество элементов, которое используется в наблюдении/эксперименте.
В силу того, что маркетинговое исследование предоставляет ценную и важную информацию для принятия решений предприятия о выпуске новой продукции или изменении характеристик уже существующей, оно должно обладать несколькими обязательными свойствами:
1. Репрезентативность выборки-свойство выборки, заключающееся в ее способности адекватно представлять состояние дел в генеральной совокупности.[2]Пример: В качестве опроса были выбраны все жители Санкт-Петербурга. Так как в Санкт-Петербурге процент женщин приблизительно равен 55%, а мужчин 45% по последней переписи населения, то, соответственно, такая же пропорция должна сохраниться и в исследовании.
2. Определение погрешности полученной информации. В силу того, что опросить каждого объекта (человека/клиента/покупателя),как правило, не представляется возможным, то в исследовании участвует лишь их часть. В некоторых случаях необходимо также оценивать достоверность полученных данных.
В маркетинговом исследовании, как и в любом другом бизнесе, есть затраты. К ним относятся время, затраченное на получение одной единицы информации (опроса одного человека), и денежное вознаграждение. Соответственно, чем больше данных необходимо получить для удовлетворения целей исследования, тем больше ресурсов необходимо затратить. Таким образом, определение объема выборки является одной из приоритетных задач маркетинговых исследований.
Общую задачу определения объёма выборки можно сформулировать как определение минимального необходимого количества данных в конкретном исследовании.
Далее будет сформулирована математическая постановка задачи.
В данной работе рассмотрены классы возможных задач, связанных с оптимизацией выборки. Также был разработан алгоритм для определения минимального объёма выборки при повторном исследовании. Алгоритм может быть применён как к численным, так и к качественным параметрам (хорошо/средне/плохо), что продемонстрировано на примерах из маркетингового исследования.
1. Котлер Ф., Армстронг Г., Сондерс Д., Вонг В. Основы марк етинга: Пер. с англ.2е Европ. Изд. М.; СПб.; К.: Издат. Дом "Вильямс", 2005: 502-512.
2. Сост. А.А. Грицанов, В.Л. Абушенко, Г.М. Евелькин, Г.Н. Соколова, О.В. Терещенко. Социология: Энциклопедия//Мн.: Книжный Дом, 2003.— 1312 с
3. Орлов Ю.Н., Шагов Д.О.Индикативные статистики для нестационарных временных рядов // Препринты ИПМим. М.В.Келдыша. 2011. № 53. 20 с
4. Орлов Ю.Н., Осминин К.П. Методы статистического анализа литературныхтекстов. // М.: Editorial URSS, Книжный дом «ЛИБРОКОМ», 2012.- 312 с.
5. Чичагов В. В. «Определение объема выборки, необходимого для построения асимптотических интервалов с использованием несмещенных оценок» //«Вестник» Пермского университета «Математика. Механика Информатика.» 2008 Вып. 4(20)
6. Бакаева О.А. Определение минимального объема
выборки//«Вестник» Мордовского университета 2010 №4 Серия
«физико-математические науки»
7. Мотренко А.П. «Оценка объема выборки в задачах прогнозирования»// ВКР Московский физико-технический институт. Москва 2014г.
8. Крамаренко Е.Ю. «Минимизация объема выборки в маркетинговых исследованиях»//СПбГУ 2014.
9. Орехов А.В. Рандомизированный алгоритм корректировки выборочных данных // ВЕСТНИК САНКТ-ПЕТЕРБУРГСКОГО УНИВЕРСИТЕТА. СЕРИЯ 10: ПРИКЛАДНАЯ МАТЕМАТИКА.
ИНФОРМАТИКА. ПРОЦЕССЫ УПРАВЛЕНИЯ. Издательство: Санкт - Петербургский государственный университет (Санкт-Петербург) ISSN: 1811-9905, 2015. 3. 96-104.
10. OndfejVilikus«Optimization of sample size and number of tasks per respondent in conjoint studies using simulated datasets»
11. SamanKhowaja,ShaziaGhufran& M. J. Ahsan «Multi-objective optimization for optimumallocation in multivariate stratified sampling withquadratic cost»//Journal of Statistical Computation and Simulation, 82:12, 1789-1798 14 Jul 2011
12. TimurKeskinturk, SebnemEr «A genetic algorithm approach to determine stratum boundaries andsample sizes of each stratum in stratified sampling»//Computational Statistics & Data Analysis 52 (2007) 53 - 67. Available online 18 April 2007
13. Christophe Corona,Jerome Lopez Saez , Markus Stoffel «Defining optimal sample size, sampling design and thresholds fordendrogeomorphic landslide reconstructions» //journalQuaternary Geochronology homepage:// www.elsevier.com/locate/quageo
14. Richard H. Byrd,Gillian M. Chiny,JorgeNocedal,YuchenWux «Sample Size Selection in Optimization Methods for Machine Learning»//January 16, 2012
15. Nicholas Facchiano, Ashley Kingman, Amanda Olore, David Zuniga «Sampling Strategies for Error RateEstimation and Quality Control»
16. John M. Castelloe «Sample Size Computations and Power Analysiswith the SASaSystem» SAS Institute Inc., Cary, NC
17. Barranco-ChamorroI., J.L. Moreno-Rebollo, M.D. Jim'enez- Gamero,M.V. Alba-Fern'andez«Estimation of the sample size n based on record values»//Mathematics and Computers in Simulation 118 (2015) 58¬72. Availableonline 6 January 2015
18. AndronovA ,Merkuryev Y. «Optimization of statistical sample sizes in simulation»// Journal of Statistical Planning and Inference 85 (2000) 93-102
19. Кендалл М., Стьюарт А. «Статистические выводы и связи» М.: Наука, 1973. С 595-604.
20. Кобзарь А.И. «Прикладная математическая статистика для инженеров и научных работников» Издание второе, исправленное. Москва «Физматлит» 2012г
21. Данные по маркетинговым исследованиям были взяты с сайта компании FDFGroup: http://www.fdfgroup.ru/?id=261