РЕФЕРАТ 3
Введение 7
Глава 1 9
1.1 Методы определения степени удовлетворенности потребителей 9
1.2 Особенности эмпирического описания социальных явлений 11
1.3 Основные понятия детерминационного анализа 13
1.4 Оценивание удовлетворенности качеством образовательных услуг избирателями Бакчарского района 14
1.5 Статистическое оценивание интенсивностей и емкостей с учетом
дополнительной информации 26
Глава 2 32
2.1 Понятие данных с пропусками 32
2.2 Оценивание вероятностей событий по данным с пропусками с учетом априорной информации 33
2.3 Иллюстрация влияния учета пропусков в оценивании вероятностей
путем имитационного моделирования 38
Заключение 44
Список литературы 45
Приложение А. Дополнение к главе 1 48
Приложение Б. Программная реализация вычисления формулы (24) 51
Приложение В. Моделирование 52
Приложение Г. Макрос - разбиение по ячейкам 55
В современном компьютеризированном мире сбор статистической информации присутствует во всех сферах человеческой деятельности. Развитие вычислительной техники позволяет хранить и обрабатывать гигантские массивы всевозможных данных, выявлять различные закономерности и зависимости, строить прогнозы и т.д. Задачи статистической обработки данных возникают в социологии, маркетинге, логистике, в банковской сфере и торговле, где поведение и реакции потребителя тщательно фиксируются и изучаются с целью выявления наиболее значимых факторов, влияющих на его решения. В маркетинге подобные массивы данных используются для выявления целевых сегментов, в банкинге - для проведения банковского скоринга, в социологии, политологии и в маркетинге важно уметь оценить степень удовлетворенности потребителя.
В представленной работе была рассмотрена методология детерминационного анализа социально-экономических данных,
предложенная С.В. Чесноковым [1] для оценивания степени удовлетворенности потребителей какой-либо услуги. Детерминационый анализ помогает выявить те аспекты, которые в большей степени влияют на удовлетворенность, так как он служит для поиска и объяснения взаимосвязей между признаками (переменными) на основе данных исследований, он также является одним из вариантов методов подсчета долей (экспериментальных условных частот), которые содержатся в таблицах, называемыми таблицами сопряженности.
Заметим, что нередко такие данные содержат пропущенные значения, притом в силу разных причин их количество может быть весьма значительным. Исследователи применяют различные методы для работы с пропусками, заполняя их или каким-то образом восстанавливая. Наличие пропусков и даже их восстановление в той или иной степени негативно влияет на результаты статистической обработки, а значит, приводит к ошибочным выводам и принятию неадекватных решений.
Обозначенную проблему частично позволяет решить привлечение некоторой дополнительной информации, которая может быть известна исследователю заранее в силу специфики эксперимента, особенностей исследуемой случайной величины, а также из некоторых дополнительных источников или из предыдущих экспериментов.
Существует ряд работ, в которых показано положительное влияние использования дополнительных сведений на качество статистических процедур [5-6].
В данной работе рассматривалась задача исследования влияния пропусков на точность статистического оценивания долей объектов. Численно и с помощью имитационного моделирования изучалось поведение среднеквадратической ошибки (СКО) оценок, показано, что с ростом доли пропусков точность оценивания существенно снижается.
Рассматриваемые методики апробировались на реальных данных.
В представленной работе исследованы подходы к оцениванию долей объектов с интересующими признаками по многомерной выборке с использованием различной дополнительной информации.
1) Рассматривалась методология детерминационного анализа с привлечением дополнительной информации о доле некоторого признака в генеральной совокупности. Было показано, что даже малозначимая на первый взгляд информация, приводила к улучшению качества оценивания. Представленная методика апробировалась на реальных данных о степени удовлетворенности качеством образовательных услуг избирателями Бакчарского района.
2) Для двумерной выборки оценки долей объектов строились при отсутствии и наличии пропусков в данных. Численно показано, что учет дополнительной информации о долях объектов с заданными признаками в двумерном массиве данных с пропуском в одном значении из пары позволяет улучшить качество статистического оценивания в смысле снижения среднеквадратической ошибки. С помощью имитационного моделирования сымитированы различные псевдореальные ситуации, которые позволили отследить влияние доли пропусков на поведение оценок вероятностей событий с использованием дополнительной информации и без нее.
1. Чесноков С.В. Детерминационный анализ социально-экономических данных. М.: Наука, Главная редакция физико-математической литературы , 1982. - 168с.
2. Зенкова Н.А. Об оценке удовлетворенности качеством образования населения/ Материалы III Всероссийской молодежной конференции «Математическое и программное обеспечение информационных, технических и экономических систем», Томск, 22-23 мая 2015. Томск: Издательский Дом Томского государственного университета, 2015. С. 66-68
3. Дмитриев Ю.Г., Курицина С.В. Об использовании дополнительной информации в статистическом оценивании параметров детерминационного анализа // Вестник ТГУ. УВТиИ. 2012. №3(20) С. 42-49.
4. Котлер Ф. Основы маркетинга. Краткий курс.: Пер. с англ. - М.: Прогресс, 1991. - 475 с.
5. Martynova S.E., Maslennikova O.G. The "Servese" Model of the
Competences of the Municipal Employee as the Basis of Vocational training: Russian Experience// Procedia - Social and Behavioral Sciences (2014)
6. Purcarea V.L., Gheorghe I. R., Petrescu C.M. The Assessment of Perceived Service Quality of Public Health Care Services in Romania Using the SERVQUAL Scale// Procedia Economics and Finance 6 ( 2013 ) 573 - 585
7. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики. - М.: Наука, 1965
8. Кобзарь А.И. Прикладная математическая статистика. Для инженеров и научных работников. - М.: ФИЗМАТЛИТ, 2006. - 816с.
9. Литтл Р.Дж.А., Рубин Д.Б. Статистический анализ данных с пропусками. - М.: Финансы и статистика, 1990.
10. Дмитриев Ю.Г. Об оценках вероятностей при наличии данных с пропусками // Вестник ТГУ. УВТиИ. 2012. №3(20) С.50-54.
11. Загоруйко Н.Г. Прикладные методы анализа данных и знаний. - Новосибирск: Изд-во ин-та математики, 1999.
12. Загоруйко Н.Г., Елкина В.Н., Тимеркаев В.С. Алгоритм заполнения пропусков в эмпирических таблицах (алгоритм Zet) // Эмпирическое предсказание и распознавание образов. - Новосибирск, 1975. - Вып. 61: Вычислительные системы. - С. 3-27.
13. Россиев А.А. Моделирование данных при помощи кривых для восстановления пробелов в таблицах. Методы нейроинформатики / Под. ред.
A. Н. Горбаня. - Красноярск: КГТУ, 1998.
14. Дмитриев Ю.Г., Кошевая Т.О. Комбинированные оценки доли // Информационные технологии и математическое моделирование (ИТММ- 2015): Материалы XIV Международной конференции им. А. Ф. Терпугова (18-22 ноября 2015). Томск: Изд-во Том. ун-та, 2015. Часть 1. С. 50-55
15. Dmitriev Yu.G., Martynova S. E., Ustinov I. K. On validity of quantitative estimation of satisfaction of the society with quality of public services: the case of municipal formations of Russia //The Third International conference on development of sociology and demography in Eurasia. Vienna, 2015. P. 19-26.
..21