Введение
Актуальность
Постановка задачи
Обзор литературы
Глава 1. Формирование и обработка данных
1.1 Формирование выборки
1.2 Обработка данных
Глава 2. Регрессионный анализ
2.1 Выбор зависимого фактора
2.2 Методология построения моделей
2.3 Построение и верификация регрессионных моделей ............................ 17
2.3.1 Реализация первого подхода
2.3.2 Реализация второго подхода
2.3.3 Анализ на наличие выбросов
2.3.4 Построение и верификация модели по результатам пункта 2.3.3 ... 46
2.3.5 Еще один подход к построению модели
2.4 Интерпретация моделей
2.5 Результаты моделирования
2.5.1 Модель 1.1
2.5.2 Модель 2.3
Глава 3. Кластеризация
3.1 Результаты кластеризации
3.2 Сравнение показателей Российской Федерации.................................. 64
Выводы
Заключение
Список литературы
Приложение..
На сегодняшний день на планете существует более 200 государств и зависимых территорий [1]. Они расположены в различных частях света, одни
– размером с небольшой город, другие занимают огромные площади, но, несмотря на все различия, большая часть имеет широкие торгово-финансовые взаимосвязи [2]. Изучение национальных экономик государств является важной и неотъемлемой частью современного мира. Ученые стараются выявить зависимости и закономерности, которые не только помогают лучше понять и оценить ситуацию, но и предоставляют возможность выработать решения для достижения важных целей [3].
Социально-экономическое состояние страны характеризуется многими факторами, начиная от общего капитала государства, заканчивая состоянием окружающей среды и тем, как граждане этих государств проводят свой досуг.
Сегодня такого рода информация собирается различными организациями практически по всему миру [4, 5]. Международная статистика позволяет сравнивать государства по многим критериям. Она помогает определить страны-ориентиры, страны схожего уровня развития и, в общем, представить то, как живет население Земного шара в его различных частях.
В современном обществе статистика и статистические данные играют крайне важную роль. С одной стороны, лица, принимающие решения на различных уровнях власти и в бизнесе, нуждаются в описательной информации в виде числовых данных. С другой стороны, общественность и средства массовой информации используют ее для отражения современной картины мира и сложившейся ситуации внутри отдельных регионов [6].
Аналитическая статистика в совокупности с макроэкономическим анализом могут ответить на многие вопросы. В частности, движется ли общество в заявленном политиками социально-экономическом курсе?
Увеличился или уменьшился уровень безработицы, а также каковы ее причины? Повысился ли объем выброса СО2 в сравнении с показателем десятилетней давности? Насколько экономика страны эффективна по отношению к странам-соседям?
Актуальность
На сегодняшний день собрано огромное количество статистических данных по различным сферам жизнедеятельности. Однако большая часть этой информации отражает лишь частную сторону жизни и не позволяет ответить на вопрос о качестве жизни населения в целом. Данный вопрос стал особенно
интересен в последние годы ввиду сложных экономической и политической ситуаций во многих странах.
Начиная с 2009 года, Евростат [7] принимает активное участие в развитии данной тематики, разрабатывая новые подходы к оценке прогресса общества и его благосостояния [6]. Этот вопрос обсуждался на заседании ООН в 2012 году [8]. Также большой вклад в развитие области внесли различные международные организации, в частности OECD (The Organisation for Economic Co-operation and Development) и Gallup [5, 9]. Ежегодно публикуются отчеты, отражающие реальное положение дел во всем мире или внутри отдельных государств [5]. В некоторых из них дается оценка схожим показателям, например, уровню счастья [6] или уровню благосостояния населения.
В ряде случаев подобного рода показатели формируются, исходя из проводимых опросов. Но возможно ли провести оценку, опираясь только на данные, находящиеся в открытом доступе?
Главной целью нынешней работы является разработка подхода к оценке качества жизни населения на основе социально-экономических показателей, находящихся в открытом доступе. Такого рода задача
продиктована стремлением получить агрегированный показатель прогресса общества без проведения дополнительных социологических опросов.
Предложенный подход основан на построении многофакторной регрессионной модели методом последовательного включения факторов в условиях неполноты данных. Стоит отметить, что при формировании модели использованы как объективные (статистическая информация), так и субъективные (основанные на опросах) показатели.
Также в текущей работе предложен метод обработки социально-экономических данных, который заключается в анализе значимости показателей не только с математической, но и с содержательной точки
зрения. По его итогам сформировано три набора данных, используемых в дальнейшем исследовании.
Результатом применения описанного в текущей работе подхода оценки качества жизни является формирование восьми регрессионных моделей. На их основе было выявлено, что качество жизни населения в большей степени зависит от таких показателей, как ВВП на душу населения, уровень безработицы, уровень моральных свобод в обществе, уровень смертности, средняя длительность обучения, стоимость здравоохранения и ожидаемая продолжительность жизни. Вариативность набора факторов в модели обуславливается важностью того, какой именно список стран был использован при ее формировании, ввиду сильного разброса в значениях показателей различных государств. Практическое различие представленных уравнений выявлено на стадии моделирования. Ввиду того, что в первое из них непосредственно включается показатель ВВП на душу населения, наблюдается искажение модельных значений. Так, маленькие государства с небольшим населением, имеющие, возможно, множественные источники какого-либо ценного ресурса, характеризуются крайне высоким (аномальным относительно крупных государств с большой численностью населения) показателем ВВП (например, Либерия или Катар). Это, в свою очередь, значительно повышает оценку качества жизни, однако, полученный результат не отражает реального положения дел в таких государствах. Таким образом, первую модель следует применять на выборках, содержащих, преимущественно крупные государства.
Вторая модель исключает подобного рода зависимость и может быть использована на выборках больших размеров, а также по отношению к небольшим государствам.
Таким образом, сформированы две модели оценки качества жизни, каждая из которых имеет свою область применения.
Помимо этого, в работе проведен анализ, направленный на описание реальной социально-экономической картины мира, и выявление положения Российской Федерации в общемировом рейтинге. Данная часть работы
основана на кластерном анализе с помощью самоорганизующейся карты Кохонена. По ее итогам сформировано три группы государств: наиболее развитые, среднего уровня развития и наименее развитые. Российская Федерация была отнесена ко второй из них. Сравнением показателей нашего государства относительно усредненных показателей ведущей группы, были выявлены сферы жизнедеятельности, по которым наблюдается отставание: досуг и общение, окружающая среда и жилищные условия, качество жизни и общие макроэкономические показатели.
Таким образом, предложенная в данной работе методика позволяет оценить понятие качества жизни на основе общедоступных индексов и показателей. Все выявленные по результатам исследования зависимости и закономерности не противоречат общей логике происходящих в мире социально-экономических процессов
1. A world countries list on Nations Online.
http://www.nationsonline.org/oneworld/countries_of_the_world.htm
2. Абель Э., Бернанке Б. Макроэкономика. Изд. 5-е. СПб.: Питер, 2008.
768 с.
3. Курс экономической теории: Общие основы экономической теории.
Микроэкономика. Макроэкономика. Основы национальной
экономики. / Под ред. Сидоровича А. В. Изд. 2-е. М.: Изд. «Дело и
Сервис», 2001. 832 с.
4. World Bank Group website. http://www.worldbank.org/
5. OECD website. http://www.oecd.org/
6. Quality of life indicators on Eurostat.
http://ec.europa.eu/eurostat/statisticsexplained/index.php/Quality_of_life_indicators_-
_measuring_quality_of_life
7. Eurostat website. http://ec.europa.eu/eurostat
8. World happiness report main web page. http://worldhappiness.report/
9. Gallup. Inc. website. http://www.gallup.com/home.aspx
10.Report by the commission on the measurement of economic performance
and social progress.
http://ec.europa.eu/eurostat/documents/118025/118123/Fitoussi+Commi
ssion+report/7bac2480-4658-439f-b022-e6542ebf714e
11.“Measuring progress, well-being and sustainable development” leaflet.
http://ec.europa.eu/eurostat/documents/7330775/7339383/MeasuringProgress-Well-being-sustainable-development/ef61b63c-02f0-4aa6-8155-
42fdc083301871
12.Happiness report 2016. http://worldhappiness.report/download/
13.Ura K., Alkire S., Zangmo T. An extensive analysis of GNH index. Thimphu:
The Centre for Bhutan Studies, 2012. 217 p.
14.Смолева Е. О., Морев М. В. Удовлетворенность жизнью и уровень
счастья: взгляд социолога. Вологда: ИСЭРТ РАН, 2016. 164 с.
15.OECD Guidelines on measuring subjective well-being. OECD Publishing.
http://www.oecd-ilibrary.org/economics/oecd-guidelines-on-measuringsubjective-well-being_9789264191655-en
16.5th OECD World forum on statistics, knowledge and policy. Summary report.
http://www.oecd.org/statistics/5WF%20Summary%20Report.pdf
17.Happy planet index 2016. Methods paper.
https://static1.squarespace.com/static/5735c421e321402778ee0ce9/t/578
cc52b2994ca114a67d81c/1468843308642/Methods+paper_2016.pdf
18.Chaddock R. E. Principles and methods of statistics. Ed. 1. Boston:
Houghton Mifflin Co., 1925. 471 p.
19.Quality of life index on The economist intelligence unit's.
https://www.economist.com/media/pdf/QUALITY_OF_LIFE.pdf
20.White A. A global projection of subjective well-being: A challenge to
positive psychology // Psychtalk. 2007. P. 17-20.
21.Working guidebook to the National Footprint accounts.
http://www.footprintnetwork.org/content/documents/National_Footprint
_Accounts_2016_Guidebook.pdf
22.Tracking global happiness report 2013.
https://www.ipsos.com/sites/default/files/Tracking_Global_Happiness-
2013.pdf
23.Эконометрика / Елисеева И. И., Курышева С. В., Костеева Т. В.,
Михайлов Б. А. и др.; под ред. Елисеева И. И. М.: Финансы и статистика,
2003. 344 с.72
24.Магнус Я. Р., Катышев П. К., Пересецкий А. А. Эконометрика.
Начальный курс. Изд. 6-е. М.: Дело, 2004. 576 с.
25.R manual. https://cran.r-project.org/manuals.html
26.Буре В. М., Евсеев Е. А. Основы эконометрики. СПб.: СПбГУ, 2004.
27.Кобзарь А. И. Прикладная математическая статистика. Для инженеров
и научных работников. М.: ФИЗМАТЛИТ, 2006. 816 с.
28.Айвазян С. А., Енюков И. С., Мешалкин Л. Д. Прикладная статистика.
Основы моделирования и первичная обработка данных. М.: Финансы и
статистика, 1983. 471 с.
29.Буре В.М., Парилина Е.М., Седаков А.А., Шевкопляс Е.В. Прикладная
статистика в R, STATISTICA и Excel. Описательная статистика.
Оценивание параметров. Статистические критерии. СПб.: СПбГУ, 2011.
104 с.
30.Lilliefors H. On the Kolmogorov-Smirnov test for normality with mean and
variance unknown // Journal of the American Statistical Association. 1967.
Vol. 62, No. 318. P. 309-402.
31.Breusch T. S., Pagan A. R. A simple test for heteroscedasticity and random
coefficient variation // Econometrica. 1979. Vol. 47, No. 5. P. 1287-1294
32.Куфель Т. Эконометрика. Решение задач с применением пакета
программ GRETL. М.: Горячая линия – телеком, 2007. 200 с.
33.Eyduran E., Ozdemir T., Alarslan E. Importance of diagnostics in multiple
regression analysis // Journal of Applied Sciences. 2005. No. 5, P. 1792-
1796.
34.Practical regression and ANOVA using R by Faraway J. https://cran.rproject.org/doc/contrib/Faraway-PRA.pdf
35.Regression diagnostics on Tropej.
http://www.oxfordjournals.org/our_journals/tropej/online/ma_chap1.pdf73
36.Armstrong R. When to use the Bonferroni correction // Ophthalmic &
Physiological Optics. 2014. Vol. 34. С. 502-508.
37.Razali N., Yap. B. W. Power comparisons of Shapiro-Wilk, KolmogorovSmirnov, Lilliefors and Anderson-Darling tests // Journal of Statistical
Modeling and Analysis. 2011. Vol. 2, No. 1. P. 21-33.
38.Yap B. W., Sim C. H. Comparisons of various types of normality tests //
Journal of Statistical Computation and Simulation. 2011. Vol. 81, No. 12. P.
2141-2155.
39.Айвазян С. А., Бухштабер В. М., Енюков И. С., Мешалкин Л. Д.
Прикладная статистика: классификация и снижение размерности. М.:
Финансы и статистика, 1989. 607 с.
40.Мандель И. Д. Кластерный анализ. М.: Финансы и статистика, 1988.
176 с.
41.Kohonen T. The self-organizing map // Proceedings of the IEEE. 1990.
Vol. 78, No. 9. P. 1464-1480.
42.Ballabio D., Vasighi M. A MATLAB toolbox for self-organizing maps and
supervised neural network learning strategies // Chemometrics and
Intelligent Laboratory Systems. 2012. No. 118. С. 24-32.
43.MATLAB documentation. https://www.mathworks.com/help/