Эконометрическое моделирование стоимости квартир в Московской области, вариант  -  упражнение  - Эконометрика (2), Упражнения из Эконометрика. Modern Institute of Managament
wklev85
wklev8525 March 2013

Эконометрическое моделирование стоимости квартир в Московской области, вариант - упражнение - Эконометрика (2), Упражнения из Эконометрика. Modern Institute of Managament

PDF (262.1 KB)
29 страница
662количество посещений
Описание
Задачи, тесты и упражнения по предмету Эконометрика. Тема Эконометрическое моделирование стоимости квартир в Московской области. Задачи и решения. Упражнения с ответами. Лабораторная работа. Разные варианты. Вариант 2.
20очки
пункты необходимо загрузить
этот документ
скачать документ
предварительный показ3 страница / 29
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
Эконометрическое моделирование стоимости квартир в Московской области, вариант 2 - контрольная работа - Эконометрика

Министерство образования и науки РФ

Федеральное агентство по образованию ГОУ ВПО

Всероссийский заочный финансово – экономический институт

Кафедра экономической теории

Контрольная работа

по эконометрике

тема:

«Эконометрическое моделирование стоимости квартир

в Московской области, вариант 2»

Уфа - 2008

3

Задание № 1. Эконометрическое моделирование стоимости

квартир в Московской области.

Наименование показателей и исходных данных для эконометрического

моделирования представлены в таблице:

№ п.п. Цена квартиры, тыс.долл.

(Y)

Город области, 1 – Подольск, 0

– Люберцы (Х1)

Число комнат в квартире

(Х2)

Жилая площадь квартиры, кв. м

(Х4)

1 38 1 1 19 2 62,2 1 2 36 3 125 0 3 41 4 61,1 1 2 34,8 5 67 0 1 18,7 6 93 0 2 27,7 7 118 1 3 59 8 132 0 3 44 9 92,5 0 3 56

10 105 1 4 47 11 42 1 1 18 12 125 1 3 44 13 170 0 4 56 14 38 0 1 16 15 130,5 0 4 66 16 85 0 2 34 17 98 0 4 43 18 128 0 4 59,2 19 85 0 3 50 20 160 1 3 42 21 60 0 1 20 22 41 1 1 14 23 90 1 4 47 24 83 0 4 49,5 25 45 0 1 18,9 26 39 0 1 18 27 86,9 0 3 58,7 28 40 0 1 22 29 80 0 2 40 30 227 0 4 91 31 235 0 4 90 32 40 1 1 15 33 67 1 1 18,5 34 123 1 4 55 35 100 0 3 37 36 105 1 3 48 37 70,3 1 2 34,8 38 82 1 3 48 39 280 1 4 85 40 200 1 4 60

4

Требуется:

1. Рассчитать матрицу парных коэффициентов корреляции; оценить

статистическую значимость коэффициентов корреляции.

2. Построить поле корреляции результативного признака и наиболее

тесно связанного с ним фактора.

3. Рассчитать параметры линейных парных регрессий для всех факторов

Х.

4. Оценить качество каждой модели через коэффициент детерминации,

среднюю ошибку аппроксимации и F – критерия Фишера. Выбрать

лучшую модель.

5. С использованием лучшей модели осуществить прогнозирование

среднего значения показателя Y при уровне значимости α = 0,1, если

прогнозное значение фактора Х составит 80% от его максимального

значения. Представить графически и модельные значения Y,

результаты прогнозирования.

6. Используя пошаговую множественную регрессию (метод исключения

или метод включения), построить модель формирования цены

квартиры за счет значимых факторов. Дать экономическую

интерпретацию коэффициентов модели регрессии.

7. Оценить качество модели. Улучшилось ли качество модели по

сравнению с однофакторной моделью? Дать оценку влияния

значимых факторов на результат с помощью коэффициента

эластичности, β- и ∆-коэффициентов.

Решение:

1. Рассчитаем матрицу парных коэффициентов корреляции и оценим

статистическую значимость коэффициентов корреляции.

5

Используем Excel: для этого в меню сервис выберем анализ данных /

корреляция. Получим матрицу коэффициентов парной корреляции между

всеми имеющимися переменными:

Y Х1 Х2 Х4 Y 1 Х1 -0,01126 1 Х2 0,751061 -0,0341 1 Х4 0,874012 -0,0798 0,868524 1

Проанализируем коэффициенты корреляции между результирующим

признаком Y и каждым из факторов Хj: зависимая переменная, стоимость

квартиры имеет тесную связь с фактором, характеризующим жилую площадь

r(Y, X4)=0,874 >0,7 и с числом комнат r(Y, X2)=0,751. С фактором,

характеризующим город области зависимая переменная – стоимость

квартиры имеет обратную корреляционную зависимость (цена на квартиры

выше в Люберцах) |r(Y, X1)| = - 0,01 .

Для проверки значимости найденных коэффициентов корреляции

используем критерий Стьюдента.

Для каждого коэффициента r(Y, Xj) вычислим t-статистику по формуле

t = 2 2

1

)2(

r

nr

− −

и занесем результаты расчетов в корреляционную таблицу:

Y Х1 Х2 Х4 t-статистики Y 1 Х1 -0,0112 1 0,069411185 Х2 0,75106 -0,0341 1 7,012446419 Х4 0,87401 -0,0798 0,86852 1 11,08813705

По таблице критических точек распределения Стьюдента при уровне

значимости α = 5% и числе степеней свободы k = n – 2= 38 определим

критическое значение с помощью функции СТЬЮДРАСПОБР tкр = 2,02.

Сопоставим фактическое значение t с критическим tкр.

t(r(Y, X1)) = 0,07 < tкр = 2,02, следовательно коэффициент r(Y, X1) не

является значимым. На основании выборочных данных нет оснований

6

утверждать, что зависимость между ценой квартиры Y и городом области Х1

существует.

t(r(Y, X2)) = 7,01 > tкр = 2,02, следовательно коэффициент r(Y, X2)

значимо отличается от нуля. На уровне значимости 5% выборочные данные

позволяют сделать вывод о наличии линейной корреляционной зависимости

между признаками Y и Х2.

t(r(Y, X4)) = 11,09 > tкр = 2,02, следовательно коэффициент r(Y, X4)

значимо отличается от нуля. На уровне значимости 5% выборочные данные

позволяют сделать вывод о наличии линейной корреляционной зависимости

между признаками Y и Х4.

Таким образом, наиболее тесная и значимая зависимость наблюдается

между ценой квартиры Y и жилой площадью квартиры Х4.

2. Построим поле корреляции результативного признака и наиболее

тесно связанного с ним фактора.

Для построения поля корреляции используем Мастер диаграмм

(точечная) – покажем исходные данные Y и значение наиболее

информативного фактора Х4. В результате получим диаграмму «поле

корреляции»:

7

Поле корреляции

0

50

100

150

200

250

300

0 20 40 60 80 100

жилая площадь, кв.м, Х4

ц е н а

к в а р т и р ы

, т ы с

.д о л л

. Y Исходные данные

3. Рассчитать параметры линейных парных регрессий для всех

факторов Х.

Для построения парной линейной модели Yt = a+b*X1. используем

функцию РЕГРЕССИЯ пакета Анализа данных. В качестве входного

интервала Х покажем значение фактора Х1.

Результаты вычислений представлены в таблицах:

ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,011259 R-квадрат 0,000127 Нормированный R- квадрат -0,02619 Стандартная ошибка 58,03646 Наблюдения 40

Дисперсионный анализ df SS MS F Значимость F

Регрессия 1 16,22784 16,22784 0,004818 0,945026 Остаток 38 127992,8 3368,231 Итого 39 128009

Коэффи

циенты Стандар

тная t-

статист

P- Значение

Нижние 95%

Верхние 95%

8

ошибка ика Y- пересечение 101,8136 12,37341 8,228419 5,73E-10 76,76497 126,8623 Х1 -1,2803 18,4452 -0,06941 0,945026 -38,6207 36,06005

Коэффициенты модели содержатся в третьей таблице итогов

Регрессии.

Таким образом, уравнение модели с фактором X1 имеете вид:

YТ = 101,81 – 1,28*X1 (1)

Коэффициент регрессии b = –1,28, следовательно, цена реализации

квартиры в Подольске в среднем на 1,28 тыс. долл. ниже цены реализации в

Люберцах. Свободный член a = 101,81 не имеет реального смысла.

Аналогичные расчеты проведем для построения модели зависимости

цены реализации Y от числа комнат в квартире Х2:

Регрессионная статистика Множественный R 0,751061

R-квадрат 0,564092

Нормированный R- квадрат 0,552621

Стандартная ошибка 38,32002

Наблюдения 40

Дисперсионный анализ

df SS MS F Значимость

F Регрессия 1 72208,88 72208,88 49,1744 2,37E-08 Остаток 38 55800,11 1468,424 Итого 39 128009

Коэффициенты

Станд

артная ошибка

t- статис

тика P-

Значение Нижние

95% Верхние

95% Y- пересечение 7,539299

14,671 25 0,513882 0,61031 -22,1611 37,23969

Х2 36,03777 5,1391

15 7,012446 2,37E-08 25,63418 46,44136

Модель с фактором X2 построена, ее уравнение имеет вид:

YТ = 7,54 + 36,04*X2 (2)

9

Коэффициент регрессии b = 36,04, следовательно, при увеличении на 1

комнату в квартире в среднем на 36,04 тыс. долл. увеличивается цена

квартиры. Свободный член a = 7,54 не имеет реального смысла.

Также построим модель зависимости цены квартиры Y от жилой

площади квартиры Х4.

Регрессионная статистика Множественный R 0,874012

R-квадрат 0,763897

Нормированный R- квадрат 0,757684

Стандартная ошибка 28,20195

Наблюдения 40

Дисперсионный анализ df SS MS F Значимость F

Регрессия 1 97785,7 97785,7 122,9468 1,79E-13 Остаток 38 30223,29 795,3498 Итого 39 128009

Коэффициенты Стандарт

ная ошибка

t- статис

тика P-

Значение Нижние

95% Верхние

95% Y- пересечение -2,86485 10,39375 -0,27563 0,784324 -23,9059 18,17619 Х4 2,475975 0,223299 11,08814 1,79E-13 2,023929 2,928021

Модель с фактором X4 построена, ее уравнение имеет вид:

YТ = – 2,86 + 2,48*X4 (3)

Коэффициент регрессии b = 2,48, следовательно при увеличении жилой

площади квартиры на 1 кв. м в среднем на 2,48 тыс. долл. увеличивается цена

квартиры. Свободный член a = –2,86 не имеет реального смысла.

4. Оценим качество каждой модели через коэффициент детерминации,

среднюю ошибку аппроксимации и F – критерия Фишера.

Для удобства все результаты будем заносить в сводную таблицу.

Коэффициенты детерминации R-квадрат определены для каждой

модели функцией РЕГРЕССИЯ и составляют:

Модель R-квадрат

YТ = 101,81 – 1,28*X1 (1) 0,000127

10

YТ = 7,54 + 36,04*X2 (2) 0,564092

YТ = – 2,86 + 2,48*X4 (3) 0,763897

Таким образом, вариация цены квартиры Y на 0,01% объясняется по

уравнению (1) изменением города области Х1; на 56,41% по уравнению (2)

вариацией числа комнат в квартире Х2; на 76,39% по уравнению (3)

изменением жилой площади квартиры Х4.

Для вычисления средней относительной ошибки аппроксимации

рассмотрим остатки модели Еi = Yi – YТi, содержащиеся в столбце Остатки

итогов функции РЕГРЕССИЯ. Дополним таблицу столбцом относительных

погрешностей, которые вычислим по формуле Еотн.i = Yi Ei

100 с помощью

функции ABS.

Выполнение расчетов для модели (1):

ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки Отн. погр-ти

1 100,5333 -62,5333 164,5614 2 100,5333 -38,3333 61,62915 3 101,8136 23,18636 18,54909 4 100,5333 -39,4333 64,53901 5 101,8136 -34,8136 51,96065 6 101,8136 -8,81364 9,477028 7 100,5333 17,46667 14,80226 8 101,8136 30,18636 22,86846 9 101,8136 -9,31364 10,0688

10 100,5333 4,466667 4,253968 11 100,5333 -58,5333 139,3651 12 100,5333 24,46667 19,57333 13 101,8136 68,18636 40,10963 14 101,8136 -63,8136 167,9306 15 101,8136 28,68636 21,98189 16 101,8136 -16,8136 19,78075 17 101,8136 -3,81364 3,891466 18 101,8136 26,18636 20,4581 19 101,8136 -16,8136 19,78075 20 100,5333 59,46667 37,16667 21 101,8136 -41,8136 69,68939 22 100,5333 -59,5333 145,2033 23 100,5333 -10,5333 11,7037 24 101,8136 -18,8136 22,66703 25 101,8136 -56,8136 126,2525 26 101,8136 -62,8136 161,0606 27 101,8136 -14,9136 17,16184

11

28 101,8136 -61,8136 154,5341 29 101,8136 -21,8136 27,26705 30 101,8136 125,1864 55,14818 31 101,8136 133,1864 56,67505 32 100,5333 -60,5333 151,3333 33 100,5333 -33,5333 50,04975 34 100,5333 22,46667 18,26558 35 101,8136 -1,81364 1,813636 36 100,5333 4,466667 4,253968 37 100,5333 -30,2333 43,00616 38 100,5333 -18,5333 22,60163 39 100,5333 179,4667 64,09524

40 100,5333 99,46667 49,73333

По столбцу относительных погрешностей с помощью функции

СРЗНАЧ найдем среднее значение Еотн = 54,13%.

Выполнение расчетов для модели (2):

ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки Отн. погр-ти

1 43,57707 -5,57707 14,6765 2 79,61484 -17,4148 27,99813 3 115,6526 9,347392 7,477914 4 79,61484 -18,5148 30,30252 5 43,57707 23,42293 34,9596 6 79,61484 13,38516 14,39265 7 115,6526 2,347392 1,989315 8 115,6526 16,34739 12,38439 9 115,6526 -23,1526 25,02985

10 151,6904 -46,6904 44,46703 11 43,57707 -1,57707 3,754925 12 115,6526 9,347392 7,477914 13 151,6904 18,30962 10,77037 14 43,57707 -5,57707 14,6765 15 151,6904 -21,1904 16,23784 16 79,61484 5,385162 6,335485 17 151,6904 -53,6904 54,7861 18 151,6904 -23,6904 18,50811 19 115,6526 -30,6526 36,06189 20 115,6526 44,34739 27,71712 21 43,57707 16,42293 27,37155 22 43,57707 -2,57707 6,285533 23 151,6904 -61,6904 68,54486 24 151,6904 -68,6904 82,75949 25 43,57707 1,422932 3,16207 26 43,57707 -4,57707 11,73607

12

27 115,6526 -28,7526 33,08701 28 43,57707 -3,57707 8,942671 29 79,61484 0,385162 0,481452 30 151,6904 75,30962 33,17605 31 151,6904 83,30962 35,4509 32 43,57707 -3,57707 8,942671 33 43,57707 23,42293 34,9596 34 151,6904 -28,6904 23,32551 35 115,6526 -15,6526 15,65261 36 115,6526 -10,6526 10,14534 37 79,61484 -9,31484 13,25013 38 115,6526 -33,6526 41,03977 39 151,6904 128,3096 45,82487

40 151,6904 48,30962 24,15481

По столбцу относительных погрешностей найдем среднее значение

Е отн = 23,46%.

Выполнение расчетов для модели (3):

ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки Отн. погр-ти

1 44,17867 -6,17867 16,25965 2 86,27023 -24,0702 38,69812 3 98,65011 26,34989 21,07991 4 83,29906 -22,1991 36,33235 5 43,43587 23,56413 35,17034 6 65,71964 27,28036 29,33372 7 143,2176 -25,2176 21,37089 8 106,078 25,92197 19,63786 9 135,7897 -43,2897 46,7997

10 113,506 -8,50595 8,100909 11 41,70269 0,297309 0,707878 12 106,078 18,92197 15,13758 13 135,7897 34,21027 20,12369 14 36,75074 1,249258 3,287521 15 160,5495 -30,0495 23,02641 16 81,31828 3,681716 4,33143 17 103,6021 -5,60206 5,716383 18 143,7128 -15,7128 12,27566 19 120,9339 -35,9339 42,27515 20 101,1261 58,87392 36,7962 21 46,65464 13,34536 22,24227 22 31,79879 9,201207 22,44197 23 113,506 -23,506 26,11773 24 119,6959 -36,6959 44,21192 25 43,93107 1,068932 2,375404

13

26 41,70269 -2,70269 6,929977 27 142,4749 -55,5749 63,95265 28 51,60659 -11,6066 29,01647 29 96,17413 -16,1741 20,21766 30 222,4488 4,551164 2,004918 31 219,9729 15,02714 6,394527 32 34,27477 5,725233 14,31308 33 42,94068 24,05932 35,90944 34 133,3138 -10,3138 8,385163 35 88,74621 11,25379 11,25379 36 115,9819 -10,9819 10,45898 37 83,29906 -12,9991 18,49085 38 115,9819 -33,9819 41,44138 39 207,593 72,40701 25,85965

40 145,6936 54,30638 27,15319

По столбцу относительных погрешностей найдем среднее значение

Е отн = 21,89%.

Разнесем результаты в сводную таблицу:

Модель R-квадрат Е отн

YТ = 101,81 – 1,28*X1 (1) 0,000127 54,13%

YТ = 7,54 + 36,04*X2 (2) 0,564092 23,46%

YТ = – 2,86 + 2,48*X4 (3) 0,763897 21,89%

Оценим точность построенных моделей:

Е отн1 = 54,13% > 15%, Еотн2 = 23,46% > 15%, Еотн3 = 21,89% > 15%.

Точность всех трех моделей неудовлетворительная. Ближе к 15% Еотн

модели (3).

Проверим значимость полученных уравнений с помощью F – критерия

Фишера.

F – статистики определены функцией РЕГРЕССИЯ и составляют:

Модель R-квадрат Е отн

F

YТ = 101,81 – 1,28*X1 (1) 0,000127 54,13% 0,004818

14

YТ = 7,54 + 36,04*X2 (2) 0,564092 23,46% 49,1744

YТ = – 2,86 + 2,48*X4 (3) 0,763897 21,89% 122,9468

С помощью функции FРАСПОБР найдем значение Fкр = 4,1 для уровня

значимости α = 5%, и чисел степеней свободы k1 = 1, k2 = 38.

F = 0,0048 < Fкр = 4,1, следовательно уравнение модели (1) не является

значимой и ее использование нецелесообразно. F = 49,17 > Fкр = 4,1, F =

122,95 > Fкр = 4,1, следовательно, уравнения моделей (2) и (3) являются

значимыми, их использование целесообразно, зависимая переменная Y

достаточно хорошо описывается включенной в модель (2) факторной

переменной Х2 и включенной в модель (3) факторной переменной Х4.

На основании оценки качества моделей по коэффициенту

детерминации, средней ошибке аппроксимации и критерию Фишера

наилучшей является модель (3) зависимости цены квартиры от ее жилой

площади. Однако эту модель нецелесообразно использовать для

прогнозирования в реальных условиях, поскольку ее точность

неудовлетворительная, и дальнейшие расчеты проведем в учебных целях.

5. Согласно условию задачи прогнозное значение фактора Х4

составляет 80% от его максимального значения. Максимальное значение Х4 =

91 найдем с помощью функции МАКС. Тогда прогнозное значение Х4 * =

72,8. Рассчитаем по уравнению модели (3) прогнозное значение Y:

Y*Т = – 2,86 + 2,48* Х4 * = – 2,86 + 2,48 * 72,8 = 177,39.

Таким образом, если жилая площадь квартиры составит 80% от ее

максимального значения и составит 72,8 кв. м, то ожидаемая цена квартиры

будет составлять около 177,39 тыс. долл.

Зададим доверительную вероятность p = 1 – α = 1– 0,1 = 0,9 и построим

доверительный прогнозный интервал для среднего значения Y.

Для этого нужно рассчитать стандартную ошибку прогнозирования для

среднего значения результирующего признака:

15

S(Y*Т) = SE * ∑ −

− +

)

)( 2

2

(

* 1

xx

xx

i n

.

Предварительно подготовим:

- стандартная ошибка SE = 28,2 из таблицы «регрессионная статистика»

- по столбцу данных Х4 найдем среднее значение x = 42,04 с

помощью функции СРЗНАЧ и определим ∑ − )( 2

xxi = 15950,82 с помощью

функции КВАДРОТКЛ;

- tкр – коэффициент Стьюдента для уровня значимости α=10% и числа

степеней свободы k = 38. tкр = 1,686 с помощью функции СТЬЮДРАСПОБР.

Следовательно, стандартная ошибка прогнозирования для среднего

значения составляет:

S(Y*Т) = 28,2 * 82,15950 )04,428,72(

40

1 2−+ = 8,188 .

Размах доверительного интервала для среднего значения:

U(Y*Т) = tкр * S(Y * Т) = 1,686 * 8,188 = 13,805.

Границами прогнозного интервала будут:

Uнижн = Y * Т – U(Y

* Т) = 177,39 – 13,805 = 163,58;

Uверх = Y * Т + U(Y

* Т) = 177,39 + 13,805 = 191,19.

Таким образом, с надежностью 90% можно утверждать, что если жилая

площадь квартиры составит 80% от ее максимального значения и составит

72,8 кв. м, то ожидаемая средняя цена квартиры будет от 163,58 тыс. долл. до

191,19 тыс. долл.

Для построения чертежа воспользуемся Мастером диаграмм (точечная)

– покажем исходные данные (поле корреляции). Затем с помощью опции

добавить линию тренда, построим линию модели и покажем на графике

результаты прогнозирования.

16

Результаты моделирования и прогнозирования

y = 2,476x - 2,8649

0

50

100

150

200

250

300

0 50 100

жилая площадь, кв.м, Х4

ц е н а к в а р ти р ы

, т ы с .д о л л

., Y

Исходные данные

Нижняя граница

Верхняя граница

Прогноз

Линейный

(Исходные данные)

6. Методом включения построим двух факторные модели, сохраняя в

них наиболее информативный фактор – жилую площадь квартиры (Х4).

В качестве «входного интервала Х» укажем значения факторов Х1 и Х4,

с помощью функции РЕГРЕССИЯ получим:

ВЫВОД ИТОГОВ

Регрессионная статистика Множественный R 0,875979 R-квадрат 0,767339 Нормированный R- квадрат 0,754763 Стандартная ошибка 28,3714 Наблюдения 40

Коэффициенты Y-пересечение -6,4361 Х1 6,692936 Х4 2,48928

17

Таким образом, модель (4) зависимости цены квартиры Y от города

области Х1 и жилой площади квартиры Х4 построена, ее уравнение имеет

вид: YТ = –6,44 + 6,69*X1 + 2,49*Х4.

Используем в качестве «входного интервала Х» значения факторов Х2

и Х4, с помощью функции РЕГРЕССИИ найдем:

ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,874163 R-квадрат 0,76416 Нормированный R-квадрат 0,751412 Стандартная ошибка 28,56458 Наблюдения 40

Коэффициенты Y-пересечение -2,16757 Х2 -1,57033 Х4 2,556497

Таким образом, модель (5) зависимости цены квартиры Y от числа

комнат Х2 и жилой площади Х4 построена, ее уравнение имеет вид:

YТ = –2,17 – 1,57*X2 + 2,56*Х4.

Построим множественную модель регрессии, учитывая все факторы

(Х1, Х2, и Х4):

ВЫВОД ИТОГОВ Регрессионная статистика Множественный R 0,876218 R-квадрат 0,767758 Нормированный R-квадрат 0,748404 Стандартная ошибка 28,73688 Наблюдения 40 Коэффициенты Y-пересечение -5,64357 Х1 6,859631 Х2 -1,98516 Х4 2,591406

18

Таким образом, трехфакторная модель (6) зависимости цены квартиры

Y от города области Х1, числа комнат Х2 и жилой площади Х4 построена, ее

уравнение имеет вид:

YТ = –5,67 + 6,86*Х1 – 1,99*X2 + 2,59*Х4.

Выберем лучшую из построенных. Для сравнения моделей с

различным количеством учтенных в них факторов используем

нормированные коэффициенты детерминации, которые содержатся в строке

«нормированный R-квадрат» функции РЕГРЕССИЯ. Чем больше величина

нормированного коэффициента детерминации, тем лучше модель.

Модель Нормированный R-квадрат

YТ = –6,44 + 6,69*X1 + 2,49*Х4 (4) 0,754763

YТ = –2,17 – 1,57*X2 + 2,56*Х4 (5) 0,751412

YТ = –5,67 + 6,86*Х1 – 1,99*X2 + 2,59*Х4 (6) 0,748404

Таким образом, лучшей является модель (4) зависимости цены

квартиры Y от города области Х1 и жилой площади квартиры Х4:

YТ = –6,44 + 6,69*X1 + 2,49*Х4.

Коэффициент регрессии b1 = 6,69, следовательно, при покупке

квартиры в Люберцах (Х1) той же жилой площади (Х4), что и в Подольске

цена квартиры (Y) увеличится в среднем на 6,69 тыс. долл.

Коэффициент регрессии b2 = 2,49, следовательно, при увеличении

жилой площади (Х4) на 1 кв. м в одном городе (Х1), цена квартиры (Y)

увеличится в среднем на 2,48 тыс. долл. Свободный коэффициент не имеет

экономического смысла.

7. Оценим качество модели.Для оценки качества выбранной

множественной модели (4) YТ = –6,44 + 6,69*X1 + 2,49*Х4 используем

коэффициент детерминации R-квадрат, среднюю относительную ошибку

аппроксимации и F – критерий Фишера.

Коэффициент детерминации R-квадрат выпишем из таблица

«Регрессионная статистика» для модели (4).

19

R2 = 0,767, следовательно, вариация цены квартиры Y на 76,7%

объясняется по данному уравнению вариацией города области Х1 и жилой

площади Х4.

Используем исходные данные Yi и найденные остатки Еi из таблицы

«Вывод остатка» для модели (4). Рассчитаем относительные погрешности и

найдем среднее значение Еотн.

ВЫВОД ОСТАТКА Наблюдение Предсказанное Y Остатки Отн. погр-ти

1 47,55316 -9,55316 25,13988493 2 89,87092 -27,6709 44,48700502 3 95,62438 29,37562 23,50049523 4 86,88378 -25,7838 42,19931434 5 40,11344 26,88656 40,12920021 6 62,51696 30,48304 32,77746634 7 147,1244 -29,1244 24,68165955 8 103,0922 28,90778 21,89983249 9 132,9636 -40,4636 43,74441266

10 117,253 -12,253 11,66952159 11 45,06388 -3,06388 7,294943394 12 109,7852 15,21484 12,17187399 13 132,9636 37,03642 21,7861284 14 33,39238 4,60762 12,12531651 15 157,8564 -27,3564 20,96274499 16 78,19942 6,800579 8,000681624 17 100,6029 -2,60294 2,656062313 18 140,9293 -12,9293 10,10099834 19 118,0279 -33,0279 38,85635461 20 104,8066 55,1934 34,49587661 21 43,3495 16,6505 27,75083346 22 35,10676 5,893244 14,37376579 23 117,253 -27,253 30,28110852 24 116,7833 -33,7833 40,70272457 25 40,61129 4,388708 9,752684736 26 38,37094 0,62906 1,612974811 27 139,6846 -52,7846 60,7418157 28 48,32806 -8,32806 20,82015006 29 93,1351 -13,1351 16,41887615 30 220,0884 6,911617 3,044764999 31 217,5991 17,4009 7,40463685 32 37,59604 2,403964 6,009909809 33 46,30852 20,69148 30,88281157 34 137,1672 -14,1672 11,51807973 35 85,66726 14,33274 14,33273923 36 119,7423 -14,7423 14,04026449 37 86,88378 -16,5838 23,59001573 38 119,7423 -37,7423 46,02716795

20

39 211,8456 68,15436 24,34084302 40 149,6136 50,38636 25,19318084

По столбцу относительных погрешностей с помощью функции

СРЗНАЧ найдем среднее значение Еотн = 22,69%.

Сравнение показывает, что 22,69% > 15%. Следовательно, точность

модели неудовлетворительная.

С помощью F – критерия Фишера проверим значимость модели в

целом. Для этого возьмем данные из таблицы «дисперсионный анализ» для

модели (4)) F = 61,01.

Дисперсионный анализ df SS MS F Значимость F

Регрессия 2 98226,35 49113,17573 61,01499 1,92E-12 Остаток 37 29782,64 804,9362779 Итого 39 128009

С помощью функции FРАСПОБР найдем значение Fкр = 3,25 для

уровня значимости α = 5%, и чисел степеней свободы k1 = 2, k2 = 37.

F = 61,01 > Fкр = 3,25, следовательно, уравнения модели (4) является

значимым, его использование целесообразно, зависимая переменная Y

достаточно хорошо описывается включенными в модель (4) факторными

переменными Х1 и Х4.

Дополнительно с помощью t – критерия Стьюдента проверим

значимость отдельных коэффициентов модели.

Для выбранной модели (4) получены следующие значения:

Коэффициенты Стандартная

ошибка t-статистика P-Значение Y-пересечение -6,4361 11,51649 -0,558859663 0,579624 Х1 6,692936 9,045869 0,739888746 0,464037 Х4 2,48928 0,22536 11,04580516 2,85E-13

Критическое значение tкр найдено для уровня значимости α = 5% и

числа степеней свободы k = 40 – 2 – 1 = 37. tкр = 2,03.

Для свободного коэффициента a= –6,44 определена статистика

21

t(a) = – 0,56. |t(a)| = 0,56 < tкр = 2,03, следовательно, свободный

коэффициент a = –6,44 не является значимым, его можно исключить из

модели.

Для коэффициента регрессии b1 = 6,69 определена статистика t(b1)=

0,74.

|t(b1)| = 0,74 < tкр = 2,03, следовательно, коэффициента регрессии b1 не

является значимым, его и фактор города области можно исключить из

модели.

Для коэффициента регрессии b2=2,49 определена статистика t(b2)=

11,05.

|t(b2)| = 11,05 > tкр = 2,03, следовательно, коэффициента регрессии b2

является значимым, его и фактор жилой площади квартиры нужно сохранить

в модели.

Выводы о значимости коэффициентов модели сделаны на уровне

значимости α = 5%. Рассматривая столбец «P-значение», отметим, что

свободный коэффициент a можно считать значимым на уровне 0,58 = 58%;

коэффициент регрессии b1 – на уровне 0,46 = 46%;, а коэффициент регрессии

b2 – на уровне 2,85E-13 = 0,000000000000285 = 0,000000000001%.

При добавлении в уравнение новых факторных переменных

автоматически увеличивается коэффициент детерминации R2 и уменьшается

средняя ошибка аппроксимации, хотя при этом не всегда улучшается

качество модели. Поэтому для сравнения качества модели (3) и выбранной

множественной модели (4) используем нормированные коэффициенты

детерминации.

Модель Нормированный R-квадрат

YТ = – 2,86 + 2,48*X4 (3) 0,757684

YТ = –6,44 + 6,69*X1 + 2,49*Х4 (4) 0,754763

22

Таким образом, при добавлении в уравнение регрессии фактора «город

области» Х1 качество модели ухудшилось, что говорит не в пользу

сохранения фактора Х1 в модели.

Средние коэффициенты эластичности в случае линейной модели

определяются формулами Эj = bj * Y

Х j .

С помощью функции СРЗНАЧ найдем: 1Х = 0,45, 4Х = 42,045, Y =

101,24. Тогда Э1 = 6,69 * 24,101 45,0

= 0,03, Э2 = 2,49 * 24,101 045,42

= 1,03 .

Следовательно, при покупке квартиры в Люберцах (Х1) и неизменной

жилой площади цена квартиры увеличится в среднем на 0,03%.

Увеличение жилой площади Х4 в том же городе на 1% приводит к

увеличению цены квартиры в среднем на 1,03%.

Бета - коэффициенты определяются формулами βj = bj * y

xj

S

S .

С помощью функции СТАНДОТКЛОН найдем SX1 = 0,5; SX4 = 20,22;

SY = 57,29. Тогда

β1 = 6,69 * 29,57 5,0

= 0,06; β2 = 2,49 * 29,57 22,20

= 0,88.

Таким образом, при увеличении только фактора Х1 на одно свое

стандартное отклонение результат Y увеличивается в среднем на 0,06 своего

стандартного отклонения SY, а при увеличении только фактора Х4 на одно

его стандартное отклонение – увеличивается на 0,88 SY.

Дельта - коэффициенты определяются формулами ∆j = βj * 2 ),(

R

XYr j .

Коэффициенты парной корреляции r(Y, X1) = – 0,01, и r(Y, X4) = 0,87

найдены с помощью функции КОРРЕЛЯЦИЯ. Коэффициент детерминации

R2 = 0,77 определен для рассматриваемой двухфакторной модели функцией

РЕГРЕССИЯ.

Вычислим дельта - коэффициенты:

23

∆1 = 0,06 * 77,0 01,0−

= – 0,0009; ∆2 = 0,88 * 77,0 87,0

= 1,0009.

Поскольку ∆1 < 0, то факторная переменная Х1 выбрана неудачно и ее

нужно исключить из модели.

Значит, по уравнению полученной линейной двухфакторной модели

изменение результирующего фактора Y (цены квартиры) на 100%

объясняется воздействием фактора Х4 (жилой площадью квартиры).

24

Задача № 2.Исследование динамики экономического показателя на

основе анализа одномерного временного ряда.

В течение девяти последовательных недель фиксировался спрос Y(t)

(млн. руб.) на кредитные ресурсы финансовой компании. Временной ряд Y(t)

этого показателя приведен в таблице.

t 1 2 3 4 5 6 7 8 9

Y(t) 30 28 33 37 40 42 44 49 47

Задание:

1. Проверить наличие аномальных наблюдений.

2. Построить линейную модель временного ряда Yt = a + b * t,

параметры которой оценить МНК.

3. Оценить адекватность построенной модели, используя свойства

независимости остаточной компоненты, случайности и соответствия

нормальному закону распределения.

4. Оценить точность модели на основе использования средней

относительной ошибки аппроксимации.

5. Осуществить прогноз спроса на следующие 2 недели (прогнозный

интервал рассчитать при доверительной вероятности 70%).

6. Представить графически фактические значения показателя,

результаты моделирования и прогнозирования.

1. Проверим наличие аномальных наблюдений. Используем метод

Ирвина, основанный на определении λt-статистик по формуле: λt = y

tt

S

yy 1−− ,

где Sy – выборочное среднее квадратичное (стандартное) отклонение

признака Y.

Подготовим Sy = 7,42 с помощью функции СТАНДОТКЛОН и

рассчитаем λt-статистики. Результат расчетов приведем в таблице:

25

t 1 2 3 4 5 6 7 8 9

Y(t) 30 28 33 37 40 42 44 49 47

λt 0,27 0,67 0,54 0,40 0,27 0,27 0,67 0,27

При n = 9 и уровне значимости α = 5% можно использовать λкр= 1,5.

Все λt-статистики меньше λкр, то есть аномальных наблюдений нет.

Исходный ряд будем использовать для выполнения следующих пунктов

задачи.

2. Построим линейную модель временного ряда Yt = a + b * t

С помощью функции РЕГРЕССИЯ найдем:

ВЫВОД ИТОГОВ

Регрессионная статистика

Множественный R 0,971442

R-квадрат 0,9437

Нормированный R- квадрат 0,935657

Стандартная ошибка 1,883091

Наблюдения 9

Дисперсионный анализ

df SS MS F Значимо

сть F Регрессия 1 416,0667 416,0667 117,333 1,26E-05 Остаток 7 24,82222 3,546032 Итого 8 440,8889

Коэффициенты

Y- пересечение 25,72222

t 2,633333

Таким образом, a = 25,72, b = 2,63. Модель построена, ее уравнение

имеет вид:

Yt = 25,72 + 2,63 * t.

Коэффициент регрессии b = 2,63 показывает, что с каждой неделей

спрос на кредитные ресурсы финансовой компании (Y) увеличивается в

среднем на 2,63 млн. руб.

26

3. Оценим адекватность построенной модели, используя свойства

независимости остаточной компоненты, случайности и соответствия

нормальному закону распределения.

Проверка перечисленных свойств состоит в исследовании Ряда остатков

et, который содержится в таблице «Вывод остатка».

ВЫВОД ОСТАТКА

Наблюдение Предсказанное

Y(t) Остатки 1 28,35556 1,644444 2 30,98889 -2,98889 3 33,62222 -0,62222 4 36,25556 0,744444 5 38,88889 1,111111 6 41,52222 0,477778 7 44,15556 -0,15556 8 46,78889 2,211111 9 49,42222 -2,42222

Для проверки свойства независимости остаточной компоненты

используем критерий Дарбина - Уотсона. Согласно этому критерию

вычислим по формуле статистику d = ∑

=

= −−

n

t t

n

t tt

e

ee

1

2

2

2 1)(

.

Подготовим для вычислений:

С помощью функции СУММКВ ∑ =

9

1

2

t te = 24,82; с помощью функции

СУММКВРАЗН ∑ =

−− 9

2

2 1 )(

t tt ee = 56,94.

Таким образом, d = 82,24 94,56

= 2,29. Поскольку d > 2, то перейдем к d’ = 4 –

d = 4 – 2.29 = 1,71.

По таблице d-статистик Дарбина - Уотсона определим критические

уровни: нижний d1 = 0,82 и верхний d2 = 1,32.

Сравним полученную фактическую величину d’ с критическими

уровнями d1 и d2 и сделаем выводы:

27

d’ = 1,71∈ (d2 = 1,32; 2), следовательно, свойство независимости

остатков для построенной модели выполняется.

Для проверки свойства случайности остаточной компоненты

используем критерий поворотных точек (пиков), основой которого является

определение количества поворотных точек для ряда остатков. С помощью

Мастера диаграмм построим график остатков et.

-4

-3

-2

-1

0

1

2

3

0 2 4 6 8 10 Остатки

Поворотные точки

Поворотные точки – вторая, пятая, седьмая, восьмая. Их количество

p=4. По формуле pкр =  

  

 −−− 90

2916 96,1)2(

3

2 n n при n = 9 вычислим

критическое значение pкр= [ ]45,2 = 2. Сравним значения p и pкр : p = 4 > pкр= 2, следовательно, свойство

случайности для ряда остатков выполняется.

Для проверки соответствия ряда остатков нормальному закону

распределения используем R/S критерий.

В соответствии с этим критерием вычислим по формуле статистику

R/S = )( minmax

eS

ee − .

Подготовим для вычислений:

С помощью функции МАКС emax = 2,21 – максимальный уровень ряда

остатков;

С помощью функции МИН emin = –2,99 – минимальный уровень ряда

остатков;

28

S(e) = 1,88 – стандартная ошибка модели из таблицы «регрессионная

статистика».

Получим: R/S = 88,1 )99,2(21,2 −− = 2,76.

По таблице критических границ отношения R/S определим

критический интервал. При n = 9 можно использовать (2,67; 3,69).

Сопоставим фактическую величину R/S с критическим интервалом:

2,76∈(2,67; 3,69), значит, для построенной модели свойство нормального

распределения остаточной компоненты выполняется.

Проведенная проверка показывает, что для построенной модели

выполняются все свойства. Таким образом, данная модель является

адекватной, и ее можно использовать для построения прогнозных оценок.

4. Оценим точность модели на основе использования средней

относительной ошибки аппроксимации.

Используем исходные данные Yt и найденные функцией РЕГРЕССИЯ

остатки et по формуле eотн.t = t

t

Y

e ⋅ 100 рассчитаем столбец относительных

погрешностей и найдем среднее значение eотн = 3,78%.

ВЫВОД ОСТАТКА

Наблюдение Предсказанное

Y(t) Остатки Отн. погр-ти 1 28,35556 1,644444 5,481481 2 30,98889 -2,98889 10,6746 3 33,62222 -0,62222 1,885522 4 36,25556 0,744444 2,012012 5 38,88889 1,111111 2,777778 6 41,52222 0,477778 1,137566 7 44,15556 -0,15556 0,353535 8 46,78889 2,211111 4,512472 9 49,42222 -2,42222 5,153664

Сравнение показывает, что 3,78% < 5%, следовательно, модель имеет

высокую точность.

5. Осуществим прогноз спроса на следующие 2 недели.

29

«Следующие 2 недели» соответствуют периодам k1 = 1 и k2 = 2, при

этом *1t = n + k1 = 10 и * 2t = n + k2 = 11.

Согласно уравнению модели получим точечные прогнозные оценки:

Y*10 = 25,72 + 2,63 * 10 = 52,05 и Y * 11 = 25,72 + 2,63 * 11 = 54,69.

Таким образом, ожидаемый спрос на кредитные ресурсы финансовой

компании в следующие 2 недели будут составлять около 52,05 млн. руб. и

54,69 млн. руб. соответственно.

Для оценки точности прогнозирования рассчитаем границы

прогнозного интервала для индивидуальных значений результирующего

признака (доверительная вероятность p = 70%).

Подготовим:

С помощью функции СТЬЮДРАСПОБР при α = 100 % - 70 % = 30 %,

k = 9 – 2 = 7. tкр = 1,12;

S(e) = 1,88;

С помощью функции СРЗНАЧ t = 5;

С помощью функции КВАДРОТКЛ ∑ − 2)( tt = 60.

Вычислим размах прогнозного интервала для индивидуальных

значений, используя формулу: Un = ∑ −

−++∗∗ 2

2*

)(

)(1 1)(

tt

tt

n eStкр .

При *1t = 10 получим U10 = 2,6 и определим границы доверительного

интервала: Uниж10= Y * 10 – U10 = 49,45; Uверх10= Y

* 10 + U10 = 54,66.

При *2t = 11 получим U11 = 2,76 и определим границы доверительного

интервала: Uниж11= Y * 11 – U11 = 51,93; Uверх11= Y

* 11 + U11 = 57,45.

Таким образом, с надежностью 70% можно утверждать, что спрос на

кредитные ресурсы финансовой компании на следующую (10-ю) неделю

будет составлять от 49,45 до 54,66 млн. руб., а через неделю (11-ю) – от 51,93

до 57,45 млн. руб.

30

6. Представим графически фактические значения показателя,

результаты моделирования и прогнозирования.

Для построения чертежа воспользуемся Мастером диаграмм (точечная)

– покажем исходные данные. С помощью опции Добавить линию тренда…

построим линию модели и покажем на графике результаты прогнозирования.

Результаты моделирования и прогнозирования y = 2,6333x + 25,722

0

10

20

30

40

50

60

70

0 5 10 15

недели

с п р о с

н а

к р е д и т н ы е

р е с у р с ы

, м л н

.р у б

.

Фактические

значения

Прогноз

Нижние границы

Верхние границы

Линейный

(Фактические значения)

комментарии (0)
не были сделаны комментарии
Напиши ваш первый комментарий
это только предварительный показ
консультироваться и скачать документ
Docsity не оптимизирован для браузера, который вы используете. Войдите с помощью Google Chrome, Firefox, Internet Explorer 9+ или Safari! Скачать Google Chrome