Эконометрическое моделирование стоимости квартир в Московской области, вариант  -  упражнение  - Эконометрика (7), Упражнения из Эконометрика. Modern Institute of Managament
wklev85
wklev8525 March 2013

Эконометрическое моделирование стоимости квартир в Московской области, вариант - упражнение - Эконометрика (7), Упражнения из Эконометрика. Modern Institute of Managament

PDF (410.7 KB)
36 страница
2файлы скачать
1000+количество посещений
Описание
Задачи, тесты и упражнения по предмету Эконометрика. Тема Эконометрическое моделирование стоимости квартир в Московской области. Задачи и решения. Упражнения с ответами. Лабораторная работа. Разные варианты. Вариант 7.
20очки
пункты необходимо загрузить
этот документ
скачать документ
предварительный показ3 страница / 36
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
Эконометрическое моделирование стоимости квартир в Московской области, вариант 9 - контрольная работа - Эконометрика

Министерство образования и науки РФ

Федеральное агентство по образованию ГОУ ВПО

Всероссийский заочный финансово-экономический институт

Кафедра экономико-математических методов и моделей

КОНТРОЛЬНАЯ РАБОТА По дисциплине:

«Эконометрика»

Тема:

«Эконометрическое моделирование стоимости

квартир в Московской области, вариант 9»

Москва – 2008

План работы

1. Задача 1. Эконометрическое моделирование стоимости квартир в Московской области…………………………..…………….

4

2. Задача 2. Исследовать динамику экономического показателя на основе анализа одномерного временного ряда.……………………………………...

11

Список использованной литературы……………………………………. 15

Задача 1. Эконометрическое моделирование стоимости квартир в Московской

области.

Задание по эконометрическому моделированию стоимости квартир в Московской области:

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените

статистическую значимость коэффициентов корреляции. 2. Постройте поле корреляции результативного признака и наиболее тесно

связанного с ним фактора. 3. Рассчитайте параметры линейной парной регрессии для каждого фактора Х. 4. Оцените качество каждой модели через коэффициент детерминации,

среднюю ошибку аппроксимации и F-критерий Фишера. Выберите лучшую модель.

5. Для выбранной модели осуществите прогнозирование среднего значения показателя Y при уровне значимости 0.1α = , если прогнозное значения фактора X составит 80% от его максимального значения. Представьте графически: фактические и модельные значения, точки прогноза.

6. Используя пошаговую множественную регрессию (метод исключения или метод включения), постройте модель формирования цены квартиры за счёт значимых факторов. Дайте экономическую интерпретацию коэффициентов модели регрессии.

7. Оцените качество построенной модели. Улучшилось ли качество модели по сравнению с однофакторной моделью? Дайте оценку влияния значимых факторов на результат с помощью коэффициентов эластичности,  - и  - коэффициентов.

Таблица 1. Наименования показателей

Обозначение Наименование показателя Единица измерения

(возможные значения) Y цена квартиры тыс. долл.

X4 жилая площадь квартиры

кв. м

X5 этаж квартиры X6 площадь кухни кв. м

Таблица 2 Исходные данные для эконометрического моделирования стоимости квартир

№ Y X4 X5 X6 1 115 51,4 9 7 2 85 46 5 10 3 69 34 6 10 4 57 31 1 9 5 184,6 65 1 9 6 56 17,9 2 7 7 85 39 12 8,3 8 265 80 10 16,5 9 60,65 37,8 11 12,1

10 130 57 6 6 11 46 20 2 10 12 115 40 2 7 13 70,96 36,9 5 12,5 14 39,5 20 7 11 15 78,9 16,9 14 13,6 16 60 32 11 12 17 100 58 1 9 18 51 36 6 12 19 157 68 2 11 20 123,5 67,5 12 12,3 21 55,2 15,3 9 12 22 95,5 50 6 12,5 23 57,6 31,5 5 11,4 24 64,5 34,8 10 10,6 25 92 46 9 6,5 26 100 52,3 2 7 27 81 27,8 3 6,3 28 65 17,3 5 6,6 29 110 44,5 10 9,6 30 42,1 19,1 13 10,8 31 135 35 12 10 32 39,6 18 5 8,6 33 57 34 8 10 34 80 17,4 4 8,5 35 61 34,8 10 10,6 36 69,6 53 4 12 37 250 84 15 13,3 38 64,5 30,5 12 8,6 39 125 30 8 9 40 152,3 55 7 13

Решение:

1. Рассчитайте матрицу парных коэффициентов корреляции; оцените

статистическую значимость коэффициентов корреляции.

1.1 Коэффициенты парной корреляции используются для измерения силы

линейных связей различных пар признаков из их множества. Для

множества m признаков n наблюдений получают матрицу коэффициентов

парной корреляции.

Количество наблюдений n=40

Количество факторов (переменных) m=3

Рассчитываем матрицу парных коэффициентов корреляции с

использованием надстройки Excel:

1 Вводим данные для корреляционного анализа, расположив их в смежных

диапазонах ячеек (Y, Х4,Х5,Х6);

2 Выбираем команду Сервис-анализ данных-корреляция-задаем входной

интервал (Y, Х4,Х5,Х6), по столбцам, метки, новый рабочий лист-ОК.

Таблица 3 Матрица коэффициентов парной корреляции

Y Стоимость квартиры, тыс. долл.

X3 Общая площадь квартиры, кв. м.

X5 Этаж

квартиры

X6 Площадь

кухни, кв. м.

Y Стоимость

квартиры, тыс. долл. 1

X4 Жилая площадь квартиры, кв. м. 0,826390243 1

X5 Этаж квартиры 0,146382617 0,044398911 1

X6 Площадь кухни,

кв. м. 0,277274009 0,274037387 0,413008439 1

Коэффициент парной корреляции определяется по формуле:

ry,x=

∑ ∑

∑∑

= =

==

−−

−− =

−− −=

n

i

n

i ii

n

i ii

yx

n

i ii

yx yyxx

yyxx

SS

yyxx n

SS

YXCov

1 1

22

11

)()(

))(())(( 1

1 ),( , (1)

где Sx 2= ∑ −−

2 1 )(1

1 xx

n , Sy

2= ∑ −− 2)(

1

1 yy

n i - оценки дисперсий величин Х и Y.

Коэффициент парной корреляции также можно определить с

использованием надстройки Excel:

• Выбираем пустую ячейку. Функция-КОРЕЛЛ-выбираем без надписи

значения Y для массива 1 и значения одного фактора Хi для массива 2-ОК

Вывод: Анализ матрицы коэффициентов парной корреляции (таблица 3)

показывает, что переменная Х4 (жилая площадь квартиры, кв. м.) имеет тесную

связь с Y (стоимость квартиры, тыс. долл.). Коэффициент корреляции

достаточно высокий (ryx4=0,826390243) и положительный (1>ryx4>0), поэтому

мы можем предположить тенденцию возрастания стоимости квартиры (Y) при

возрастании жилой площади квартиры (Х4). Переменные Х5 (этаж квартиры) и

Х6 (площадь кухни, кв. м.) имеют слабую связь с Y (стоимость квартиры, тыс.

долл.)

1.2 Оценка статистической значимости коэффициентов парной корреляции с

использованием t - критерия Стьюдента.

2 ,

2 ,

( 2) 1

y x набл

y x

r t n

r = −

tрасч. ух4 = 563,0

098,5

826390243,01

240826390243,0

1

2 22

,

, = −

−= −

xy

xy

r

nr

= 9,0333

tрасч. ух5 = 9892,0

9024,0

146382617,01

240146382617,0

1

2 22

5,

5, = −

−= −

xy

xy

r

nr

= 0,9122

tрасч. ух6 = 9608,0

7092,1

277274009,01

240277274009,0

1

2 22

6,

6, = −

−= −

xy

xy

r

nr

= 1,7789

Критическое значение t-критерия (tтабл.) берется из таблицы значений

t Стьюдента с учетом заданного уровня значимости и числа степеней свободы.

Число степеней свободы k=n-2 = 40-2 = 38

Выбираем уровень значимости α= 0,05

(tтабл.) можно определить с использованием надстройки Excel:

• Выбираем пустую ячейку. Функция-СТЬЮДРАСПОБР-задаем

вероятность = 0,05 и степени свободы =38- ОК

tтабл. = 2,0244 при (α=0,05; k=n-2=38)

Сравниваем числовые значения критериев: если tрасч > tтабл., то полученное

значение коэффициента корреляции значимо.

tрасч. ух4 > tтабл. ; 9,0333> 2,0243

tрасч. ух5 < tтабл. ; 0,9122 < 2,0243

tрасч. ух6 < tтабл. ; 1,7789 < 2,0243

Вывод: Полученные значения коэффициентов корреляции:

ry,x4 - значимо;

ry,x5 - незначимо;

ry,x6 - незначимо.

Коэффициент корреляции ry,x4 = 0,826390243 имеет наибольшую величину и

является наиболее значимым. Величина критерия tрасч. ух6 незначительно

отличается от табличного значения, поэтому коэффициент корреляции ry,x6

=0,277274009 мы исключаем из дальнейших расчетов, как наименее значимый

и ry,x5 = 0,146382617 исключаем как незначимый.

2. Постройте поле корреляции результативного признака и наиболее

тесно связанного с ним фактора.

Ответ:

Построив график, можно определить, линейны ли зависимости между

Y (ценой квартиры) и влияющим фактором Х3 (общей площадью квартиры).

Ответ:

График1

Корреляционное полеYХ4

0

50

100

150

200

250

300

0 20 40 60 80 100

Х4 Жилая площадь квартиры,кв.м

С то и м о с ть

к в а р ти р ы

т ы с .д о л л

.

Y

График 2

Корреляционное полеYХ4

0

50

100

150

200

250

300

0 20 40 60 80 100

Х4 Жилая площадь квартиры,кв.м

С то и м о ст ь

к в ар ти р ы

т ы с .д о л л

.

Y

Линейный (Y)

Вывод:: Полученное корреляционное поле (График 1) иллюстрирует

линейную взаимосвязь цены квартиры (Y) от наиболее тесно связанного

с ним фактора - общей площади (Х4), характеризующуюся

незначительным разбросом точек от прямой (График 2). По мере того как

возрастает сила линейной связи, точки на графике будут лежать более

близко к прямой линии, а величина rху будет ближе к единице.

3. Рассчитайте параметры линейной парной регрессии для каждого

фактора Х.

3.1. Рассчитаем параметры линейной парной регрессии для фактора Х4, для чего воспользуемся инструментом Exсel:

Во вкладке «Сервис» функция «Анализ данных» выберем в качестве инструмента анализа «Регрессия», отметив входной интервал для значений Y и входной интервал для значений Х, получим вывод итого на другом листе книги Excel: Таблица 4

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множествен ный R 0,82639024 R-квадрат 0,68292083 Нормирован ный R- квадрат 0,67457665

Стандартна я ошибка 29,3741824 Наблюдени я 40 Дисперсионный анализ

df SS MS F Значимос ть F

Регрессия 1 70618,39 70618,39 81,843

89 5,12E-11 Остаток 38 32788,02 862,8426 Итого 39 103406,4

Коэффицие

нты

Стандарт ная

ошибка

t- статист

ика

P- Значен ие

Нижние 95%

Верхн ие

95%

Нижн ие

95,0 %

Верхн ие

95,0% Y- пересечени е -1,3017262 11,47739 -0,11342

0,9102 97 -24,5365

21,93 3

- 24,53

6 21,933

04

X4 2,39671802 0,264926 9,046761 5,12E-

11 1,8604 2,933

03 1,860

4 2,9330

32 После проведенного анализа уравнение будет иметь следующий вид:

yi=-1,301726242+2,396718022x4

3.2.Рассчитаем параметры линейной парной регрессии для фактора Х6, для чего воспользуемся инструментом Exсel:

Таблица 5

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множествен ный R 0,277274 R-квадрат 0,0768809 Нормирован ный R- квадрат 0,0525883 Стандартна я ошибка 50,119971 Наблюдени я 40

Дисперсион ный анализ

df SS MS F Значимос ть F

Регрессия 1 7949,975 7949,975 3,1647

8 0,083243 Остаток 38 95456,44 2512,011 Итого 39 103406,4

Коэффицие

нты

Стандарт ная

ошибка

t- статист

ика

P- Значен ие

Нижние 95%

Верхн ие

95%

Нижн ие

95,0 %

Верхн ие

95,0% Y- пересечени е 33,372955 34,79737 0,959065

0,3435 9 -37,0706

103,8 17

- 37,07

06 103,81

65

X6 5,9947584 3,369765 1,778984 0,0832

4 -0,82697 12,81

65

- 0,826

97 12,816

49

После проведенного анализа уравнение будет иметь следующий вид:

yi=33,372954673+5,994758361x6

3.3.Рассчитаем параметры линейной парной регрессии для фактора Х5, для чего воспользуемся инструментом Exсel:

Таблица6

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множествен ный R 0,1463826 R-квадрат 0,0214279 Нормирован ный R- квадрат -0,004324 Стандартна я ошибка 51,603405 Наблюдени я 40

Дисперсионный анализ

df SS MS F Значимо сть F

Регрессия 1 2215,78 2215,78 0,8320

9 0,367420

2 Остаток 38 101191 2662,91 Итого 39 103406

Коэффицие

нты

Стандарт ная

ошибка

t- статист

ика

P- Значен ие

Нижние 95%

Верхн ие

95%

Нижни е

95,0%

Верхн ие

95,0% Y- пересечени е 80,342885 16,7151 4,80661

2,4E- 05

46,50498 4

114,18 08

46,504 98

114,18 08

X5 1,8875695 2,06927 0,91219 0,3674

2 -

2,301457 6,0765

96

- 2,3014

6 6,0765

96 После проведенного анализа уравнение будет иметь следующий вид:

yi=80,3428847081+1,887569544x5

Решение:

Для проведения регрессионного анализа с использованием

надстройки Excel:

• Выбераем команду Сервис⇒Анализ данных.

• В диалоговом окне Анализ данных выбираем инструмент Регрессия.

• В диалоговом окне Регрессия в поле Входной интервал Y вводим вместе

с надписями адрес одного диапазона ячеек, который представляет

зависимую переменную. В поле Входной интервал Х вводим с надписями

адреса одного или нескольких диапазонов, которые содержат значения

независимых переменных. По очереди вводим Х3,Х5,Х6, три модели.

• Так как выделены и заголовки столбцов, то устанавливаем флажок Метки

в первой строке. отмечаем галочками: уровень надежности 95%, новый

рабочий лист, остатки, график подбора и график остатков -ОК

• Получаем три протокола, три уравнения парной регрессии, вывод

остатков, графики подбора и остатков для каждого Х.

Основная задача регрессионногоанализа заключается в исследовании

зависимости изучаемой переменной от различных факторов и отображении их

взаимосвязи в форме регрессионной модели.

Линейное уравнение связи двух переменных (парную регрессию)

представим в виде:

уi=α+β*хi+εi,(3)

где α – постоянная величина (или свободный член уравнения);

β – коэффициент регрессии, определяющий наклон линии, вдоль которой

рассеяны данные наблюдений.

εi – случайная составляющая отражает тот факт, что изменение уi будет неточно

описываться изменением Х, поскольку присутствуют другие факторы,

неучтённые в данной модели.

Систематическую часть можно представить в виде уравнения:

ŷi=α+β*хi

Коэффициент регрессии β характеризует изменение переменной уi при

изменении значения хi на единицу. Если β>0, переменные хi и уi положительно

коррелированны и имеют прямую связь, если β<0 – отрицательно

коррелированны и имеют обратную связь.

Оценки наименьших квадратов:

Коэффициент регрессии β вычисляется по формуле:

( )( )

( ) , ˆ

1

2

1

=

=

−− =

n

i i

n

i ii

xx

xxyy β

$ $α β= −y x

При ( )∑ =

n

i i xx

1

2

≠ 0

Вычислим Коэффициент регрессии β для фактора Х4 используя Exсel:

• Функция - ЛИНЕЙН - (известные_значения_у: выделяем значения столбца

Y; известные_значения_х: выделяем значения столбца Х4; константа:

выделяем значение коэффициента Y-пересечение из протокола; статистика:

выделяем значение t-статистика для Y-пересечение из протокола)- ОК

или используем следующие формулы:

Таблица 7

Наименование

показателя в отчёте

Excel

Принятые наименование Формула

Множественный R Коэффициент множественной

корреляции, индекс корреляции R= 2R

R – квадрат Коэффициент детерминации R2 R2=1-

=

=

=

=

− =

n

i i

n

i n

i i

n

i i

yy

yy

yy

e

1

2

1

2

1

2

1

2

)(

)ˆ(

)(

Нормированный R –

квадрат Скорректированный R2

1

1 )1(1 2

2

−− −−−= kn

n RR

Стандартная ошибка Среднеквадратическое

отклонение от модели Se= ∑

=−−

n

i iekn 1

2

1

1

Наблюдения Количество наблюдений n n

Таблица 8

df – число

степеней

свободы

SS – сумма квадратов MS – среднее

значение

F – критерий

Фишера

Регрессия k=1 ∑ =

n

i i yy

1

2)ˆ( ∑ =

n

i i yy

1

2)ˆ( /k F= )1/()1(

/ 2

2

−−− knR kR

Остаток n-k-1=38 ∑ =

n

i ie

1

2 ∑ =

n

i ie

1

2 /(n-k-1)

Итого n-1=39 ∑ =

n

i i yy

1

2)(

Вывод: Для первого уравнения α=-1,301726242 не имеет экономической

целесообразности, так как при общей площади квартиры равной нулю,

стоимость тоже будет равна нулю.

Для всех трех уравнений β>0, переменные Хi (жилая площадь квартиры, этаж

квартиры и площадь кухни) и yi (цена квартиры) положительно коррелированны

и имеют прямую связь.

4) Оценим качество каждой модели через коэффициент детерминации,

среднюю ошибку аппроксимации и F-критерий Фишера. Выбираем

лучшую. (Модель для Х4, модель для Х5, модель для Х6).

Ответ:

Лучшая модель парной регрессии фактора Х4;

y4=-1,301726242+2,396718022x4,

Поскольку только для этой модели Fрасч > Fтабл (Fyx4=81,84>4,098172),

уравнение регрессии следует признать адекватным. Коэффициент

детерминации (R2=0,683) высокий, близкий к 1, хорошее качество модели.

68% вариации зависимой переменной Y учтено в модели и обусловлено

влиянием включенного фактора Х3 (общая площадь квартиры). Самое

меньшее значение средней ошибки аппроксимации А=26,25 % , то есть

самое меньшее рассеяние.

4.1 Коэффициент детерминации:

2 2

2 1 1

2 2

1 1

ˆ( )

1 ( ) ( )

n n

i i i i n n

i i i i

y y e объясняемая сумма квадратов

R общая сумма квадратов y y y y

= =

= =

− = = = −

− −

∑ ∑

∑ ∑

R2=R2yx 1 x 2 =1- ∑

=

=

n

i i

n

i i

yy

e

1

2

1

2

)( =1-32788,02/103406,41=1-0,317=0,683 (для Х4), 68%.

Коэффициент детерминации показывает, что около 68% вариации

зависимой переменной Y учтено в модели и обусловлено влиянием на него

включённых факторов.

R2=1- 101190,6/103406,41=1-0,978=0,022 (для Х5), 2,2%,

Коэффициент детерминации очень низкий, близкий к 0, фактор почти не влияет

на Y (стоимость квартиры).

R2=1-95456,44/103406,41=1-0,923=0,077 (для Х6), 7,7%. Коэффициент детерминации очень низкий, близкий к 0, фактор почти не влияет

на Y (стоимость квартиры).

Наиболее удачная модель для фактора Х4; y4=-1,301726242+2,396718022x4,

4.2 Для оценки качества регрессионных моделей рассчитаем величину

средней ошибки аппроксимации Ε для всех факторов.

Средняя относительная ошибка аппроксимации вычисляется по формуле:

1 1

ˆ1 1 = 100% = 100%

n n i i i

i ii i

y y e E

n y n y= =

− × ×∑ ∑

Подставляя в уравнения регрессии фактические значения факторов

Хi, найдем ŷi

Вычисляем остаток ei , который представляет собой отклонение

фактического значения зависимой переменной от ее значения,

полученного расчетным путем.

ei= yi − ŷi

Или берем из таблицы (9,10,11)

%100* i

i i y

e

Для того чтобы получить значение ei/yi по модулю │ei/yi│*100 необходимо

воспользоваться функцией Exсel – функция -ABS (выделяем значение e1, /

на y1*100), а затем суммировать столбец и разделить на n.

Для Х6 уравнение регрессии: yi=33,37+5,99x6

Найдём величину средней ошибки аппроксимации А :

40

837,19431 == ∑ iAn А

=48,60%. (5) Для Х5 уравнение регрессии: yi=80,34+1,88x5

40

45,18291 == ∑ iAn А

= 45,74%. Для Х4 уравнение регрессии: y4=-1,301726242+2,396718022x4,

40

811,10491 == ∑ iAn А

=26,25%.

Ε < 7% свидетельствует о хорошем качестве модели. Чем меньше рассеяние

эмпирических точек вокруг теоретической линии регрессии, тем меньше

средняя ошибка аппроксимации.

Наиболее удачная модель для фактора Х4; y4=-1,301726242+2,396718022x4,

4.3 Проверку значимости проведём на основе F-критерия Фишера:

F= )1/()1( /

2

2

−−− knR kR

, (6) Если расчётное значение с ν1=k и ν2=n-k-1 степенями свободы, где k –

количество факторов, включенных в модель, больше табличного при

заданном уровне значимости α, то модель считается значимой.

Значение F-критерия Фишера можно найти в таблице «Дисперсионный

анализ» протокола EXCEL (см. табл. 4, 5, 6).

Для Х6 - F= 3,1647, для Х5 - F= 0,8320, для Х4 - F=81,84.

Табличное значение F-критерия можно найти EXCEL: Fтабл.= 4,098172

• Функция – FРАСПОБР - при доверительной вероятности 0,05; • Степень свободы 1 ν1 = k =1; • Степень свободы 2 ν2 = n – k -1= 40 - 1 - 1=38

Fyx4 = 81,8438879 > Fтабл.= 4,098172

Fyx5=0,832088977< Fтабл.= 4,098172

Fyx6=3,164784713 < Fтабл.= 4,098172

Поскольку только для модели фактора Х4; y4=-1,301726242+2,396718022x4 Fрасч

> Fтабл, уравнение регрессии следует признать адекватным.

5) Осуществить прогнозирование для лучшей модели среднего значения

показателя Y при уровне значимости α=0,1, если прогнозное значение

фактора Х составит 80% от его максимального значения. Представить

графически: фактические и модельные значения, точки прогноза.

Yсред=93,65 тыс. долл.

Хпрогн=84*80%/100=67,2 м 2 Х4max=84

Для того, чтобы определить цену квартиры при жилой площади квартиры 67,2

м2, необходимо подставить значение Хпрогн в полученную модель (уi=α+β*хi=-

1,30+2,3967x4):

Упрогн=-1,30+2,3967* Хпрогн =-1,30+2,3967*67,2=159,98 тыс. долл.

Вероятность реализации точечного прогноза теоретически равна нулю, поэтому

рассчитаем доверительный интервал прогноза с заранее заданной вероятностью

α=0,1

Величину отклонения от линии регрессии вычисляют по формуле εi=уi- iŷ ,

Вычисляем εi или берем значение ∑ =

n

i ie

1

2 = 32788,01856 из протокола

регрессионного анализа Excel (пересечение SS – сумма квадратов и Остаток)

для фактора Х4 (Таблица 4 )

Величину стандартной ошибки Sε находят по формуле:

Sε= 38 01856,32788

240

01856,32788

2 1

2

= −

= −

∑ =

n

n

i iε

=29,37. (7)

Табличный коэффициент t-критерия (tα.) Стьюдента при степени свободы

ν=(n-2)=40-2=38 и заданном уровне значимости α=0,1 берется из таблицы

значений или определяется с использованием надстройки Excel:

Выбираем пустую ячейку. Функция-СТЬЮДРАСПОБР-задаем

вероятность α= 0,1 и степени свободы ν=38- ОК

tα. = 1,685954461 при (α=0,1; ν=38)

Доверительный интервал для прогнозов индивидуальных значений уi

определяется из соотношения:

упрогн =

   

   

− ++⋅⋅+

− ++⋅⋅−

∑∑ ==

n

i i

прогн

ayпрогнn

i i

прогн

ayпрогн

xx

xx

n tSy

xx

xx

n tSy

1

2

2

ˆ

1

2

2

ˆ

)(

)(1 1ˆ;

)(

)(1 1ˆ .

упрогн € [ ŷ прогн ± Ui ]

Ui = ∑

=

− ++⋅⋅ n

i i

прогн

ay

xx

xx

n tS

1

2

2

ˆ

)(

)(1 1

U(x=67,2,n=40,α=0,1)=29,37*1,685954* 73775,12293 )6175,392,67(

40

1 1

2−++ =51,623.

Таким образом, прогнозное значение прогнy =159,98 будет находиться между верхней границей, равной 159,98+51,623=211,60 и нижней границей, равной 159,98-51,623=108,36. Представим графически исходные данные результаты моделирования и результаты прогнозирования, для чего воспользуемся «мастером диаграмм» в программном продукте Excel:

Исходные данные и результаты моделирования

-50

0

50

100

150

200

250

300

0 50 100

X, жилая площадь квартиры

Y , ц е н а к в а р ти р ы

Y Цена

Y

Верхн.гр.

Нижняя гр.

Линейный

(Y Цена)

Параметры моделирования и точка прогноза

159,98

211,603

108,357

0

50

100

150

200

250

300

0 20 40 60 80 100

X4, Жилая площадь

Y , Ц е н а к в а р ти р ы Y Цена

Y

Ряд2

Ряд3

Ряд4

таб 13 Y =-1,30+2,3967Х4 ниж. верх. Uпрогн Х прогн. = 67,2 15,577 118,823 51,632 Y прогн. = 159,980 108,357 211,603

X4 Y Предсказанное Y

верх. гран.

ниж. гран.

51,4 115 274,3205 325,9435 222,6975 46 85 202,4195 254,0425 150,7965 34 69 164,0723 215,6953 112,4493 31 57 135,3119 186,9349 83,6889 65 184,6 441,13082 492,75382 389,50782

17,9 56 132,9152 184,5382 81,2922 39 85 202,4195 254,0425 150,7965 80 265 633,8255 685,4485 582,2025

37,8 60,65 144,059855 195,68286 92,436855 57 130 310,271 361,894 258,648

20 46 108,9482 160,5712 57,3252 40 115 274,3205 325,9435 222,6975

36,9 70,96 168,769832 220,39283 117,14683 20 39,5 93,36965 144,99265 41,74665

16,9 78,9 187,79963 239,42263 136,17663 32 60 142,502 194,125 90,879 58 100 238,37 289,993 186,747 36 51 120,9317 172,5547 69,3087 68 157 374,9819 426,6049 323,3589

67,5 123,5 294,69245 346,31545 243,06945 15,3 55,2 130,99784 182,62084 79,37484 50 95,5 227,58485 279,20785 175,96185

31,5 57,6 136,74992 188,37292 85,12692 34,8 64,5 153,28715 204,91015 101,66415 46 92 219,1964 270,8194 167,5734

52,3 100 238,37 289,993 186,747 27,8 81 192,8327 244,4557 141,2097 17,3 65 154,4855 206,1085 102,8625 44,5 110 262,337 313,96 210,714 19,1 42,1 99,60107 151,22407 47,97807 35 135 322,2545 373,8775 270,6315 18 39,6 93,60932 145,23232 41,98632 34 57 135,3119 186,9349 83,6889

17,4 80 190,436 242,059 138,813 34,8 61 144,8987 196,5217 93,2757 53 69,6 165,51032 217,13332 113,88732 84 250 597,875 649,498 546,252

30,5 64,5 153,28715 204,91015 101,66415 30 125 298,2875 349,9105 246,6645 55 152,3 363,71741 415,34041 312,09441

6) Используя пошаговую множественную регрессию (метод исключения

или метод включения), построить модель формирования цены квартиры

за счёт значимых факторов. Дать экономическую интерпретацию

коэффициентов модели регрессии.

Наиболее широкое применение получили следующие схемы построения

уравнения множественной регрессии:

метод включения – дополнительное введение фактора;

метод исключения – отсев факторов из полного его набора.

Вторая схема пошаговой регрессии основана на последовательном

Исключении факторов с помощью t-критерия. Она заключается в том, что

после построения уравнения регрессии и оценки значимости всех

коэффициентов регрессии из модели исключают тот фактор, коэффициент при

котором незначим и имеет наименьшее значение t-критерия. После этого

получают новое уравнение множественной регрессии и снова производят

оценку значимости всех оставшихся коэффициентов регрессии. Если и среди

них окажутся незначимые, то опять исключают фактор с наименьшим

значением t-критерия. Процесс исключения факторов останавливается на том

шаге, при котором все регрессионные коэффициенты значимы.

Решение: Используя пошаговую регрессию (метод исключения), построим модель формирования цены квартиры в зависимости от значимых факторов.

Шаг 1: Построим модель линейной регрессии формирования цены квартиры от всех трех факторов (Х4, Х5, Х6):

Y = -12,072022 + 2,3759936Х4 + 1,371439Х5 +0,1912182Х6

Проанализируем полученные данные, используя протокол линейной регрессии (Таблица11):

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множестве нный R 0,8336886 R-квадрат 0,6950366 Нормирова нный R- квадрат 0,669623 Стандартн ая ошибка 29,596906 Наблюдени я 40 Дисперсионный анализ

df SS MS F Значимо сть F

Регрессия 3 71871,245 23957,08 27,349 2,145E-

09 Остаток 36 31535,166 875,9768 Итого 39 103406,41

Коэффицие

нты

Стандар тнаяошибка

t- статис тика

P- Значение

Нижние 95%

Верхн ие

95%

Нижн ие

95,0%

Верхн ие

95,0%

Y- пересечени е -12,072022 21,226439 -0,56873 0,57307

- 55,12123

5 30,97

719

- 55,12

12 30,97

719

X4 2,3759936 0,2784193 8,533867 3,6E-10 1,811333

1 2,940

654 1,811

333 2,940

654

X5 1,371439 1,3071968 1,049145 0,3011 -

1,279679 4,022

557

- 1,279

68 4,022

557

X6 0,1912182 2,2767396 0,083988 0,93353

- 4,426223

6 4,808

66

- 4,426

22 4,808

66

t- статистик а таб 2,028094

ВЫВОД ОСТАТКА

Наблюдени е

Предсказан ное Y Остатки

Наблюде ние

Предсказа нное Y

Остатк и таб 11

1 123,73553 -

8,7355292 21 38,9183 16,28174

9

2 105,99306 -

20,993062 22 117,347

- 21,84652

1

3 78,852578 -

9,8525779 23 71,8089 -

14,20886

4 64,676184 -

7,6761837 24 86,3539 -

21,85386

5 145,45997 39,140033 25 110,81

- 18,80955

5

6 34,53967 21,46033 26 116,274 -

16,27385

7 98,636109 -

13,636109 27 59,2996 21,70040

7

8 194,87696 70,123041 28 37,1519 27,84809

7

9 95,140107 -

34,490107 29 109,21 0,790220

3

10 132,73556 -

2,7355582 30 53,2033

- 11,10332

1

11 40,102911 5,8970889 31 89,4572 45,54279

4

12 87,049129 27,950871 32 39,1975 0,402464

6

13 84,849566 -

13,889566 33 81,5955

- 24,59545

6

14 47,151324 -

7,6513244 34 36,3814 43,61862

2

15 49,882985 29,017015 35 86,3539 -

25,35386

16 81,340222 -

21,340222 36 121,636

- 52,03601

5

17 128,82801 -

28,828011 37 210,626 39,37377

18 83,987002 -

32,987002 38 78,4975

- 13,99752

9

19 154,34182 2,6581768 39 71,9003 53,09973

7

20 167,1168 -43,6168 40 130,694 21,60646

2

Коэффициент детерминации (R2=0,6950366) и (R2 нормированный=0,669623)

высокий, значимость модели (F=2,145E-09) очень низкая, практически не

значимая, вычисляем табличное значение t-критерия Стьюдента=2,028 (при

вероятности=0,05) и сравниваем с табличными значениями t-статистика,

значим только один фактор Х4, такой моделью пользовать нельзя, так как все

факторы, используемые в модели, должны быть значимыми. Исключаем фактор

Х6 с самым низким значением по модулю t-статистика=0,083988.

Шаг 2: Построим модель линейной регрессии формирования цены квартиры от двух факторов (Х4, Х5):

Y = -10,73261 + 2,3825655Х4 - 1,4172437Х5

Проанализируем полученные данные, используя протокол линейной регрессии (Таблица12):

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множестве нный R 0,8336527 таб12 R-квадрат 0,6949769 Нормирова нный R- квадрат 0,6784892 Стандартн ая ошибка 29,197068 Наблюдени я 40 Дисперсио нный анализ

df SS MS F Значимо сть F

Регрессия 2 71865,065

9 35932,5 42,15114 2,885E-

10

Остаток 37 31541,345

2 852,469

Итого 39 103406,41

1

Коэффицие

нты

Стандар тнаяошибка

t- статис тика

P- Значение

Нижние 95%

Верхн ие

95%

Нижн ие

95,0%

Верхн ие

95,0% Y- пересечени е -10,73261

13,818989 3 -0,77666 0,442299

- 38,73254

17,26 733

- 38,73

25 17,26

733

X4 2,3825655 0,2635880

7 9,03897 6,69E-11 1,848485

3 2,916

646 1,848

485 2,916

646

X5 1,4172437 1,1719455

7 1,20931 0,234215 -

0,957344 3,791

831

- 0,957

34 3,791

831

t- статист 2,02619

икатаб

ВЫВОД ОСТАТКА

Наблюдени е

Предсказан ное Y Остатки

Наблюде ние

Предсказа нное Y

Остатк и

1 124,48645 -

9,4864527 21 38,47584 16,72416

2 105,95162 -

20,951624 22 116,8991 -

21,39913

3 78,778083 -

9,7780827 23 71,40443 -

13,80443

4 64,544168 -

7,5441678 24 86,35311 -

21,85311

5 145,55139 39,048606

6 25 111,6206 -19,6206

6 34,749804 21,250196 26 116,7101 -

16,71006

7 99,194372 -

14,194372 27 59,75445 21,24555

4

8 194,04507 70,954931

5 28 37,572 27,42800

4

9 94,91805 -34,26805 29 109,464 0,536005

3

10 133,57709 -

3,5770882 30 53,19856 -

11,09856 11 39,753192 6,2468085 31 89,66411 45,33589

12 87,404501 27,595499

4 32 39,23979 0,360208

3

13 84,270279 -

13,310279 33 81,61257 -

24,61257

14 46,83941 -7,33941 34 36,39301 43,60699

1

15 49,374163 29,525837

1 35 86,35311 -

25,35311

16 81,09917 -21,09917 36 121,2123 -

51,61234

17 128,87344 -

28,873435 37 210,6615 39,33845

1

18 83,543214 -

32,543214 38 78,94257 -

14,44257

19 154,11633 2,8836665

5 39 72,08231 52,91769

2

20 167,09749 -

43,597488 40 130,2292 22,07079

9

Коэффициент детерминации (R2=0,6949769) и (R2 нормированный=0,6784892)

высокий. Значимость модели (F=2,885E-10) еще ухудшилась, по сравнению с

первой моделью - очень низкая, практически не значимая. Вычисляем

табличное значение t-критерия Стьюдента=2,028 (при вероятности = 0,05) и

сравниваем с табличными значениями t-статистика, значим только один фактор

Х4, такой моделью пользовать нельзя, так как все факторы, используемые в

модели, должны быть значимыми. Исключаем фактор Х6 с самым низким

значением по модулю t-статистика= 1,20931.

Ответ: Получили однофакторную модель со значимым фактором Х4

у=-10,73+2,38X4 (см. табл. ).

ВЫВОД ИТОГОВ

Регрессионнаястатистика

Множестве нный R 0,82639024 R-квадрат 0,68292083 Нормирова нный R- квадрат 0,67457665

Стандартна я ошибка 29,3741824 Наблюдени я 40 Дисперсионный анализ

df SS MS F Значимо сть F

Регрессия 1 70618,39 70618,39 81,84389 5,12E-11 Остаток 38 32788,02 862,8426 Итого 39 103406,4

Коэффицие

нты

Стандар тнаяошибка

t- статис тика

P- Значение

Нижние 95%

Верхн ие

95%

Нижн ие

95,0 %

Верхн ие

95,0% Y- пересечени е -1,3017262 11,47739 -0,11342 0,910297 -24,5365

21,93 3

- 24,53

6 21,933

04

X4 2,39671802 0,264926 9,046761 5,12E-11 1,8604 2,933

03 1,860

4 2,9330

32 ВЫВОД ОСТАТКА

Наблюдени е

Предсказан ное Y Остатки

Наблюде ние

Предсказа нное Y

Остатк и

1 121,88958 -6,88958 21 35,36806 19,8319 2 108,947303 -23,9473 22 118,5342 -23,0342 3 80,1866865 -11,1867 23 74,19489 -16,5949 4 72,9965324 -15,9965 24 82,10406 -17,6041 5 154,484945 30,11505 25 108,9473 -16,9473 6 41,5995264 14,40047 26 124,0466 -24,0466 7 92,1702766 -7,17028 27 65,32703 15,673 8 190,435716 74,56428 28 40,1615 24,8385 9 89,294215 -28,6442 29 105,3522 4,64777

10 135,311201 -5,3112 30 44,47559 -2,37559 11 46,6326342 -0,63263 31 82,5834 52,4166 12 94,5669946 20,43301 32 41,8392 -2,2392 13 87,1371688 -16,1772 33 80,18669 -23,1867 14 46,6326342 -7,13263 34 40,40117 39,5988 15 39,2028083 39,69719 35 82,10406 -21,1041 16 75,3932505 -15,3933 36 125,7243 -56,1243 17 137,707919 -37,7079 37 200,0226 49,9774 18 84,9801226 -33,9801 38 71,79817 -7,29817 19 161,675099 -4,6751 39 70,59981 54,4002

20 160,47674 -36,9767 40 130,5178 21,7822

Коэффициент детерминации (R2=0,68292083) высокий хорошее качество модели.

68% вариации зависимой переменной Y учтено в модели и обусловлено

влиянием включенного фактора Х4 (жилой площади квартиры). Значимость

модели (F=5,12E-11) еще ухудшилась, по сравнению с первой и второй

моделью - очень низкая, практически не значимая. Вычисляем табличное

значение t-критерия Стьюдента=2,028 (при вероятности=0,05) и сравниваем с

табличными значениями t-статистика=9,046761>2,028 - tтабл., фактор Х4 –

значим.

Из данного уравнения видно, как коэффициенты уравнения регрессии

показывают – что при увеличении общей площади квартиры на один

квадратный метр цена квартиры увеличивается на 2,38 тысяч долларов.

7) Оценить качество построенной модели. Дать оценку влияния значимых

факторов на результат с помощью коэффициентов эластичности, β- и ∆-

коэффициентов.

Качество модели осталось прежним, модель уравнения парной регрессии со

значимым фактором не изменилась.

Коэффициент детерминации (R2= 0,674576) высокий хорошее качество модели.

68% вариации зависимой переменной Y учтено в модели и обусловлено

влиянием включенного фактора Х4 (жилая площадь квартиры).Вычисляем

табличное значение t-критерия Стьюдента=2,028 (при вероятности=0,05) и

сравниваем с табличными значениями t-статистика= 9,04676 >2,028 - tтабл.,

фактор Х4 – значим.Средняя относительная ошибка аппроксимации Е=26,25%

7.1. Качество модели регрессии проверяется на основе анализа остатков

регрессии ε. Анализ остатков позволяет получить представление, насколько

хорошо подобрана сама модель и насколько правильно выбран метод оценки

коэффициентов. Согласно общим предположениям регрессионного анализа,

остатки должны вести себя как независимые (в действительности почти

независимые) одинаково распределённые случайные величины.

Построим график остатков регрессии и проведем его визуальный анализ.

Предсказываемые уравнением регрессии значения результата ty и остатков ttt yye ˆ−= (t=1, 2, …, n; n=40) приведены в таблице 15

Проверку не зависимости проведем с помощью d-критерия Дарбина-Уотсона. Определяем по формуле:

22,2 018,32788

09,72689 )(

1

2

2

2 1

== −

= ∑

=

= −

n

t t

n

t tt

e

ee d

dw ' = 1,78

Критические значения d-критерия для числа наблюдений n=40 и уровня

значимости а=0,05 составляют d1=1,44 и d2=1,54 (см. приложение). Так как

расчетное значение не попало в интервал d1и d2 то данные показывают

отсутствие автокорреляции.

7.2. Чтобы оценить нарушение гомоскедастичности по тесту Голдфельда - Квандта необходимо выполнить следующие шаги.

1. Упорядочение п наблюдений по мере возрастания перемен- ной х.

2. Исключение d средних наблюдений ( d должно быть примерно равно четверти общего количества наблюдений).

3. Разделение совокупности на две группы (соответственно с малыми и большими значениями фактора x ) и определение по каждой из групп уравнений регрессии.

4. Определение остаточной суммы квадратов для первой

регрессии

1 2

ˆ1 1 1

ˆ( ) n

y i i i

S y y =

= −∑ и второй регрессии

2 ˆ2 2

1 1

ˆ ( ) n

y i i i n n

S y y = − +

= −∑ .

5. Вычисление отношений ˆ2

ˆ1

y

y

S S (или

ˆ1

ˆ2

y

y

S S ). В числителе должна

быть большая сумма квадратов.

Полученное отношение имеет F распределение со степенями свободы k1=n1-k и k2=n-n1-k, (k– число оцениваемых параметров в уравнении регрессии).

Если

ˆ1 ( ; 1; 2 )

ˆ2

y набл кр

y

S F F

S α ν ν = >

, то гетероскедастичность имеет место. Чем больше величина F превышает табличное значение F -критерия, тем

более нарушена предпосылка о равенстве дисперсий остаточных величин.

Проверку значимости уравнения регрессии произведем на основе вычесления F-критерия Фишера: F=10206,66/6067,613=1,685 При доверительной вероятности 0,95 при ν1=k=14 и ν2=14 оно составляет Fтаб=

2,48.

Поскольку Fрасч <Fтабл, гетероскедастичность отсутствует. Таблица(16,17,18)

7.3. Эластичность Y по отношению к Х(j) определяется как процентное изменение Y, отнесенное к соответствующему процентному изменению Х. В общем случае эластичности не постоянны, они различаются, если измерены для различных точек на линии регрессии. По умолчанию стандартные программы, оценивающие эластичность, вычисляют ее в точках средних значений:

/jj j

x y x Э a

y y x

δ δ= ⋅ ≈

Эластичность не нормирована и может изменяться от -∞ до + ∞ . Важно,

что она безразмерна, так что интерпретация эластичности =2.0 означает, что

если изменится на 1%, то это приведет к изменению на 2%. Если =-0.5,

то это означает, что увеличение на 1% приведет к уменьшению на 0.5%. Высокий уровень эластичности означает сильное влияние независимой

переменной на объясняемую переменную.

Эх4=2,3967*39,62/93,65=1,013

Э.=1,14 означает, что если среднее значение общей площади квартиры

3х =39,6175, изменится на 1%, это приведет к изменению y =93,65025

среднего значения цены квартиры на 1,013%

ˆ j x

j j y

S a

S β = ⋅

где Sxj среднеквадратическое отклонение фактора j

где 2 21 ( )

1xj i S x x

n = −

− ∑ 2 21 ( )

1y i S y y

n = −

− ∑ . SІх4=1/39*12293,73=17,75 SІу=1/39*103406,41=51,49

βх4=2,3967*17,75/51,49=0,8262

Итак, коэффициент Bх4 показывает, что при увеличении жилой площади квартиры на 17,75 кв. м. цена квартиры увеличится на 42,22 тыс. дол.(0,826*51,49) . Коэффициент эластичности показывает, на сколько процентов изменяется зависимая переменная при изменении фактора j на один процент. Однако он не учитывает степень колеблемости факторов. Бета-коэффициент показывает, на какую часть величины