Парная регрессия -  упражнение  - Эконометрика, Упражнения из Эконометрика. Modern Institute of Managament
wklev85
wklev8525 March 2013

Парная регрессия - упражнение - Эконометрика, Упражнения из Эконометрика. Modern Institute of Managament

PDF (377.5 KB)
33 страница
364количество посещений
Описание
Задачи, тесты и упражнения по предмету Эконометрика. Тема Парная регрессия. Задачи и решения. Упражнения с ответами.
20очки
пункты необходимо загрузить
этот документ
скачать документ
предварительный показ3 страница / 33
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
Парная регрессия - лабораторная работа - Эконометрика

Всероссийский заочный финансово-экономический институт

Лабораторная работа

По дисциплине

«Эконометрика»

Тема:

«Парная регрессия»

Уфа – 2007 г.

Вариант 4

X 36 28 43 52 51 54 25 37 51 29 Y 104 77 117 137 143 144 82 101 132 77

Требуется:

1. Для характеристики Y от X построить следующие модели: a. Линейную; b. Степенную; c. Показательную; d. Гиперболическую.

2. Оценить каждую модель по: a. Индексу корреляции; b. Средней относительной ошибки; c. Коэффициенту детерминации; d. F – критерию Фишера.

3. Составив сводную таблицу вычислений, выбрать лучшую модель, дать интерпритацию расчитанных характеристик.

4. Осуществить прогнозирование среднего значения показателя Y при уровне значимости α=0,1, если прогнозное значение фактора X составит 80% от его максимального значения.

5. Представить графически: фактические и модельные значения Y, точки прогноза.

РЕШЕНИЕ:

1. Построение линейной модели парной регрессии 1) Вводим данные по колонкам в Microsoft Excel и сохраняем на

компьютере. 2) Открываем программу СтатЭксперт:

Пуск-Программы-Olimp-СтатЭксперт 3) Импортируем сохраненные данные в СтатЭксперт 4) Выделяем цифровые значения показателей X и Y 5) На панели инструментов нажимаем команду СтатЭксперт-Регрессия

Появляется окно «Установка блока данных», ставим метки напротив «ввода данных по колонкам», остальные метки снимаем. Далее нажимаем кнопку «Установить»

6) В появившемся окне «Регрессионный анализ» переводим все доступные переменные в список выбранных переменных: Показатель А – фактор Х Показатель В – фактор Y

7) Устанавливаем зависимую переменную - Показатель В. 8) В появившемся окне «Формирование набора моделей» устанавливаем в

списке выбранных моделей – линейную модель: Y = a+b*X. Нажимаем «Вычислить».

9) После подсчета модели СтатЭксперт создаст протокол регрессионного анализа по линейной модели (табл.1), который необходимо сохранить на компьютере.

Таблица 1

Протокол регрессионного анализа линейной модели Парная регрессия. Y = Показатель-B X = Показатель-A Таблица функций парной регрессии

Функция Критерий Эластич ность

Y(X)=+13.892+2.402*X 25,968 0,875 Выбрана функция Y(X)=+13.892+2.402*X Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

Фактор X

1 104,000 100,352 3,648 3,507 36,000 2 77,000 81,139 -4,139 -5,375 28,000 3 117,000 117,164 -0,164 -0,140 43,000 4 137,000 138,779 -1,779 -1,299 52,000 5 143,000 136,377 6,623 4,631 51,000 6 144,000 143,582 0,418 0,290 54,000 7 82,000 73,934 8,066 9,837 25,000 8 101,000 102,754 -1,754 -1,737 37,000 9 132,000 136,377 -4,377 -3,316 51,000 10 77,000 83,541 -6,541 -8,494 29,000

Характеристики остатков

Характеристика Значение Среднее значение 0,000 Дисперсия 20,774 Приведенная дисперсия 25,968 Средний модуль остатков 3,751 Относительная ошибка 3,863 Критерий Дарбина-Уотсона 1,707 Коэффициент детерминации 0,998 F - значение ( n1 = 1, n2 = 8) 5023,883 Критерий адекватности 77,905 Критерий точности 69,392 Критерий качества 71,520 Уравнение значимо с вероятностью 0.95

10)На основе протокола регрессионного анализа линейной модели

выводим графики Показателя В (Y-X) (рис.1) и график относительной ошибки % (рис.2)

Показатель-B(Y-X)

73.000

83.000

93.000

103.000

113.000

123.000

133.000

143.000

153.000

25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000

Показатель-A

Факт

Расчет

Возврат в ОТЧЕТ

Рис.1Показатель В (Y-X) линейной модели

Относительная ошибка %

-10.000

-5.000

0.000

5.000

10.000

15.000

1 2 3 4 5 6 7 8 9 10

Возврат в ОТЧЕТ

рис.2 Относительная ошибка линейной модели, %

2. Построение гиперболической модели парной регресии C пункта 1-7 выполнить шаги как описано выше 8) В появившемся окне «Формирование набора моделей» устанавливаем в

списке выбранных моделей – гиперболическую модель: Y = a+b/X. Нажимаем «Вычислить».

9) После подсчета модели СтатЭксперт создаст протокол регрессионного анализа по гиперболической модели (табл.2), который необходимо сохранить на компьютере.

Таблица 2 Протокол регрессионного анализа гиперболической модели

Парная регрессия. Y = Показатель-B X = Показатель-A Таблица функций парной регрессии

Функция Критерий Эластич ность

Y(X)=+198.762-3293.898/X 68,292 -0,690 Выбрана функция Y(X)=+198.762-3293.898/X Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

Фактор X

1 104,000 107,264 -3,264 -3,139 36,000 2 77,000 81,122 -4,122 -5,354 28,000 3 117,000 122,159 -5,159 -4,410 43,000 4 137,000 135,417 1,583 1,155 52,000 5 143,000 134,175 8,825 6,171 51,000 6 144,000 137,764 6,236 4,331 54,000 7 82,000 67,006 14,994 18,286 25,000 8 101,000 109,737 -8,737 -8,651 37,000 9 132,000 134,175 -2,175 -1,648 51,000

10 77,000 85,179 -8,179 -10,622 29,000 Характеристики остатков

Характеристика Значение Среднее значение 0,000 Дисперсия 54,634 Приведенная дисперсия 68,292 Средний модуль остатков 6,328 Относительная ошибка 6,377 Критерий Дарбина-Уотсона 1,511 Коэффициент детерминации 0,996 F - значение ( n1 = 1, n2 = 8) 1905,331 Критерий адекватности 69,960 Критерий точности 52,277 Критерий качества 56,697 Уравнение значимо с вероятностью 0.95

10)На основе протокола регрессионного анализа гиперболической модели

выводим графики Показателя В (Y-X) (рис.3) и график относительной ошибки % (рис.4)

Рис.3 Показатель В (Y-X) гиперболической модели

Показатель-B(Y-X)

67.000

77.000

87.000

97.000

107.000

117.000

127.000

137.000

147.000

157.000

25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000

Показатель-A

Факт

Расчет

Возврат в ОТЧЕТ

рис.4 Относительная ошибка гиперболической модели, %

Относительная ошибка %

-15.000

-10.000

-5.000

0.000

5.000

10.000

15.000

20.000

1 2 3 4 5 6 7 8 9 10

Возврат в ОТЧЕТ

3. Построение показательной модели парной регрессии

C пункта 1-7 выполнить шаги как описано выше 8) В появившемся окне «Формирование набора моделей» устанавливаем в

списке выбранных моделей – показательная модель: Y = a+b**X. Нажимаем «Вычислить».

9) После подсчета модели СтатЭксперт создаст протокол регрессионного анализа по показательной модели (табл.3), который необходимо сохранить на компьютере.

Таблица 3 Протокол регрессионного анализа показательной модели

Парная регрессия. Y = Показатель-B X = Показатель-A Таблица функций парной регрессии

Функция Критерий Эластич ность

Y(X)= (+43.677)*(+1.023)**X 27.333 0.908 Выбрана функция Y(X)= (+43.677)*(+1.023)**X Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

Фактор X

1 104.000 97.732 6.268 6.027 36.000 2 77.000 81.716 -4.716 -6.125 28.000 3 117.000 114.302 2.698 2.306 43.000 4 137.000 139.798 -2.798 -2.042 52.000 5 143.000 136.705 6.295 4.402 51.000 6 144.000 146.195 -2.195 -1.524 54.000 7 82.000 76.412 5.588 6.815 25.000 8 101.000 99.944 1.056 1.046 37.000 9 132.000 136.705 -4.705 -3.564 51.000 10 77.000 83.565 -6.565 -8.526 29.000

Характеристики остатков

Характеристика Значение Среднее значение 0.093 Дисперсия 21.857 Приведенная дисперсия 27.333 Средний модуль остатков 4.288 Относительная ошибка 4.238 Критерий Дарбина-Уотсона 2.188 Коэффициент детерминации 0.998 F - значение ( n1 = 1, n2 = 8) 4772.591 Критерий адекватности 71.669 Критерий точности 66.698 Критерий качества 67.941 Уравнение значимо с вероятностью 0.95

10)На основе протокола регрессионного анализа показательной модели выводим графики Показателя В (Y-X) (рис.5) и график относительной ошибки % (рис.6)

Показатель-B(Y-X)

76.000

86.000

96.000

106.000

116.000

126.000

136.000

146.000

156.000

25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000

Показатель-A

Факт

Расчет

Рис.5 Показатель В (Y-X) показательной модели

Относительная ошибка %

-10,000

-8,000

-6,000

-4,000

-2,000

0,000

2,000

4,000

6,000

8,000

1 2 3 4 5 6 7 8 9 10

рис.6 Относительная ошибка показательной модели, %

4. Построение степенной модели парной регрессии C пункта 1-7 выполнить шаги как описано выше 8) В появившемся окне «Формирование набора моделей» устанавливаем в

списке выбранных моделей – степенная модель: Y = a+ X**b. Нажимаем «Вычислить».

9) После подсчета модели СтатЭксперт создаст протокол регрессионного анализа по степенной модели (табл.4), который необходимо сохранить на компьютере.

Таблица 4 Протокол регрессионного анализа степенной модели

Парная регрессия. Y = Показатель-B X = Показатель-A Таблица функций парной регрессии

Функция Критерий Эластич ность

Y(X)= (+4.661)*X**(+0.858) 26.991 0.858 Выбрана функция Y(X)= (+4.661)*X**(+0.858) Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

Фактор X

1 104.000 100.771 3.229 3.105 36.000 2 77.000 81.231 -4.231 -5.495 28.000 3 117.000 117.361 -0.361 -0.308 43.000 4 137.000 138.138 -1.138 -0.831 52.000 5 143.000 135.856 7.144 4.995 51.000 6 144.000 142.683 1.317 0.915 54.000 7 82.000 73.707 8.293 10.114 25.000 8 101.000 103.167 -2.167 -2.146 37.000 9 132.000 135.856 -3.856 -2.922 51.000 10 77.000 83.713 -6.713 -8.718 29.000

Характеристики остатков

Характеристика Значение Среднее значение 0.152 Дисперсия 21.570 Приведенная дисперсия 26.991 Средний модуль остатков 3.845 Относительная ошибка 3.955 Критерий Дарбина-Уотсона 1.588 Коэффициент детерминации 0.998 F - значение ( n1 = 1, n2 = 8) 4833.032 Критерий адекватности 72.340 Критерий точности 68.726 Критерий качества 69.629 Уравнение значимо с вероятностью 0.95

10)На основе протокола регрессионного анализа степенной модели выводим графики Показателя В (Y-X) (рис.7) и график относительной ошибки % (рис.8)

Показатель-B(Y-X)

73.000

83.000

93.000

103.000

113.000

123.000

133.000

143.000

153.000

25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000

Показатель-A

Факт

Расчет

Возврат в ОТЧЕТ

Рис.7 Показатель В (Y-X) степенной модели

Относительная ошибка %

-10.000

-5.000

0.000

5.000

10.000

15.000

1 2 3 4 5 6 7 8 9 10

Возврат в ОТЧЕТ

Рис.8 Относительная оценка степенной модели, %

Показатель-B(Y-X)

73.000

83.000

93.000

103.000

113.000

123.000

133.000

143.000

153.000

25.000 30.000 35.000 40.000 45.000 50.000 55.000 60.000

Показатель-A

Факт

Расчет

Возврат в ОТЧЕТ

Для выбора лучшей модели построим сводную таблицу результатов (таблица 5)

Таблица 5

Параметры Коэффициент детерминации R**

F- критерий Фишера

Индекс корреляции p yx (ryx)

Средняя относительная ошибка Eотн Модель

1.Линейная 0,998 5023,883 0,9990 3,863 2.Степенная 0,998 4833,032 0,9990 3,955 3.Показательная 0,998 4772,591 0,9990 4,238 4.Гиперболическая 0,996 1905,331 0,9980 6,377

Из сводной таблицы видно, что лучшей моделью является линейная

Y(X)=13,892+2,402X Осуществим прогнозирование среднего значения показателя Y при уровне значимости α=0,1, если прогнозное значение фактора X составит 80% от его максимального значения.

.2,43 %100

54%80 %80. ðóáìëíÕìàõÕïðîãí =×=×=

Подставим Хпрогн. в нашу модель и расчитаем Y(Xпрогн) Y(X)=13,892+2,402 х 43,2 = 117,66 млн руб. Отметим графически фактические и модельные значения Y, точки прогноза (рис.9)

Рис.9Прогноз по лучшей модели

МНОЖЕСТВЕННАЯ РЕГРЕССИЯ

Вариант 1.3 точки с 6 по 46 По данным о рынке жилья в Московской области, представленным в табл. 1, исследуется зависимость между ценой квартиры Y (тыс. долл.) и следующими основными факторами:

X1 – город области (1- Подольск, 2-Люберцы);

X2 – число комнат в квартире;

X3 – общая площадь квартиры (м 2);

X4 – жилая площадь квартиры (м 2);

X5 – этаж квартиры;

X6 – площадь кухни (м 2).

Y-цена квартиры, тыс. долл. Исходные данные взяты из журнала «Недвижимость и цены» 1-7 мая 2006 г.

Таблица 1 – Исходные данные

№ Y X1 X2 X3 X4 X5 X6

1 115 2 4 70,4 51,4 9 7

2 85 1 3 82,8 46 5 10

3 69 1 2 64,5 34 6 10

4 57 1 2 55,1 31 1 9

5 184,6 2 3 83,9 65 1 9

6 56 1 1 32,2 17,9 2 7

7 85 2 3 65 39 12 8,3

8 265 2 4 169,5 80 10 16,5

9 60,65 1 2 74 37,8 11 12,1

10 130 2 4 87 57 6 6

11 46 1 1 44 20 2 10

12 115 2 3 60 40 2 7

13 70,96 2 2 65,7 36,9 5 12,5

14 39,5 1 1 42 20 7 11

15 78,9 2 1 49,3 16,9 14 13,6

16 60 1 2 64,5 32 11 12

17 100 1 4 93,8 58 1 9

18 51 1 2 64 36 6 12

19 157 2 4 98 68 2 11

20 123,5 1 4 107,5 67,5 12 12,3

21 55,2 2 1 48 15,3 9 12

22 95,5 1 3 80 50 6 12,5

23 57,6 2 2 63,9 31,5 5 11,4

24 64,5 1 2 58,1 34,8 10 10,6

25 92 1 4 83 46 9 6,5

26 100 1 3 73,4 52,3 2 7

27 81 2 2 45,5 27,8 3 6,3

Таблица 1 – Исходные данные № Y X1 X2 X3 X4 X5 X6

28 65 1 1 32 17,3 5 6,6

29 110 2 3 65,2 44,5 10 9,6

30 42,1 1 1 40,3 19,1 13 10,8

31 135 2 2 72 35 12 10

32 39,6 1 1 36 18 5 8,6

33 57 1 2 61,6 34 8 10

34 80 2 1 35,5 17,4 4 8,5

35 61 1 2 58,1 34,8 10 10,6

36 69,6 1 3 83 53 4 12

37 250 1 4 152 84 15 13,3

38 64,5 1 2 64,5 30,5 12 8,6

39 125 2 2 54 30 8 9

40 152,3 2 3 89 55 7 13

41 38 1 1 41,9 19 12 9,5

42 62,2 1 2 69 36 9 10

43 125 2 3 67 41 11 8

44 61,1 1 2 58,1 34,8 10 10,6

45 67 2 1 32 18,7 2 6

46 93 2 2 57,2 27,7 1 11,3

47 118 1 3 107 59 2 13

48 132 2 3 81 44 8 11

49 92,5 2 3 89,9 56 9 12

50 105 1 4 75 47 8 12

51 42 1 1 36 18 8 8

52 125 1 3 72,9 44 16 9

53 170 2 4 90 56 3 8,5

54 38 2 1 29 16 3 7

55 130,5 2 4 108 66 1 9,8

56 85 2 2 60 34 3 12

57 98 2 4 80 43 3 7

58 128 2 4 104 59,2 4 13

59 85 2 3 85 50 8 13

60 160 1 3 70 42 2 10

61 60 2 1 60 20 4 13

62 41 1 1 35 14 10 10

63 90 1 4 75 47 5 12

64 83 2 4 69,5 49,5 1 7

65 45 2 1 32,8 18,9 3 5,8

66 39 2 1 32 18 3 6,5

67 86,9 2 3 97 58,7 10 14

68 40 2 1 32,8 22 2 12

Таблица 1 – Исходные данные № Y X1 X2 X3 X4 X5 X6

69 80 2 2 71,3 40 2 10

70 227 2 4 147 91 2 20,5

71 235 2 4 150 90 9 18

72 40 1 1 34 15 8 11

73 67 1 1 47 18,5 1 12

74 123 1 4 81 55 9 7,5

75 100 2 3 57 37 6 7,5

76 105 1 3 80 48 3 12

77 70,3 1 2 58,1 34,8 10 10,6

78 82 1 3 81,1 48 5 10

79 280 1 4 155 85 5 21

80 200 1 4 108,4 60 4 10

1. Корреляционный анализ модели. Рассчитать матрицу парных коэффициентов корреляции. Построить линейную

регрессионную модель на основе значимых факторов. Вводим исходные данные (таблица 1) в Microsoft Excel. Сохраняем на

компьютере. Расчет матрицы парных коэффициентов корреляции выполняем следующим образом:

• инициализируем программу «Олимп:СтатЭксперт, указать включение макросов, щелкнуть ОК

• Импортируем исходные данные в СтатЭксперт Файл – Открыть – Исходные данные • Выделяем точки с 6 по 46, на панели инструментов нажимаем

«СтатЭксперт». • В меню СтатЭксперт выбрать функцию Корреляция • Установим шаблон данных: Укажем ориентацию таблицы по столбцам,

остальные метки снимем. Щелкнуть Установить. • В окне корреляционный анализ в список выбранных переменных

добавляем все показатели Соответствие переменных:

Показатель А – Y Показатель B – X1 Показатель C – X2 Показатель D – X3 Показатель E – X4 Показатель F – X5 Показатель G – X6

• Осуществляем выбор зависимой переменной, для этого щелкнем Выбор и выберем показатель А, соответствующий значениям Y

• Установить вид корреляции – линейная. Вычислить. После выполнения этих действий программа осуществит расчет. Протокол корреляционного анализа сохраняем на компьютере (Таблица 2)

По матрице парных корреляций Таблицы 2 устанавливаем наличие мультиколлиниарности и ослабляем ее при наличии, используя два метода:

I метод: С помощью определителя парных коэффициентов корреляции между факторами:

det A =

1 0,103 0,039 0,023 -0,135 -0,024

= 0,007610069

0,103 1 0,832 0,933 0,042 0,122 0,039 0,832 1 0,942 0,251 0,108 0,023 0,933 0,942 1 0,108 0,346 -0,135 0,042 0,251 0,108 1 0,386 -0,024 0,122 0,518 0,346 0,386 1

При расчете det A = 0,007610069 0, следовательно, существует мульти- коллинеарность между факторами х1, х2, х3, х4, х5, х6.

II метод: По значению парного коэффициента корреляции между факторами: Коэффициент корреляции R между двумя переменными указывает на силу связи между факторами и принимает значения между -1 и +1. При этом если значение находится ближе к 1, то это означает наличие сильной связи, а если к 0 – слабой. Анализ матрицы коэффициентов парной корреляции показывает, что зависимая переменная, т.е. цена квартиры, имеет тесную связь с индексом числа комнат в квартире (ryx2 = 0,715), с общей площадью квартиры (ryx3 = 0,854), с жилой площадью квартиры (ryx4 = 0,811). Однако факторы х2 и х3 (показатель С и D), х2 и х4 (показатель С и Е), х3 и х4 (показатель D и Е) тесно связаны между собой, т.к. значение парного коэффициента корреляции между факторами:

rx2x3 – 0,832 ≥ 0,8 rx2x4 – 0,933 ≥ 0,8 rx3x4 – 0,942 ≥ 0,8, что свидетельствует о наличии мультиколлиниарности. Т.е.

х2, х3, х4 – несут одну и ту же экономическую информацию, характеризующую одну и ту же сторону исследования цены квартиры (Y) на рынке жилья в Московской области. Поэтому один из этих факторов необходимо исключить из перечня факторов. Либо оставляем все факторы, при условии, что оба фактора важны для исследования цены квартиры. Исключим тот фактор, который менее тесно связан с результативными признаками.

Для исключения х2 или х3 рассматриваем степень тесноты связи каждого фактора с результативным признаком Y (цена квартиры)

rx2y = 0,715 – исключаем rx3y = 0,854

rx2x4 – 0,933 ≥ 0,8 – коэффициент корреляции между общей площадью квартиры и жилой площадью

rx2y = 0,715 - исключаем rx4y = 0,811

rx3x4 – 0,942 ≥ 0,8 – коэффициент корреляции между общей площадью квартиры и жилой площадью:

rx3y = 0,854 rx4y = 0,811 – исключаем

Остались: Х1, Х3, Х5, Х6

Таблица 2 Протокол корреляционного анализа

Матрица парных корреляций

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-E Показатель-F Показатель-G Показатель-A 1.000 0.367 0.715 0.854 0.811 0.163 0.314 Показатель-B 0.367 1.000 0.103 0.039 0.023 -0.135 -0.024 Показатель-C 0.715 0.103 1.000 0.832 0.933 0.042 0.122 Показатель-D 0.854 0.039 0.832 1.000 0.942 0.251 0.518 Показатель-E 0.811 0.023 0.933 0.942 1.000 0.108 0.346 Показатель-F 0.163 -0.135 0.042 0.251 0.108 1.000 0.386 Показатель-G 0.314 -0.024 0.122 0.518 0.346 0.386 1.000 Критическое значение на уровне 90% при 2 степенях свободы = +0.2048 Матрица максимальных корреляций

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-E Показатель-F Показатель-G Показатель-A 1.000 0.367 0.715 0.854 0.811 0.163 0.314 Показатель-B 0.367 1.000 0.303 -0.272 0.323 0.163 0.242 Показатель-C 0.715 0.303 1.000 0.832 0.933 -0.220 0.312 Показатель-D 0.854 -0.272 0.832 1.000 0.942 0.251 0.518 Показатель-E 0.811 0.323 0.933 0.942 1.000 -0.213 0.346 Показатель-F 0.163 0.163 -0.220 0.251 -0.213 1.000 0.438 Показатель-G 0.314 0.242 0.312 0.518 0.346 0.438 1.000 Матрица оптимальных лагов

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-E Показатель-F Показатель-G Показатель-A 0 0 0 0 0 0 0 Показатель-B 0 0 3 1 3 5 10 Показатель-C 0 3 0 0 0 8 4 Показатель-D 0 1 0 0 0 0 0 Показатель-E 0 3 0 0 0 8 0 Показатель-F 0 5 8 0 8 0 7 Показатель-G 0 10 4 0 0 7 0

Матрица частных корреляций Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-E Показатель-F Показатель-G

Показатель-A 1.000 0.000 -0.545 0.591 0.393 0.000 0.000 Показатель-B 0.000 1.000 0.000 0.000 -0.475 0.000 0.000 Показатель-C -0.545 0.000 1.000 0.239 0.792 0.000 0.000 Показатель-D 0.591 0.000 0.239 1.000 0.302 0.000 0.606 Показатель-E 0.393 -0.475 0.792 0.302 1.000 0.000 0.320 Показатель-F 0.000 0.000 0.000 0.000 0.000 1.000 0.000 Показатель-G 0.000 0.000 0.000 0.606 0.320 0.000 1.000 Критическое значение на уровне 90% при 7 степенях свободы = +0.2053 Множественные корреляции

Переменная Коэффи циент

F-зна чение

%точка F-распред.

Показатель-A 0.950 43.428 100.000 Показатель-B 0.794 8.025 100.000 Показатель-C 0.973 84.585 100.000 Показатель-D 0.980 113.437 100.000 Показатель-E 0.986 163.772 100.000 Показатель-F 0.541 1.950 95.909 Показатель-G 0.855 12.794 100.000

Чем меньше межфакторная связь, тем лучше для исследователя. И чем больше связь между каждым фактором с результативным признаком Y, тем лучше для нас.

rx2y = 0,715 - слабая rx3y = 0,854 – достаточно сильная rx4y = 0,811 – слабая

В результате корреляционного анализа мы уточнили перечень фаторов, на основании которых построим регерессионную модель ŷ = а0 + а1х1 + а3х3 + а5х5 + а6х6 Регрессионный анализ предназначен для исследовния зависимости исследуемой переменной от различных факторов и отображения их взаимосвязи в форме регрессионной модели, т.е. метод отсева незначимых факторных признаков.

а0,а1,а3,а5,а6 – параметры модели а0 – свободный член; а1 - коэффициент регрессии при х1 а3 - коэффициент регрессии при х3 а5 - коэффициент регрессии при х5 а6- коэффициент регрессии при х6

Коэффициент регрессии показывает влияние или изменение результативного показателя на величину ai, если «+», то y увеличивается, если «-» -- y уменьшается

2. Расчет параметров линейного уравнения множественной регрессии со значимыми факторами.

Вводим в Microsoft Excel исходные данные (таблица 3). Оставляя только значимые факторы.

Таблица 3 – Исходные данные № Y X1 X3 X5 X6

6 56 1 32,2 2 7

7 85 2 65 12 8,3

8 265 2 169,5 10 16,5

9 60,65 1 74 11 12,1

10 130 2 87 6 6

11 46 1 44 2 10

12 115 2 60 2 7

13 70,96 2 65,7 5 12,5

14 39,5 1 42 7 11

15 78,9 2 49,3 14 13,6

16 60 1 64,5 11 12

17 100 1 93,8 1 9

18 51 1 64 6 12

19 157 2 98 2 11

20 123,5 1 107,5 12 12,3

21 55,2 2 48 9 12

22 95,5 1 80 6 12,5

23 57,6 2 63,9 5 11,4

Таблица 3 – Исходные данные № Y X1 X3 X5 X6

24 64,5 1 58,1 10 10,6

25 92 1 83 9 6,5

26 100 1 73,4 2 7

27 81 2 45,5 3 6,3

28 65 1 32 5 6,6

29 110 2 65,2 10 9,6

30 42,1 1 40,3 13 10,8

31 135 2 72 12 10

32 39,6 1 36 5 8,6

33 57 1 61,6 8 10

34 80 2 35,5 4 8,5

35 61 1 58,1 10 10,6

36 69,6 1 83 4 12

37 250 1 152 15 13,3

38 64,5 1 64,5 12 8,6

39 125 2 54 8 9

40 152,3 2 89 7 13

41 38 1 41,9 12 9,5

42 62,2 1 69 9 10

43 125 2 67 11 8

44 61,1 1 58,1 10 10,6

45 67 2 32 2 6

46 93 2 57,2 1 11,3

С помощью пакета СтатЭксперт делаем регрессионный анализ для нашей модели ŷ = а0 + а1х1 + а3х3 + а5х5 + а6х6 (таблица 4)

Таблица 4 Протокол регрессионного анализа линейной модели со значимыми факторами

Линейная регрессия. Зависимая переменная - Показатель-A Оценки коэффициентов линейной регрессии

Переменная Коэффи циент

Среднекв отклоне- ние

t- значение

Нижняя оценка

Верхняя оценка

Эластич ность

Бета- коэф-т

Дельта- коэф-т

Св. член -32,932 16,298 -2,021 -50,093 -15,772 0,000 0,000 0,000 Показатель-B 32,962 6,246 5,277 26,386 39,539 0,528 0,122 0,114 Показатель-C 1,600 0,128 12,541 1,466 1,734 1,189 0,919 0,857 Показатель-D 0,543 0,845 0,642 -0,347 1,432 0,045 0,038 0,035 Показатель-E -3,531 1,581 -2,233 -5,196 -1,866 -0,396 -0,007 -0,006 Кpитическое значения t-pаспpеделения пpи 36 степенях свободы (p=85%) = +1.053

Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

1 56,000 27,914 28,086 50,154 2 85,000 114,189 -29,189 -34,340 3 265,000 251,340 13,660 5,155 4 60,650 81,664 -21,014 -34,649 5 130,000 154,254 -24,254 -18,657 6 46,000 36,199 9,801 21,306 7 115,000 105,354 9,646 8,387 8 70,960 96,680 -25,720 -36,245 9 39,500 32,181 7,319 18,529

10 78,900 71,439 7,461 9,456 11 60,000 66,818 -6,818 -11,364 12 100,000 118,864 -18,864 -18,864 13 51,000 63,306 -12,306 -24,129 14 157,000 152,027 4,973 3,168 15 123,500 135,098 -11,598 -9,391 16 55,200 72,297 -17,097 -30,972 17 95,500 87,139 8,361 8,755 18 57,600 97,684 -40,084 -69,591 19 64,500 60,980 3,520 5,458 20 92,000 114,754 -22,754 -24,732 21 100,000 93,831 6,169 6,169 22 81,000 85,170 -4,170 -5,148 23 65,000 30,634 34,366 52,871 24 110,000 108,833 1,167 1,061 25 42,100 33,423 8,677 20,612 26 135,000 119,385 15,615 11,567 27 39,600 29,971 9,629 24,315 28 57,000 67,613 -10,613 -18,620 29 80,000 61,944 18,056 22,569 30 61,000 60,980 0,020 0,033 31 69,600 92,619 -23,019 -33,073 32 250,000 204,391 45,609 18,243 33 64,500 79,367 -14,867 -23,050 34 125,000 91,948 33,052 26,442 35 152,300 133,277 19,023 12,490 36 38,000 40,031 -2,031 -5,343 37 62,200 79,995 -17,795 -28,610 38 125,000 117,905 7,095 5,676 39 61,100 60,980 0,120 0,197 40 67,000 64,088 2,912 4,347 41 93,000 85,148 7,852 8,443

Характеристики остатков

Характеристика Значение Среднее значение 0,000 Дисперсия 337,662 Приведенная дисперсия 384,560 Средний модуль остатков 14,741 Относительная ошибка 18,834 Критерий Дарбина- 2,487

Уотсона Коэффициент детерминации 0,968 F - значение ( n1 = 4, n2 = 36) 270,211 Критерий адекватности 80,937 Критерий точности 0,104 Критерий качества 20,312 Уравнение значимо с вероятностью 0.95

Уравнение линейной регрессии принимает вид: ŷ = -32,932 + 32,962х1 + 1,600х3 + 0,543х5 – 3,531х6

3. Оценка с помощью t – критерия Стьюдента статистической значимости коэффициентов уравнения множественной регрессии при α=0,15 и доверительной вероятности p=0,85.

υ 1 = k = 4 υ 2 = n – k – 1 = 41 – 4 – 1 = 36, где υ - число степеней свободы k – число независимых переменных

Если расчетное значение t – критерия Стьюдента превосходит его табличное значение при заданном уровне значимости, коэффициент регрессии считается значимым. В противном случае фактор, соответствующий этому коэффициенту, следует исключить из модели, при этом оставшиеся в модели параметры должны быть пересчитаны. t1(x1) = 5,277

t3(x3) = 12,541 t5(x5) = 0,642 t6(x6) = -2,233 Значение t – критерия Стьюдента при уровне значимости α=0,15 tтабл. = 1,49665 Из модели следует исключить факторы Х5 и Х6, т.к. не выполняется условие:

tрасч > tтабл. , следовательно, Х5 и Х6 – не значимые факторы. Составим уравнение множественной регрессии со значимыми факторами для

пересчета данных: ŷ = а0 + а1х1 + а3х3 С помощью пакета СтатЭксперт делаем регрессионный анализ для нашей

модели, исходные данные приведены в таблице 5

Таблица 5 – Исходные данные № Y X1 X3

6 56 1 32,2

7 85 2 65

8 265 2 169,5

9 60,65 1 74

10 130 2 87

11 46 1 44

12 115 2 60

Таблица 5 – Исходные данные

13 70,96 2 65,7

14 39,5 1 42

15 78,9 2 49,3

16 60 1 64,5

17 100 1 93,8

18 51 1 64

19 157 2 98

20 123,5 1 107,5

21 55,2 2 48

22 95,5 1 80

23 57,6 2 63,9

24 64,5 1 58,1

25 92 1 83

26 100 1 73,4

27 81 2 45,5

28 65 1 32

29 110 2 65,2

30 42,1 1 40,3

31 135 2 72

32 39,6 1 36

33 57 1 61,6

34 80 2 35,5

35 61 1 58,1

36 69,6 1 83

37 250 1 152

38 64,5 1 64,5

39 125 2 54

40 152,3 2 89

41 38 1 41,9

42 62,2 1 69

43 125 2 67

44 61,1 1 58,1

45 67 2 32

46 93 2 57,2

Модель принимает вид: ^

у = -55,552 + 33,075х1 + 1,464х3

Таблица 6 Протокол регрессионного анализа линейной модели

по двум значимым факторам Линейная регрессия. Зависимая переменная - Показатель-A Оценки коэффициентов линейной регрессии

Переменная Коэффи циент

Среднекв отклонение

t- значе- ние

Нижняя оценка

Верхняя оценка

Эластич ность

Бета- коэф-т

Дельта- коэф-т

Св. член -55,552 12,112 -4,587 -68,294 -42,809 0,000 0,000 0,000 Показатель-B 33,075 6,414 5,156 26,326 39,823 0,530 0,123 0,127 Показатель-C 1,464 0,113 12,973 1,346 1,583 1,089 0,841 0,873 Кpитическое значения t-pаспpеделения пpи 38 степенях свободы (p=85%) = +1.052 Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

1 56,000 24,678 31,322 55,931 2 85,000 105,787 -20,787 -24,456 3 265,00 258,823 6,177 2,331 4 60,650 85,893 -25,243 -41,620 5 130,00 138,005 -8,005 -6,158 6 46,000 41,959 4,041 8,785 7 115,00 98,465 16,535 14,378 8 70,960 106,812 -35,852 -50,525 9 39,500 39,030 0,470 1,190

10 78,900 82,795 -3,895 -4,937 11 60,000 71,980 -11,980 -19,967 12 100,00 114,889 -14,889 -14,889 13 51,000 71,248 -20,248 -39,702 14 157,00 154,114 2,886 1,838 15 123,50 134,952 -11,452 -9,273 16 55,200 80,892 -25,692 -46,543 17 95,500 94,679 0,821 0,859 18 57,600 104,176 -46,576 -80,862 19 64,500 62,608 1,892 2,934 20 92,000 99,073 -7,073 -7,688 21 100,00 85,014 14,986 14,986 22 81,000 77,230 3,770 4,654 23 65,000 24,385 40,615 62,484 24 110,00 106,080 3,920 3,563 25 42,100 36,540 5,560 13,206 26 135,00 116,038 18,962 14,046 27 39,600 30,243 9,357 23,628 28 57,000 67,733 -10,733 -18,830 29 80,000 62,586 17,414 21,768 30 61,000 62,608 -1,608 -2,636 31 69,600 99,073 -29,473 -42,346 32 250,00 200,120 49,880 19,952 33 64,500 71,980 -7,480 -11,597 34 125,00 89,678 35,322 28,257 35 152,30 140,934 11,366 7,463 36 38,000 38,884 -0,884 -2,325 37 62,200 78,570 -16,370 -26,319 38 125,00 108,716 16,284 13,027 39 61,100 62,608 -1,508 -2,468

40 67,000 57,460 9,540 14,238 41 93,000 94,365 -1,365 -1,467

Характеристики остатков

Характеристика Значен ие

Среднее значение 0,000

Дисперсия 384,45

5

Приведенная дисперсия 414,80

7 Средний модуль остатков 14,689 Относительная ошибка 19,125 Критерий Дарбина-Уотсона 2,250 Коэффициент детерминации 0,963 F - значение ( n1 = 2, n2 = 38)

498,70 2

Критерий адекватности 94,136 Критерий точности 0,466 Критерий качества 23,883 Уравнение значимо с вероятностью 0.95

4. Оценка качества модели регрессии 4.1 Проверка качества всего уравнения регрессии Для оценки качества модели регрессии вычисляем коэффициент

множественной корреляции (индекс корреляции) R и коэффициент детерминации R2. Чем ближе к 1 значение этих характеристик, тем выше качество модели.

( ) ( ) 96,0 1241

141 963,011

1

1 11 2

2 =

−− −×−−=

−− −×−−= kn

n RR , где

n = 41 - число число наблюдений k = 2 – число независимых переменных

R2 = 0,963 (Таблица 6)

96,0 2

=R , следовательно, 96% вариаций зависимой переменной учтено в модели и обусловлено влиянием включенных факторов коэффициентов множественной корреляции.

4.2 Проверка значимости модели регрессии Для проверки значимости модели регрессии используем Fитерий Фишера

( ) ( ) ( ) ( ) 45638/04,0 48,0

1241/96,01

2/96,0

1/1

/ 2

2

== −−−

= −−−

= knR

kR F

Fтабл. = 3,25 с υ 1 и υ 2 степенями свободы υ 1 = k = 2 υ 2 = n – k – 1 = 41 – 2 – 1 = 38 Fрасч. > Fтабл. 456 > 3,25, следовательно, модель значима. 4.3 Анализ статистической значимости параметров модели

Проверяем по t – критерию Стьюдента при уровне значимости α=0,15 t1(x1) = 5,156 t3(x3) = 12,973

tтабл. = 1,49665 tрасч > tтабл., следовательно, коэффициенты регрессии (х1 и х2) значимы. 4.4 Оценка адекватности построенной модели по свойству случайности

(свойству поворотных точек)

( ) ( ) 21 90

294116 96,1241

3

2

90

2916 96,12

3

2 ≈ 

  

 −×−−= 

  

 −−−= nnP

Свойство случайности выполняется, следовательно, модель адекватна. 4.5 Обнаружение гетеросдастичности по тесту Голдфелда – Квандта

Sŷ1 = ( ) 07,981678,2456 2 21

1

^

11 =−= 

  

 −∑ =

n

i

yy

Sŷ3 = ( ) 16,38823,258265 2 21

1

^

33

1

=−= 

  

 −∑ +−=

n

nni

yy

71,25 16,38

07,981

^

^

3

1 === y

y íàáë S

S F

Полученное отношение имеет F распределение: Fнабл. = 25,71 – это значение больше критического значения (Fтабл. = 19,50 с υ 1 и υ 2 степенями свободы, υ 1 = k = 2, υ 2 = n – k – 1 = 41 – 2 – 1 = 38) Fнабл. > Fтабл. Поэтому мы можем принять гипотезу о гетероскедастичости на 95% доверительной вероятности.

комментарии (0)
не были сделаны комментарии
Напиши ваш первый комментарий
это только предварительный показ
консультироваться и скачать документ
Docsity не оптимизирован для браузера, который вы используете. Войдите с помощью Google Chrome, Firefox, Internet Explorer 9+ или Safari! Скачать Google Chrome