Множественный корреляционный анализ -  упражнение  - Эконометрика, Упражнения из Эконометрика. Modern Institute of Managament
wklev85
wklev8525 March 2013

Множественный корреляционный анализ - упражнение - Эконометрика, Упражнения из Эконометрика. Modern Institute of Managament

PDF (425.4 KB)
27 страница
624количество посещений
Описание
Задачи, тесты и упражнения по предмету Эконометрика. Тема Множественный корреляционный анализ. Задачи и решения. Упражнения с ответами. Лабораторная работа.
20очки
пункты необходимо загрузить
этот документ
скачать документ
предварительный показ3 страница / 27
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
это только предварительный показ
консультироваться и скачать документ
предварительный показ закончен
консультироваться и скачать документ
Множественный корреляционный анализ - лабораторная работа - Эконометрика

ГОСУДАРСТВЕННОЕ ОБРАЗОВАТЕЛЬНОЕ УЧРЕЖДЕНИЕ ВЫСШЕГО

ПРОФЕССИОНАЛЬНОГО ОБРАЗОВАНИЯ

ВСЕРОССИЙСКИЙ ЗАОЧНЫЙ ФИНАНСОВО-ЭКОНОМИЧЕСКИЙ

ИНСТИТУТ

Лабораторная работа

по эконометрике

тема:

Множественный корреляционный анализ

Уфа, 2007 г.

2

Задача 1

По данным, представленным в табл. 1, исследуется зависимость между

величиной накладных расходов 40 строительных организаций Y (млн. руб.) и

следующими тремя основными факторами:

Х1 – объемом выполненных работ, млн. руб.

Х2 – численность рабочих, чел.

Х3 – фонд заработной платы, млн. руб.

Таблица 7 № п/п

Накладные расходы, млн. руб.

Объем работ, млн. руб.

Численность рабочих, чел.

Фонд заработной платы рабочих, млн. руб.

1 3,5 11,9 980 5,754 2 4,0 12,1 675 5,820 3 3,1 11,2 1020 4,267

… … … … … 38 1,6 7,4 159 1,570 39 1,2 2,2 162 1,142 40 1,5 2,6 101 0,429

Задание:

1. Используя пошаговую множественную регрессию (метод исключения

или метод включения), построить модель для зависимой переменной

«Накладные расходы» за счет значимых факторов. Рассчитать индекс

корреляции R и оценить качество полученного уравнения регрессии с помощью

коэффициента детерминации R2.

2. Оценить статистическую значимость уравнения регрессии, используя

критерий Фишера F (α = 0,05).

3. Дать сравнительную оценку силы связи факторов с результатом с

помощью коэффициентов эластичности, β- и ∆-коэффициентов.

4. Ранжировать предприятия по степени их эффективности.

3

МНОЖЕСТВЕННЫЙ КОРРЕЛЯЦИОННО-

РЕГРЕССИОННЫЙ АНАЛИЗ

Решение задачи с помощью ППП СтатЭксперт

Корреляционный анализ

1. Создать файл исходных данных в среде Excel.

• Пуск → Программы → Microsoft Excel.

• В появившейся книге внести данные. Для этого в ячейке А1 записать «X»,

в ячейке А2 «Y» и далее числовые данные (рис. 27).

Рис. 27

• Сохранить таблицу данных в формате Excel (Файл → Сохранить).

• Свернуть окно Excel и перенести файл исходных данных в среду Word и

сохранить в Word.

2. Запуск программы «СтатЭксперт».

• Пуск → Программы → Olymp → СтатЭксперт → Включить макросы.

• На экране появится картинка «СтатЭксперт». Дать команду «Начало

работы». Появится таблица программы «СтатЭксперт».

4

3. Включить режим работы программы.

• Активизировать файл исходных данных и отметить в нем цифровые

данные таблицы.

• Вызвать меню «СтатЭкс», затем – «Корреляция».

4. Предварительная обработка данных.

• В окне «Установка блока данных» установить следующие параметры:

ориентация таблицы «по строкам», наличие наименований снять все флажки

(рис. 2). Нажать кнопку «Установить».

• В окне «Корреляционный анализ» перенести все показатели в правую

часть окна с помощью кнопки «Добавить все». Убрать галочку «Построение

графиков» (рис. 28). Нажать кнопку «Вычислить».

Рис. 28

В результате получили следующий протокол отчета в таб. 7.1.

Таблица 7.1 Протокол корреляционного анализа Матрица парных корреляций

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-A 1.000 0.869 0.682 0.780 Показатель-B 0.869 1.000 0.735 0.871 Показатель-C 0.682 0.735 1.000 0.611 Показатель-D 0.780 0.871 0.611 1.000 Критическое значение на уровне 90% при 2 степенях свободы = +0.2658

5

Матрица максимальных корреляций

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-A 1.000 0.869 0.792 0.780 Показатель-B 0.869 1.000 0.755 0.871 Показатель-C 0.792 0.755 1.000 0.611 Показатель-D 0.780 0.871 0.611 1.000 Матрица оптимальных лагов

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-A 0 0 1 0 Показатель-B 0 0 1 0 Показатель-C 1 1 0 0 Показатель-D 0 0 0 0 Матрица частных корреляций

Переменная Показатель-A Показатель-B Показатель-C Показатель-D Показатель-A 1.000 0.519 0.137 0.103 Показатель-B 0.519 1.000 0.370 0.615 Показатель-C 0.137 0.370 1.000 -0.100 Показатель-D 0.103 0.615 -0.100 1.000 Критическое значение на уровне 90% при 4 степенях свободы = +0.2665 Множественные корреляции

Переменная Коэффи циент

F-зна чение

%точка F-распред.

Показатель-A 0.873 16.054 100.000 Показатель-B 0.934 33.992 100.000 Показатель-C 0.743 6.155 99.787 Показатель-D 0.874 16.160 100.000 Число степеней свободы = 4 и 19

Проведем корреляционный анализ на основе полученной в программе

«СтатЭксперт» матрицы парных коэффициентов (выделена в таблице 7.2 серым

цветом):

Таблица 7.2

Y X1 X2 X3 Y 1.000 0.869 0.682 0.780

X1 0.869 1.000 0.735 0.871 X2 0.682 0.735 1.000 0.611

X3 0.780 0.871 0.611 1.000

6

1. Установим значимость парного коэффициента корреляции между Y и

каждым фактическим признаком Х. Для этого проверим значимость парных

коэффициентов корреляции, используя t-критерий Стьюдента.

• Найдем tрасч, используя формулу:

n = 28 – 4 = 25

Значения r берем из матрицы парных корреляций на рис. 35

• Сравним tрасч с tтабл:

Табличное значение критерия Стьюдента равно: tтабл = (α = 0,05, k = n – 2

= 23) = 2,0687. сравнивая числовые значения критериев, видно, что tрасч > tтабл,

т.е. все полученные значения коэффициентов корреляции значимы.

2. Установим наличие мультиколлинеарности между факторными

признаками.

rx2x2 = 0,735 < 0,8

rx3x2 = 0,871 > 0,8 => признак Х2 можно исключить

rx3x3 = 0,611 < 0,8

3. Ослабим эффект мультиколлинеарности путем исключения одного из

признаков в рассматриваемых парных коэффициентах корреляции. В

результате данной операции остаются признаки Х1 (объем работ) и Х3 (фонд

заработной платы), которые наиболее тесно связаны с Y (накладные расходы).

21

2

r

nr t расч

− −=

2,5 735,01

225735,0 2

= −

−=расчt

5,8 871,01

225871,0 2

= −

−=расчt 7,3 611,01

225611,0 2

= −

−=расчt

7

Решение задачи с помощью ППП Microsoft Excel

1. Выбрать команду Сервис → Анализ данных.

2. В диалоговом окне «Анализ данных» выбрать инструмент

«Корреляция», а затем щелкнуть на кнопку ОК (рис. 29).

Рис. 29

3. В диалоговом окне «Корреляция» в поле «Входной интервал» необ-

ходимо ввести диапазон ячеек $B$6:$E$30.

4. Выбрать параметры вывода. В данном примере Новый рабочий лист.

Нажать ОК (рис. 30).

Рис. 30

Получили следующую матрицу парных коэффициентов (таб. 7.3):

Таблица 7.3

Y X1 X2 X3 Y 1

X1 0,86946995 1 X2 0,68158354 0,73467836 1 X3 0,77965993 0,87140867 0,6113 1

8

Регрессионный анализ

Задание 1

1. Создать файл исходных данных в среде Excel.

• Пуск → Программы → Microsoft Excel.

• В появившейся книге внести данные. Для этого в ячейке А1 записать «X»,

в ячейке А2 «Y» и далее числовые данные (рис. 27).

• Сохранить таблицу данных в формате Excel (Файл → Сохранить).

• Свернуть окно Excel и перенести файл исходных данных в среду Word и

сохранить в Word.

2. Запуск программы «СтатЭксперт».

• Пуск → Программы → Olymp → СтатЭксперт → Включить макросы.

• На экране появится картинка «СтатЭксперт». Дать команду «Начало

работы». Появится таблица программы «СтатЭксперт».

3. Включить режим работы программы.

• Активизировать файл исходных данных и отметить в нем цифровые

данные таблицы.

• Вызвать меню «СтатЭкс», затем – «Регрессия».

4. Предварительная обработка данных.

• В окне «Установка блока данных» установить следующие параметры:

ориентация таблицы «по строкам», наличие наименований снять все флажки

(рис. 2). Нажать кнопку «Установить».

• В окне «Регрессионный анализ» перенести показатели А, В, С, D в

правую часть окна, нажав на кнопку «Добавить все». Установить зависимую

переменную с помощью кнопки «Выбор» (рис. 31). Выделив в появившемся

окне нужную переменную, нажать кнопку «Установить».

9

Рис. 31

• Установить вид регрессии – линейная. Нажать «Вычислить».

• На запрос программы «Включить фактор времени» нажать Нет (рис. 32).

Рис. 32

Протокол отчета представлен в таб. 7.4:

Таблица 7.4

Линейная регрессия. Зависимая переменная - Показатель-A Оценки коэффициентов линейной регрессии

Переменная Коэффи циент

Среднекв. отклонение

t- значение

Нижняя оценка

Верхняя оценка

Эластич ность

Бета- коэф-т

Дельта- коэф-т

Св. член 1.14685 0.253 4.532 0.878 1.416 0.000 0.000 0.000 Показатель-B 0.10944 0.039 2.782 0.068 0.151 0.487 0.614 0.783

10

Показатель-C 0.00035 0.001 0.632 0.000 0.001 0.068 0.099 0.127 Показатель-D 0.03568 0.075 0.475 -0.044 0.116 0.062 0.070 0.090 Кpитическое значения t-pаспpеделения пpи 21 степенях свободы (p=85%) = +1.064 Таблица остатков

номер Факт Расчет Ошибка абс.

Ошибка относит.

1 2.700 2.669 0.031 1.143 2 3.600 2.786 0.814 22.614 3 2.700 2.778 -0.078 -2.905 4 2.900 2.555 0.345 11.896 5 1.600 1.579 0.021 1.324 6 1.300 1.956 -0.656 -50.472 7 2.500 2.312 0.188 7.508 8 2.100 2.220 -0.120 -5.716 9 2.400 2.149 0.251 10.463 10 2.000 2.261 -0.261 -13.026 11 2.500 2.457 0.043 1.708 12 1.800 1.902 -0.102 -5.643 13 2.800 2.706 0.094 3.365 14 4.000 4.522 -0.522 -13.044 15 3.900 4.411 -0.511 -13.093 16 4.700 3.937 0.763 16.232 17 4.800 3.798 1.002 20.879 18 4.300 3.671 0.629 14.622 19 3.500 3.534 -0.034 -0.961 20 3.000 3.381 -0.381 -12.702 21 3.600 3.675 -0.075 -2.083 22 3.300 3.417 -0.117 -3.552 23 2.900 3.354 -0.454 -15.668 24 3.100 3.380 -0.280 -9.039 25 2.800 3.390 -0.590 -21.080

Характеристики остатков

Характеристика Значение Среднее значение 0.000 Дисперсия 0.189 Приведенная дисперсия 0.225 Средний модуль остатков 0.334 Относительная ошибка 11.229 Критерий Дарбина- Уотсона 1.395 Коэффициент детерминации 0.981 F - значение ( n1 = 3, n2 = 21) 353.321 Критерий адекватности 71.340 Критерий точности 25.494 Критерий качества 36.956 Уравнение значимо с вероятностью 0.95

11

Из полученного отчета видно, что второй и третий показатели незначимы,

следовательно, их можно исключить. Затем произведем следующие действия

для построения модели:

1. Активизировать файл исходных данных и отметить в нем цифровые

данные таблицы.

2. Вызвать меню «СтатЭкс», затем – «Регрессия».

3. В окне «Установка блока данных» установить следующие параметры:

ориентация таблицы «по строкам», наличие наименований снять все флажки

(рис. 2). Нажать кнопку «Установить».

4. В окне «Регрессионный анализ» перенести показатели А, В в правую

часть окна, нажав на кнопку «Добавить все». Установить зависимую

переменную с помощью кнопки «Выбор». Выделив в появившемся окне

нужную переменную, нажать кнопку «Установить» (рис. 33).

Рис. 33

5. Установить вид регрессии – парная. Нажать кнопку «Параметры-3».

Остальные пункты оставить без изменений. Нажать кнопку «Вычислить».

Полученный протокол отчета выглядит так (таб. 7.5):

12

Таблица 7.5

Парная регрессия. Y = Показатель-A X = Показатель-B Таблица функций парной регрессии

Функция Критерий Эластичность Y(X)=+1.199+0.135*X 0.212 0.599 Выбрана функция Y(X)=+1.199+0.135*X Таблица остатков

номер Факт Расчет Ошибка абс. Ошибка относит. Фактор X 1 2.700 2.654 0.046 1.699 10.800 2 3.600 2.775 0.825 22.906 11.700 3 2.700 2.789 -0.089 -3.290 11.800 4 2.900 2.519 0.381 13.124 9.800 5 1.600 1.576 0.024 1.479 2.800 6 1.300 1.994 -0.694 -53.383 5.900 7 2.500 2.371 0.129 5.152 8.700 8 2.100 2.223 -0.123 -5.857 7.600 9 2.400 2.183 0.217 9.059 7.300

10 2.000 2.263 -0.263 -13.171 7.900 11 2.500 2.398 0.102 4.074 8.900 12 1.800 1.927 -0.127 -7.034 5.400 13 2.800 2.573 0.227 8.097 10.200 14 4.000 4.581 -0.581 -14.516 25.100 15 3.900 4.257 -0.357 -9.162 22.700 16 4.700 3.934 0.766 16.298 20.300 17 4.800 3.880 0.920 19.165 19.900 18 4.300 3.651 0.649 15.092 18.200 19 3.500 3.530 -0.030 -0.852 17.300 20 3.000 3.422 -0.422 -14.068 16.500 21 3.600 3.489 0.111 3.072 17.000 22 3.300 3.503 -0.203 -6.148 17.100 23 2.900 3.382 -0.482 -16.608 16.200 24 3.100 3.530 -0.430 -13.865 17.300 25 2.800 3.395 -0.595 -21.253 16.300

Характеристики остатков

Характеристика Значение Среднее значение 0.000 Дисперсия 0.195 Приведенная дисперсия 0.212 Средний модуль остатков 0.352 Относительная ошибка 11.937 Критерий Дарбина-Уотсона 1.411 Коэффициент детерминации 0.980 F - значение ( n1 = 1, n2 = 23) 1129.220 Критерий адекватности 71.284 Критерий точности 22.278 Критерий качества 34.529 Уравнение значимо с вероятностью 0.95

13

Задание 2

Уравнение регрессии имеет вид: Y = 1,199 + 0,135Х1. Индекс корреляции

R = 0,99. Коэффициент детерминации R2 = 0,98. Следовательно, около 98%

вариации зависимой переменной учтено в модели и обусловлено влиянием

включенных факторов.

Задание 3

Проверку значимости уравнения регрессии произведем на основе

критерия Фишера. Значение F-критерия Фишера находится в отчете на рис. 42

и равен 1,411. Табличное значение при α = 0,05 и k1 = 1, k2 = 22 составляет 4,3.

Поскольку Fрасч < Fтабл, то уравнение регрессии следует признать неадекватным.

Рассчитаем коэффициент эластичности, β- и ∆-коэффициенты, используя

следующие формулы:

, где

Для расчетов коэффициентов воспользуемся данными, вычисленными в

таблице 7.6:

Таблица 7.6

Накладные расходы

Объем работ y-yср (y-yср)2 x-xср (x-xср)2 (y-yср)*(x-xср)

Y X1 … … … … … … … … 4 2,7 10,8 -0,292 0,085 -2,508 6,290 0,732 5 3,6 11,7 0,608 0,370 -1,608 2,586 -0,978 6 2,7 11,8 -0,292 0,085 -1,508 2,274 0,440

y

x aЭ jjj *ˆ=

y

xj jj S

S a *ˆ=β

2 , /* Rr jxyj j β=∆

22

22

)(* 1

1

)(* 1

1

yy n

S

xx n

S

iy

ix j

− −

=

− −

=

14

7 2,9 9,8 -0,092 0,008 -3,508 12,306 0,323 8 1,6 2,8 -1,392 1,938 -10,508 110,418 14,627 9 1,3 5,9 -1,692 2,863 -7,408 54,878 12,534

10 2,5 8,7 -0,492 0,242 -4,608 21,234 2,267 11 2,1 7,6 -0,892 0,796 -5,708 32,581 5,092 12 2,4 7,3 -0,592 0,350 -6,008 36,096 3,557 13 2 7,9 -0,992 0,984 -5,408 29,246 5,365 14 2,5 8,9 -0,492 0,242 -4,408 19,430 2,169 15 1,8 5,4 -1,192 1,421 -7,908 62,536 9,426 16 2,8 10,2 -0,192 0,037 -3,108 9,660 0,597 17 4 25,1 1,008 1,016 11,792 139,051 11,886 18 3,9 22,7 0,908 0,824 9,392 88,210 8,528 19 4,7 20,3 1,708 2,917 6,992 48,888 11,942 20 4,8 19,9 1,808 3,269 6,592 43,454 11,918 21 4,3 18,2 1,308 1,711 4,892 23,932 6,399 22 3,5 17,3 0,508 0,258 3,992 15,936 2,028 23 3 16,5 0,008 0,000 3,192 10,189 0,026 24 3,6 17 0,608 0,370 3,692 13,631 2,245 25 3,3 17,1 0,308 0,095 3,792 14,379 1,168 26 2,9 16,2 -0,092 0,008 2,892 8,364 -0,266 27 3,1 17,3 0,108 0,012 3,992 15,936 0,431 28 2,8 16,3 -0,192 0,037 2,992 8,952 -0,574 … … … … … … … … ∑ 74,8 332,7 -1,308 19,938 0 830,458 111,882

ср. знач. 2,992 13,308 -0,052 0

Коэффициент эластичности показывает, что при изменении фактора Х1

на один процент, зависимая переменная изменяется на 60%.

Бета-коэффициент показывает, что на 87,2% среднего квадратического

отклонения Sy изменится зависимая переменная Y с изменением независимой

переменной Х1 на величину своего среднеквадратического отклонения при

фиксированном на постоянном уровне значении остальных независимых

переменных.

91,0938,19* 125

1

5,88830,458* 125

1

= −

=

= −

=

y

x

S

S j

6,0 992,2

308,13 *135,0 ==

872,0 91,0

88,5 *135,0 ==jβ

773,098,0/872,0*869,0 ==∆ j

15

Дельта-коэффициент показывает, что фактор Х1 на 77,3% в суммарном

влиянии всех факторов влияет на Y.

Задание 4

Для ранжировки предприятий по степени их эффективности

воспользуемся командой «Сортировка» в программе Microsoft Excel.

1. Выделить числовые значения таблицы.

2. В меню «Данные» выбрать команду «Сортировка».

3. В открывшемся окне заполнить все поля, как указано на рис. 34.

Нажать ОК.

Рис. 34

4. Результат сортировки можно увидеть в таблице 7.7, представленной

ниже.

Таблица 7.7

№ п/п Накладные

расходы. млн. руб. Объем работ. млн. руб.

Численность рабочих. чел.

Фонд заработной платы рабочих. млн. руб.

Y X1 X2 X3 9 1,3 5,9 250 2,15 8 1,6 2,8 275 0,84

15 1,8 5,4 253 2,125 13 2 7,9 387 3,212 11 2,1 7,6 363 3,231 12 2,4 7,3 373 2,06 10 2,5 8,7 359 2,482 14 2,5 8,9 595 3,634

4 2,7 10,8 509 4,581 6 2,7 11,8 483 4,83

16 2,8 10,2 965 3,008 28 2,8 16,3 807 5,019

16

7 2,9 9,8 502 4,518 26 2,9 16,2 593 6,404 23 3 16,5 634 5,833 27 3,1 17,3 406 5,575 25 3,3 17,1 424 7,051 22 3,5 17,3 738 6,642

5 3,6 11,7 499 5,19 24 3,6 17 683 12,059 18 3,9 22,7 1320 8,99 17 4 25,1 861 9,213 21 4,3 18,2 760 7,524 19 4,7 20,3 993 6,265 20 4,8 19,9 607 7,347

17

Решение задачи с помощью ППП Microsoft Excel

1. Выбрать команду Сервис → Анализ данных.

2. В диалоговом окне «Анализ данных» выбрать инструмент

«Регрессия», а затем щелкнуть на кнопку ОК.

3. В диалоговом окне «Регрессия» в поле «Входной интервал Y» ввести

диапазона ячеек $B$6:$B$30. В поле «Входной интервал X» ввести $C$6:$E$30.

4. Выбрать параметры вывода. В данном примере «Новая рабочая

книга».

5. В поле «Остатки» поставить необходимые флажки. Нажать ОК (рис.

35).

Рис. 35

Протокол отчета и график остатков выглядят следующим образом (таб.

7.8 и рис. 36-38):

Таблица 7.8

ВЫВОД ИТОГОВ

Регрессионная статистика Множественный R 0,873218 R-квадрат 0,76251 Нормированный R-квадрат 0,728583 Стандартная ошибка 0,474852 Наблюдения 25 Дисперсионный анализ

df SS MS F Значимость

F Регрессия 3 15,20323 5,067742 22,47491 9,32E-07

18

Остаток 21 4,735173 0,225484 Итого 24 19,9384

Коэф-ты Станд. ошибка

t- статистика

P- Значение

Нижние 95%

Верхние 95%

Нижние 95,0%

Верхние 95,0%

Y-пересечение 1,146848 0,253079 4,53158 0,000182 0,620541 1,673154 0,620541 1,673154

Переменная X 1 0,109442 0,039333 2,782465 0,011159 0,027645 0,191238 0,027645 0,191238

Переменная X 2 0,000347 0,00055 0,632295 0,534018 -0,0008 0,00149 -0,0008 0,00149

Переменная X 3 0,035683 0,075128 0,474968 0,639712 -0,12055 0,19192 -0,12055 0,19192

ВЫВОД ОСТАТКА

Наблюдение Предсказанное

Y Остатки 1 2,66914 0,03086 2 2,785894 0,814106 3 2,778433 -0,07843 4 2,555018 0,344982 5 1,57881 0,02119 6 1,956138 -0,65614 7 2,312295 0,187705 8 2,220025 -0,12003 9 2,148882 0,251118

10 2,260519 -0,26052 11 2,457291 0,042709 12 1,901567 -0,10157 13 2,705788 0,094212 14 4,521748 -0,52175 15 4,410615 -0,51061 16 3,937098 0,762902 17 3,797811 1,002189 18 3,671237 0,628763 19 3,533623 -0,03362 20 3,381066 -0,38107 21 3,674976 -0,07498 22 3,417226 -0,11723 23 3,354363 -0,45436 24 3,380192 -0,28019 25 3,390242 -0,59024

Переменная X 1 График остатков

-1

0

1

2

0 5 10 15 20 25 30

Переменная X 1

О с т а т к и

Рис. 36

19

Переменная X 2 График остатков

-1

0

1

2

0 500 1000 1500

Переменная X 2

О с т а т к и

Рис. 37

Переменная X 3 График остатков

-1 0

1 2

0 5 10 15

Переменная X 3

О с т а т к и

Рис. 38

20

Решение задачи с помощью ППП SPSS

Для импорта данных из файла программы SPSS формата Excel выполнить

следующие действия:

1. После запуска программы SPSS выбрать в строке меню Файл →

Открыть → Данные и задать имя файла с данными, его тип. Нажать кнопку

«Открыть» (рис. 39).

Рис. 39

2. В новом диалоговом окне (рис. 40) задать диапазон ячеек. Остальное

оставить без изменений. Нажать ОК.

21

Рис. 40

3. На экране появятся импортированные данные в формате SPSS (рис.

41).

Рис. 41

4. Нажать в нижней строке меню кнопку «Переменные». В столбце

«Метка» ввести расширенное имя переменной.

22

5. Каждой переменной в файле SPSS соответствует отдельная колонка.

Используя меня Файл → Сохранить, сохранить данный файл с расширением

*.sav (рис. 42).

Рис. 42

Для построения матрицы парной корреляции всех переменных

необходимо выполнить следующие действия:

1. Выбрать в верхней строке меню Анализ → Корреляция → Парные.

2. Переменные относительно которых проверяется степень

корреляционной связи, поочередно переместить в поле тестируемых

переменных справа (рис. 43).

23

Рис. 43

3. Начать расчет путем нажатия кнопки ОК.

4. В результате в выходной области появится матрица парной

корреляции всех переменных (рис. 44).

Рис. 44

Анализ матрицы парной корреляции показывает, что зависимая

переменная, т.е. накладные расходы, имеет тесную связь с объемом работ (ryx1 =

0,869) и с фондом заработной платы (ryx3 = 0,78). Однако факторы Х1 и Х3

тесно связаны между собой (rх1x3 = 0,871 > 0,8), что свидетельствует о наличии

мультиколлинеарности. Из этих двух переменных оставим Х3 – фонд

заработной платы.

24

Для проведения регрессионного анализа с помощью пакета SPSS

выполним следующие действия:

1. Выбрать в верхней строке меню Анализ → Регрессия → Линейная.

2. Поместить переменную Y в поле для зависимых переменных, объявив

переменные Х1, Х2, Х3 независимыми (рис. 45). Используется метод

«Исключение».

Рис. 45

3. В полях панели «Статистики…» следует отметить флажками

«Оценки», «Согласие модели» и критерий «Дурбина-Уотсона» (рис. 46). Затем

нажать кнопку «Продолжить».

Рис. 46

25

4. В полях панели «Сохранить…» отметить необходимые поля и нажать

«Продолжить» (рис. 47).

Рис. 47

5. Начать вычисления нажатием кнопки ОК.

6. Результаты регрессионного анализа приведены в таблицах 7.9 – 7.14.

Таблица 7.9

Включенные/исключенные переменные(b)

Модель Включенные переменные

Исключенные переменные Метод

1 Фонд заработной платы рабочих. млн. руб., Численность рабочих. чел., Объем работ. млн. руб.(a)

. Принудительное включение

2

.

Фонд заработной платы рабочих. млн. руб.

Исключение (критерий: вероятность F-исключения >= ,100).

3

. Численность рабочих. чел.

Исключение (критерий: вероятность F-исключения >= ,100).

a. Включены все запрошенные переменные b. Зависимая переменная: Накладные расходы. млн. руб.

26

Таблица 7.10 Сводка для модели(d)

Модель R R квадрат Скорректированный R

квадрат Стд. ошибка

оценки Дурбин- Уотсон

1 ,873(a) 0,763 0,729 0,475 2 ,872(b) 0,760 0,738 0,466 3 ,869(c) 0,756 0,745 0,460 1,411 a. Предикторы: (константа) Фонд заработной платы рабочих. млн. руб., Численность рабочих. чел., Объем работ. млн. руб. b. Предикторы: (константа) Численность рабочих. чел., Объем работ. млн. руб. c. Предикторы: (константа) Объем работ. млн. руб. d. Зависимая переменная: Накладные расходы. млн. руб.

Таблица 7.11

Дисперсионный анализ(d)

Модель Сумма

квадратов ст.св. Средний квадрат F Знч.

1 Регрессия 15,203 3 5,068 22,475 ,000(a) Остаток 4,735 21 0,225 Итого 19,938 24

2 Регрессия 15,152 2 7,576 34,825 ,000(b) Остаток 4,786 22 0,218 Итого 19,938 24

3 Регрессия 15,073 1 15,073 71,254 ,000(c) Остаток 4,865 23 0,212 Итого 19,938 24

a. Предикторы: (константа) Фонд заработной платы рабочих. млн. руб., Численность рабочих. чел., Объем работ. млн. руб. b. Предикторы: (константа) Численность рабочих. чел., Объем работ. млн. руб. c. Предикторы: (константа) Объем работ. млн. руб. d. Зависимая переменная: Накладные расходы. млн. руб.

Таблица 7.12 Коэффициенты(a)

Модель

Нестандартизованные коэффициенты

Стандартизов анные

коэффициент ы

t Знч. B Стд. ошибка Бета 1 (Константа) 1,147 0,253 4,532 0,000

Объем работ. млн. руб. 0,109 0,039 0,706 2,782 0,011

Численность рабочих. чел.

0,000 0,001 0,099 0,632 0,534

Фонд заработной платы рабочих. млн. руб.

0,036 0,075 0,103 0,475 0,640

2 (Константа) 1,150 0,249 4,627 0,000 Объем работ. млн. руб. 0,124 0,024 0,801 5,203 0,000

Численность рабочих. чел.

0,000 0,001 0,093 0,604 0,552

3 (Константа) 1,199 0,231 5,181 0,000 Объем работ. млн. руб. 0,135 0,016 0,869 8,441 0,000

a. Зависимая переменная: Накладные расходы. млн. руб.

Таблица 7.13 Исключенные переменные(c)

Модель Бета t Знч. Частная Статистики

27

включения корреляция коллинеарности

Толерантность 2 Фонд

заработной платы рабочих. млн. руб.

,103(a) 0,475 0,640 0,103 0,239

3 Фонд заработной платы рабочих. млн. руб.

,091(b) 0,428 0,673 0,091 0,241

Численность рабочих. чел. ,093(b) 0,604 0,552 0,128 0,460

a. Предикторы в модели: (конст) Численность рабочих. чел., Объем работ. млн. руб. b. Предикторы в модели: (конст) Объем работ. млн. руб. c. Зависимая переменная: Накладные расходы. млн. руб.

Таблица 7.14 Статистики остатков(a)

Минимум Максимум Среднее Стд. отклонение N Предсказанное значение 1,58 4,58 2,99 0,792 25 Остаток -0,694 0,920 0,000 0,450 25 Стандартиз. предсказанное значение -1,786 2,005 0,000 1,000 25 Стандартиз. остаток -1,509 2,000 0,000 0,979 25 a. Зависимая переменная: Накладные расходы. млн. руб.

комментарии (0)
не были сделаны комментарии
Напиши ваш первый комментарий
это только предварительный показ
консультироваться и скачать документ
Docsity не оптимизирован для браузера, который вы используете. Войдите с помощью Google Chrome, Firefox, Internet Explorer 9+ или Safari! Скачать Google Chrome