hhhh, Apuntes de Economía. Universidad de Almería (UAL)
campanerogarcia
campanerogarcia

hhhh, Apuntes de Economía. Universidad de Almería (UAL)

11 páginas
10Número de visitas
Descripción
Asignatura: economia, Profesor: Jose Manuel Cimadevilla, Carrera: Psicología, Universidad: UAL
20 Puntos
Puntos necesarios para descargar
este documento
Descarga el documento
Vista previa3 páginas / 11
Esta solo es una vista previa
3 páginas mostradas de 11 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 11 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 11 páginas totales
Descarga el documento
Esta solo es una vista previa
3 páginas mostradas de 11 páginas totales
Descarga el documento

Curso 2014/15

Asignatura: ESTADÍSTICA AVANZADA Estudios:GRADOS EN ADE, FYCO, ECONOMÍA Y MARKETING

PRÁCTICA DE ORDENADOR 5: MODELO DE REGRESIÓN LINEAL

1. OBTENCIÓN, INFERENCIAS Y PREDICCIONES

DEL MODELO LINEAL CON SPSS.

SPSS puede obtener modelos de regresión lineal como los estudiados en el tema 6, esto es:

y = β0 + β1 · x+ ε

donde:

y =Variable Dependiente o endógena.

x =Variable Independiente o exógena.

ε =Perturbación aleatoria.

β0 y β1 coeficientes de regresión

1.1. OBTENCIÓN E INFERENCIAS DEL MODELO.

A partir de una muestra de valores (xi, yi); i = 1, 2, . . . , n, se obtiene el modelo estimado

= β̂0 + β̂1 · x

donde β̂0 = ȳ − β̂1 · x̄ ; β̂1 = SxyS2x .

Para obtener el modelo estimado con SPSS, esto es para estimar los valores β̂0 y β̂1, debemos ejecutar el procedimiento del menú:

Analizar Regresión Lineales

Al acceder al menú, debemos pasar la variable dependiente y al campo “Dependientes” y la variable independiente x al cuadro “Independientes” (Figura 1)

Ejemplo 1 Obtener el modelo lineal de los datos del ejemplo 1 del tema 6

Si accedemos al menú Analizar Regresión Lineales, debemos pasar la variable “Precio” al campo “Dependientes” y la variable “Impuestos” al campo “Independientes” (Figura 1). Al ejecutar el menú, obtenemos varias tablas y resultados. En la tabla “Coeficientes” (Figura 2) podemos encontrar la estimación de β0 y β1 dentro de la columna “B”. Aśı, tenemos que

1

Figura 1: Menú Analizar Regresión Lineales

Error típ.B Beta Sig.t

Coeficientes tipificadosCoeficientes no estandarizados

(Constante)

Impuestos

1

,0193,173,792,038,121

,0113,6621,7896,552

Modelo

Coeficientes a

a. Variable dependiente: Precio

Figura 2: Tabla Coeficientes

la fila “Constante” proporciona el valor β̂0 y la fila “Impuestos” proporciona el valor β̂1. El modelo estimado viene dado por:

Precio = β̂0 + β̂1 · Impuestos = 6, 552 + 0, 121 · Impuestos

También en la tabla “Coeficientes” podemos encontrar en la columna “Error t́ıp” los errores estándar de los coeficientes de regresión (Figura 3).

Error típ.B Beta Sig.t

Coeficientes tipificadosCoeficientes no estandarizados

(Constante)

Impuestos

1

,0193,173,792,038,121

,0113,6621,7896,552

Modelo

Coeficientes a

a. Variable dependiente: Precio

Figura 3: Tabla Coeficientes

2

Si deseamos llevar a cabo los contrastes{ H0 : β0 = 0 H1 : β0 ̸= 0

o

{ H0 : β1 = 0 H1 : β1 ̸= 0

debemos analizar las columnas “t” y “Sig” de la tabla “Coeficientes” (Figura 4). Concreta- mente, la columna “Sig” nos proporciona el p-valor de ambos contraste. De este modo, si deseamos llevar a cabo ambos contraste con un nivel de significación α = 0,05, en ambos casos rechazaŕıamos la hipótesis nula.

Error típ.B Beta Sig.t

Coeficientes tipificadosCoeficientes no estandarizados

(Constante)

Impuestos

1

,0193,173,792,038,121

,0113,6621,7896,552

Modelo

Coeficientes a

a. Variable dependiente: Precio

Figura 4: Tabla Coeficientes

Recordemos que el contraste llevado a cabo con el coeficiente β1 se denomina contraste de regresión y también podemos consultarlo en la tabla “ANOVA” de los resultados, donde disponemos del estad́ıstico de contraste F y del p-valor en la columna “Sig” (Figura 5). De nuevo el p-valor nos indica, a nivel α = 0,05, que debemos rechazar la hipótesis nula H0 : β1 = 0.

Sig.F Media

cuadráticagl Suma de

cuadrados

Regresión

Residual

Total

1

79,619

,59963,592

,019 a

10,0666,02716,027

Modelo

ANOVA b

a. Variables predictoras: (Constante), Impuestos

b. Variable dependiente: Precio

Figura 5: Tabla ANOVA

En la tabla “ANOVA” también podemos encontrar el valor de la varianza reisdual S2R, que mide el grado de variabilidad de los datos alrededor de la recta de regresión. S2R se corresponde con el valor “Residual” dentro de la columna “Media Cuadrática” (Figura 6).

Ahora bien, para la evaluación de un modelo de regresión lineal, es más correcto emplear el coeficiente de determinación, que podemos encontrarlo en la tabla “Resumen del Modelo”, en la columna “R cuadrado” (Figura 7), donde también podemos encontrar el coeficiente de correlación en la columna “R”.

3

Sig.F Media

cuadráticagl Suma de

cuadrados

Regresión

Residual

Total

1

79,619

,59963,592

,019 a

10,0666,02716,027

Modelo

ANOVA b

a. Variables predictoras: (Constante), Impuestos

b. Variable dependiente: Precio

Figura 6: Tabla ANOVA

Error típ. de la estimación

R cuadrado corregidaR cuadradoR

1 ,77375,564,627,792 a

Modelo

Resumen del modelo

a. Variables predictoras: (Constante), Impuestos

Figura 7: Tabla Resumen del Modelo

1.2. ESTIMACIÓN DE LA RESPUESTA MEDIA Y PREDICCIO- NES DE NUEVAS OBSERVACIONES.

Figura 8: Visor de datos

El modelo de regresión permite:

Estimar las medias de la variable respuesta por medio de intervalos de confianza.

Predecir futuros valores de la variable respuesta.

Para realizar ambos tipos de estimaciones para la variable respuesta, debemos emplear el procedimiento

Analizar Regresión Lineales Guardar

4

Figura 9: Menú Guardar

Ejemplo 2 Obtener un I.C. 95% para el precio medio de venta cuando los impuestos as- ciendan a 600 euros en el Ejemplo 1.

Para realizar una estimación de la media de la variable precio, para el valor x0 = 60, debemos introducir el valor 60 en el visor de datos de SPSS (Figura 8) y a continuación emplear el procedimiento Analizar Regresión Lineales Guardar.

Esto nos permite acceder al menú de la Figura 9 donde debemos marcar la opción “Media” en la sección “Intervalos de pronóstico”. En la opción “Intervalo de confianza” podemos especificar el nivel de confianza deseado.

Figura 10: Visor de datos

5

Al ejecutar el procedimiento, obtendremos en el visor de datos dos columnas nuevas “LM- CI 1” con los extremos inferiores de los intervalos y “UMCI 1” con los extremos superiores de los intervalos (Figura 10). Ambas columnas se calculan para todos los valores de x, in- cluido el valor x0 = 60.

Ejemplo 3 En el Ejemplo 1, predecir el precio de una casa si los impuestos ascienden a 600 euros y calcular un I.C. 95% para esta predicción.

Para obtener una predicción y un I.C para una nueva observación x0 = 60, debemos incluir el valor en la columna correspondiente del visor de datos de SPSS (Figura 8) y ejecutar el procedimiento Analizar Regresión Lineales Guardar, pero en esta ocasión en el menú de la Figura 11 debemos seleccionar las siguientes opciones:

“No Tipificados”, en la sección “Valores pronosticados”.

“Individuos”, en el campo “Intervalos de pronóstico” (al igual que antes, en la opción “Intervalo de confianza” podemos establecer el nivel de confianza deseado).

Figura 11: Menú Guardar

Al ejecutar el procedimiento, podemos observar en el visor de datos de SPSS (Figura 12) tres variables nuevas:

“PRE 1” con los valores pronosticados, incluida la predicción para x0 = 60.

“LICI 1” con los extremos inferiores de los intervalos.

“UICI 1” con los extremos superiores de los intervalos.

6

Figura 12: Visor de datos

2. COMPROBACIÓN DE HIPÓTESIS DEL MODELO

LINEAL CON SPSS.

Para comprobar las hipótesis del modelo de regresión lineal simple, necesitamos calcular los residuos y para ello debemos emplear el menú

Analizar Regresión Lineales Guardar

pero en este caso debemos seleccionar en el campo “Residuos”, la opción “No tipificados”, esto genera una variable nueva, “RES 1”, con los residuos.

2.1. COMPROBACIÓN DE LA NORMALIDAD

La normalidad de los residuos puede comprobarse con dos herramientas:

Contraste de Kolmogorov-Smirnov y contraste de Shapiro-Wilks. (Práctica 3)

Gráfico P.P.N (Práctica 3)

Si llevamos a cabo los contrastes de Kolmogorov-Smirnov y de Shapiro-Wilks con los residuos de los datos del Ejemplo 1, obtenemos la tabla de la Figura 13 cuyos p-valores nos indican que no hay problemas de falta de normalidad.

Figura 13: Tabla Pruebas de Normalidad

De igual manera, el gráfico P.P.N obtenido con los residuos (Figura 14) no indica problemas severos de falta de normalidad

7

Figura 14: Gráfico P.P.N

2.2. COMPROBACIÓN DE LA LINEALIDAD

Para comprobar la hipótesis de linealidad emplearemos:

Contraste de falta de ajuste o contraste de linealidad.

Gráfico de los residuos frente a los valores estimados

Para llevar a cabo el contraste de linealidad debemos emplear el menú:

Analizar Comparar medias Medias...

Al ejecutar el menú, debemos pasar la variable “Precio” al cuadro “Dependientes” y la variable “Impuestos” al cuadro “Independientes” (Figura 15).

Figura 15: Menú Analizar/Comparar medias/Medias...

Si seleccionamos el apartado “Opciones”, accedemos a un nuevo menú (Figura 16) donde debemos marcar la opción “Prueba de linealidad”.

8

Figura 16: Menú Opciones

Al ejecutar el procedimiento obtenemos el contraste de linealidad (Figura 17) cuyo p- valor= 0,027 nos lleva a rechazar la hipótesis nula, con lo que tenemos un problema de linealidad de los datos.

Figura 17: Contraste de linealidad

Si pasamos al gráfico de residuos frente a valores pronosticados (Figura 18) podemos observar que la nube de puntos no es paralela al eje horizontal lo que denota problemas de linealidad.

2.3. COMPROBACIÓN DE LA HOMOCEDASTICIDAD

Para la comprobación de la homocedasticidad emplearemos el gráfico de residuos frente a valores estimados (Figura 18), pero en esta ocasión debemos comprobar si la nube de puntos es de anchura constante. De este modo, no se aprecian problemas de homocedasticidad.

2.4. COMPROBACIÓN DE LA NO AUTOCORRELACIÓN

Para la comprobación de la no autocorrelación podemos emplear:

Test de rachas aplicado a los residuos.

Gráfico de residuos frente al tiempo.

9

Figura 18: Gráfico de residuos frente a valores estimados

DecisiónSig.PruebaHipótesis nula

1 Conserve la hipótesis nula.

1,000 Prueba de rachas para una muestra

La secuencia de valores definida por Unstandardized Residual<=0 y >0 es aleatoria.

Resumen de contrastes de hipótesis

Se muestran significaciones asintóticas. El nivel de significación es de ,05.

Figura 19: Test de rachas

Si aplicamos el test de rachas a los residuos, el resultado obtenido viene en la Figura 19, en donde observamos que el p-valor es igual a la unidad y por tanto debemos retener la hipótesis nula, esto es, los residuos son independientes y no hay problemas de autocorrelación.

Por otro lado, si representamos el gráfico de residuos frente a la secuencia temporal (Figura 20) podemos observar que no hay problemas de autocorrelación.

3. EJERCICIOS PROPUESTOS.

1. En el fichero Casas.sav se recogen los precios, en euros, y los metros cuadrados de 100 viviendas puestas en venta por una inmobiliaria.

a) Ajusta un modelo lineal que permita estudiar el precio de una vivienda en función de su superficie.

b) Interpreta el valor obtenido para la pendiente.

c) Obtén un valor para la varianza residual.

d) ¿Se puede afirmar que hay una relación lineal significativa entre el precio de una casa y su superficie?.

10

Figura 20: Gráfico de residuos frente al tiempo

e) Obtén e interpreta el coeficiente de determinación.

f ) Calcula un intervalo al 95% de confianza para el precio medio de las casas con 98 m2.

g) Comprueba que se cumplen las condiciones necesarias para aplicar un modelo de regresión.

2. El fichero Rendimiento.sav presenta los valores observados de un indicador de rendi- miento en función del número de horas trabajadas.

a) Determina la expresión de un modelo de regresión lineal para estudiar el rendi- miento en función del número de horas trabajadas. Estudia la bondad de dicho ajuste.

b) ¿Podŕıamos considerar la pendiente nula?.

c) Calcula el rendimiento previsto si el número de horas trabajadas es de 25 y da un intervalo al 95% de confianza para la predicción.

d) Comprueba las hipótesis del modelo.

3. Los datos del fichero Costes.sav representan 35 observaciones de costes totales de fa- bricación, en euros, y número de unidades fabricadas.

a) Determina la expresión de un modelo de regresión lineal para estudiar los costes de producción en función de las unidades fabricadas.

b) ¿Qué porcentaje de la variabilidad de los costes queda explicado por el modelo estimado?

c) Calcula un intervalo al 95% de confianza para el coste medio de la fabricación de 250 unidades.

d) Calcula el coste que tendŕıa la fabricación de 500 unidades. ¿Podemos suponer, con una confianza del 95% , que dicho coste no superará los 200e?

11

No hay comentarios
Esta solo es una vista previa
3 páginas mostradas de 11 páginas totales
Descarga el documento