Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


tema 2, Apuntes de Econometría

Asignatura: Econometría, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UV

Tipo: Apuntes

2017/2018

Subido el 24/01/2018

andre_3000-1
andre_3000-1 🇪🇸

3.9

(53)

42 documentos

1 / 49

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
2 El modelo de regresión simple: estimación y propiedades
Ezequiel Uriel
Universidad de Valencia
09-2013
2.1 Algunas definiciones en el modelo de regresión simple 1
2.1.1 El modelo de regresión poblacional y la función de regresión poblacional 1
2.1.2 La función de regresión muestral 3
2.2 Obtención de las estimaciones por Mínimos Cuadrados Ordinarios (MCO) 4
2.2.1 Diferentes criterios de estimación 4
2.2.2 Aplicación del criterio de mínimo cuadrados 6
2.3 Algunas características de los estimadores de MCO 8
2.3.1 Implicaciones algebraicas de la estimación 8
2.3.2 Descomposición de la varianza de y 9
2.3.3 Bondad del ajuste: Coeficiente de determinación (R2) 10
2.3.4 Regresión a través del origen 12
2.4 Las unidades de medida y la forma funcional 13
2.4.1 Unidades de medida 13
2.4.2 Forma funcional 14
2.5 Supuestos y propiedades estadísticas de los MCO 19
2.5.1 Supuestos estadísticos del MLC en regresión lineal simple 20
2.5.2 Propiedades deseables de los estimadores 22
2.5.3 Propiedades estadísticas de los estimadores MCO 23
Ejercicios 27
Anexo 2.1 Un caso de estudio: Curvas de Engel para la demanda de productos lácteos 34
Apéndices 40
Apéndice 2.1: Dos formas alternativas de expresar 2
ˆ
40
Apéndice 2.2. Demostración de que 22
xy
rR
41
Apéndice 2.3. Cambio proporcional versus cambio en logaritmos 41
Apéndice 2.4. Demostración de que los estimadores MCO son lineales e insesgados 42
Apéndice 2.5. Cálculo de la varianza de : 2
ˆ
43
Apéndice 2.6. Demostración del teorema de Gauss-Markov para la pendiente en la regresión
simple 43
Apéndice 2.7. Demostración de que 2
es un estimador insesgado de la varianza de las
perturbaciones 45
Apéndice 2.8. Consistencia de los estimadores de MCO 47
Apéndice 2.9 Estimación por máxima verosimilitud 48
2.1 Algunas definiciones en el modelo de regresión simple
2.1.1 El modelo de regresión poblacional y la función de regresión poblacional
En el modelo de regresión simple, el modelo de regresión poblacional o,
simplemente, el modelo poblacional es el siguiente:
12
yxu

(2-1)
Vamos a ver los diferentes elementos del modelo (2-1) y la terminología
utilizada para designarlos. En primer lugar, en el modelo hay tres tipos de variables: y, x
y u. En este modelo el único un factor explícito para explicar y es x. El resto de los
factores que afectan a y están recogidos en u.
Denominamos a y variable endógena (del griego: generada dentro) o variable
dependiente. Se utilizan también otras denominaciones para designar a y: variable
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31

Vista previa parcial del texto

¡Descarga tema 2 y más Apuntes en PDF de Econometría solo en Docsity!

2 El modelo de regresión simple: estimación y propiedades

Ezequiel Uriel Universidad de Valencia 09-

2.1 Algunas definiciones en el modelo de regresión simple 1 2.1.1 El modelo de regresión poblacional y la función de regresión poblacional 1 2.1.2 La función de regresión muestral 3 2.2 Obtención de las estimaciones por Mínimos Cuadrados Ordinarios ( MCO ) 4 2.2.1 Diferentes criterios de estimación 4 2.2.2 Aplicación del criterio de mínimo cuadrados 6 2.3 Algunas características de los estimadores de MCO 8 2.3.1 Implicaciones algebraicas de la estimación 8 2.3.2 Descomposición de la varianza de y 9 2.3.3 Bondad del ajuste: Coeficiente de determinación ( R^2 ) 10 2.3.4 Regresión a través del origen 12 2.4 Las unidades de medida y la forma funcional 13 2.4.1 Unidades de medida 13 2.4.2 Forma funcional 14 2.5 Supuestos y propiedades estadísticas de los MCO 19 2.5.1 Supuestos estadísticos del MLC en regresión lineal simple 20 2.5.2 Propiedades deseables de los estimadores 22 2.5.3 Propiedades estadísticas de los estimadores MCO 23 Ejercicios 27 Anexo 2.1 Un caso de estudio: Curvas de Engel para la demanda de productos lácteos 34 Apéndices 40

Apéndice 2.1: Dos formas alternativas de expresar ˆ 2 40

Apéndice 2.2. Demostración de que r xy^2  R^241 Apéndice 2.3. Cambio proporcional versus cambio en logaritmos 41 Apéndice 2.4. Demostración de que los estimadores MCO son lineales e insesgados 42

Apéndice 2.5. Cálculo de la varianza de : ˆ 2 43

Apéndice 2.6. Demostración del teorema de Gauss-Markov para la pendiente en la regresión simple 43 Apéndice 2.7. Demostración de que ^2

es un estimador insesgado de la varianza de las perturbaciones 45 Apéndice 2.8. Consistencia de los estimadores de MCO 47 Apéndice 2.9 Estimación por máxima verosimilitud 48

2.1 Algunas definiciones en el modelo de regresión simple

2.1.1 El modelo de regresión poblacional y la función de regresión poblacional

En el modelo de regresión simple, el modelo de regresión poblacional o, simplemente, el modelo poblacional es el siguiente:

y   1   2 x  u (2-1)

Vamos a ver los diferentes elementos del modelo (2-1) y la terminología utilizada para designarlos. En primer lugar, en el modelo hay tres tipos de variables: y , x y u. En este modelo el único un factor explícito para explicar y es x. El resto de los factores que afectan a y están recogidos en u.

Denominamos a y variable endógena (del griego: generada dentro) o variable dependiente. Se utilizan también otras denominaciones para designar a y : variable

explicada o regresando. En este modelo todas estas denominaciones son equivalentes, pero en otros modelos, como veremos más adelante, puede haber algunas diferencias.

En la regresión lineal simple de y sobre x , a la variable x se le denomina variable exógena (del griego: generado fuera de) o variable independiente. Otras denominaciones utilizadas también para designar a x son: variable explicativa, regresor, covariable o variable de control. Todas estas denominaciones son equivalentes, pero en otros modelos, como veremos más adelante, puede haber algunas diferencias.

La variable u recoge todos aquellos factores distintos de x que afectan a y. Es denominada error o perturbación aleatoria. El término de perturbación puede captar también el error de medición de la variable dependiente. La perturbación es una variable no observable.

Los parámetros  1 y  2 son fijos y desconocidos.

En el segundo miembro de (2-1) se pueden distinguir dos componentes: un

componente sistemático  1   2 x y la perturbación aleatoria u. Llamando  y al

componente sistemático, podemos escribir:

 y   1   2 x (2-2)

Esta ecuación es conocida como la función de regresión poblacional ( FRP ) o

recta poblacional. Por lo tanto, como puede verse en la figura 2.1,  y es una función

lineal de x con término independiente igual a  1 y pendiente igual a  2.

La linealidad significa que un aumento de una unidad en x implica que el valor

esperado de y - m y  E y ( )- varíe en  1 unidades.

Ahora, supongamos que disponemos de una muestra aleatoria de tamaño n {( y (^) i , x (^) i ): i = 1, ..., n } extraída de la población estudiada. En el diagrama de dispersión de la figura 2.2, se muestran los hipotéticos valores de la muestra.

FIGURA 2.1. La función de regresión poblacional. ( FRP )

FIGURA 2.2. Diagrama de dispersión.

El modelo poblacional para cada observación de la muestra se puede expresar de la siguiente forma:

yi   1   2 xi  ui i  1, 2, , n (2-3)

y

x

1

2 i^

x

^

^

 ^

y

x

 

 (^) 

 

FIGURA 2.3. La función de regresión poblacional y el diagrama de dispersión.

FIGURA 2.4. La función de regresión muestral y el diagrama de dispersión.

Resumiendo, , ˆ 2 , y son la contrapartida muestral de  1 ,  2 , yi y ui

respectivamente. Es posible calcular y ˆ 2 , para una muestra dada, pero para cada

muestra las estimaciones serán distintas. Por el contrario,  1 y  2 son fijos pero

desconocidos.

2.2 Obtención de las estimaciones por Mínimos Cuadrados Ordinarios

(MCO)

2.2.1 Diferentes criterios de estimación

Antes de obtener las estimaciones por mínimos cuadrados, vamos a examinar tres métodos alternativos para ilustrar el problema que tenemos planteado. Estos tres métodos tienen en común que tratan de minimizar, de alguna forma, el valor de los residuos en su conjunto.

Criterio 1

Un primer criterio consistiría en tomar como estimadores ˆ 1 y ˆ 2 a aquellos

valores que hagan la suma de todos los residuos tan próxima a cero como sea posible. Con este criterio la expresión a minimizar sería la siguiente:

Min 1

n i i

u

El problema principal de este método de estimación radica en que los residuos de distinto signo pueden compensarse. Tal situación puede observarse gráficamente en la figura 2.5, en la que se representan tres observaciones alineadas, ( x (^) i , y i ), ( ) y

( x 3 (^) , y 3 ). En este caso, ocurre lo siguiente:

2 1 3 1 2 1 3 1

y y y y x x x x

y

x

 

 (^) 

 

yi

μy

μyi

xi

ui

1

2 i^

x

^

^

 ^

y

x

 

 (^) 

 

xi

yi u ˆ i y^ ˆ i

y^ ˆ i

1 ˆ^ ˆ^2 ˆ i

i y^

x ^  ^ 

ˆ 1 y ˆ i u ˆ i

x 2 (^) , y 2

FIGURA 2.5. Los problemas del criterio 1. Si una línea recta se ajusta de forma que pase a través de los tres puntos, cada uno de los residuos tomará el valor cero, de modo que

3

1

ˆ (^) i 0 i

u

Este ajuste podría ser considerado óptimo. Pero también es posible obtener 3

 i  1 u ˆ^ i ^0 , mediante la rotación de la línea recta - desde el punto^ x 2^ , y 2^ - en cualquier

dirección, como muestra la figura 2.5, porque u ˆ 3 (^)   u ˆ 1. En otras palabras, haciendo

girar de esta manera la recta, se obtiene siempre el resultado de que

3

 i  1 u ˆ^ i ^0. Este

simple ejemplo muestra que este criterio no es adecuado para la estimación de los parámetros, ya que, para cualquier conjunto de observaciones, existe un número infinito de líneas rectas que satisfacen este criterio.

Criterio 2 Con el fin de evitar la compensación de los residuos positivos con los negativos, de acuerdo con este criterio se toman los valores absolutos de los residuos. En este caso se minimizaría la siguiente expresión:

Min 1

n i i

u

Desgraciadamente, aunque los estimadores así obtenidos tienen algunas propiedades interesantes, su cálculo es complicado, requiriendo la resolución de un problema de programación lineal o la aplicación de un procedimiento de cálculo iterativo.

Criterio 3 Un tercer método consiste en minimizar la suma de los cuadrados de los residuos, es decir,

2 1

Min Min ˆ

n i i

S u

Los estimadores obtenidos se denominan estimadores de mínimos cuadrados ( MC ), y gozan de ciertas propiedades estadísticas deseables, que se estudiarán más

y

x 1 x 2 x 3 x

x

x

1 2

y  ˆ^  ˆ x (2-15)

Por tanto,

1 2

ˆ  y  ˆ x (2-16)

Sustituyendo este valor de ˆ 1 en la segunda ecuación normal (2-14), se obtiene

que

2 2 2 1 1 1

( ˆ^ ) ˆ

n n n i i i i i i i

y x y  x x  x

  

 ^ ^   

2 2 2 1 1 1 1

n n n n i i i i i i i i i

y x y x  x x  x

   

 ^  ^   

Resolviendo para ˆ 2 se tiene que:

1 1 2 2 1 1

n n i i i i i n n i i i i

y x y x

x x x

 ^ 

 

O, como se puede ver en el apéndice 2.1,

1 2 2 1

n i i i n i i

y y x x

x x

Si dividimos numerador y denominador de (2-18) por n , se puede ver que ˆ 2 es

el cociente entre la covarianza de las dos variables y la varianza de x. Por lo tanto, el

signo de ˆ^2 es el mismo que el signo de la covarianza.

Una vez calculado ˆ 2 , se puede obtener ˆ 1 utilizando la ecuación (2-16).

Estos son los estimadores de MC. Dado que existen métodos más complejos, que también se denominan de MC , al método que acabamos de desarrollar le denominaremos método de mínimos cuadrados ordinarios ( MCO ), debido a su simplicidad.

En los epígrafes precedentes, ˆ 1 y ˆ 2 se han utilizado para designar estimadores

genéricos. A partir de ahora con esta notación sólo designaremos a los estimadores MCO.

EJEMPLO 2.1 La estimación de la función de consumo Dada la función de consumo keynesiana, cons   1   2 rentaui

vamos a estimarla utilizando los datos de 6 hogares que aparecen en el cuadro 2.1.

C UADRO 2.1. Datos y cálculos para estimar la función de consumo.

Observ. consi^ rentai^ consi^ ^ rentai renta i^^2 consiconsrentairenta

( )

( )

i

i

cons cons

renta renta

  

( )^2 rentairenta

1 5 6 30 36 -4 -5 20 25 2 7 9 63 81 -2 -2 4 4 3 8 10 80 100 -1 -1 1 1 4 10 12 120 144 1 1 1 1 5 11 13 143 169 2 2 4 4 6 13 16 208 256 4 5 20 25 Suma 54 66 644 786 0 0 50 60

Calculando cons y renta , y aplicando la fórmula (2-17), o alternativamente (2-18), a los datos de la cuadro 2.1, obtenemos: 54 9 6 cons   ;^ 66 11 6 renta   ;(2-17):^2 ˆ 644 9 66

786 11 66       

 ;(2-18): ˆ 2 50 0. 60   

Aplicando después (2-16), obtenemos que  ˆ 1 9 ^ 0.83^ ^11  0.

 

2.3 Algunas características de los estimadores de MCO

2.3.1 Implicaciones algebraicas de la estimación

Las implicaciones algebraicas de la estimación son derivadas exclusivamente de la aplicación del procedimiento de MCO al modelo de regresión lineal simple:

1. La suma de los residuos de MCO es igual a 0 :

1

n i i

u

De la definición de los residuos:

1 2

ˆ ˆ ˆ^ ˆ 1, 2, ,

ui  yi  yi  yi     xi i   n (2-20)

Si sumamos para las n observaciones, se obtiene:

1 2 1 1

ˆ ( ˆ^ ˆ ) 0

n n i i i i i

u y   x

 

 ^  ^ ^  (2-21)

que es precisamente la primera ecuación (2-11) del sistema de ecuaciones normales.

Obsérvese que, si (2-19) se cumple, esto implica que

1 1

n n i i i i

y y  

y, dividiendo (2-19) y (2-22) por n, se obtiene

u ˆ^  0 yy ˆ (2-23)

2. La recta de regresión de MCO pasa necesariamente por el punto ( x , y ). Efectivamente, dividiendo la ecuación (2-13) por n , se obtiene:

1 2

y  ˆ^  ˆ x (2-24)

(^2 2 )

 yi^ ^ y^ ^  (^ ˆ y^ i^ ^ y ˆ^^ )  u ˆ i (2-29)

En palabras, Suma de cuadrados totales ( SCT ) = Suma de cuadrados explicados ( SCE )+Suma de los cuadrados de los residuos ( SCR ) Debe recalcarse que se debe cumplir la relación (2-19) para asegurar que (2-28) es igual a 0. Hay que recordar que (2-19) está asociada a la primera ecuación normal, es decir, a la ecuación correspondiente al término independiente. Si en el modelo ajustado no hay término independiente, entonces, en general, no se cumplirá la descomposición obtenida en (2-29).

Esta descomposición puede aplicarse a las varianzas, dividiendo ambos miembros de (2-29) por n :

(^2 2 ) yi y ( y ˆ^ i y ˆ^ ) u ˆ i n n n

En palabras, Varianza total=varianza explicada+ varianza residual

2.3.3 Bondad del ajuste: Coeficiente de determinación ( R^2 )

A priori , se han obtenido unos estimadores que minimizan la suma de los cuadrados de los residuos.

Ahora, una vez hecha la estimación, podremos ver en qué medida la recta de regresión muestral se ajusta a los datos.

Una medida que indique el grado de ajuste de la recta de regresión muestral con los datos se denomina medida de bondad del ajuste. Vamos a estudiar ahora la medida

más conocida: el coeficiente de determinación o R cuadrado ( R^2 ). Esta medida se define de la siguiente manera:

2 (^2 ) 2 1

n i i n i i y y R y y

Por lo tanto, R^2 es la proporción de la suma de cuadrados totales ( SCT ), que se explica por la regresión ( SCE ), es decir, que se explica por el modelo. También podemos decir que 100 es el porcentaje de variación muestral de y explicada por x.

Alternativamente, teniendo en cuenta (2-29), tenemos:

( ˆ^ ˆ^ ) 2 ( )^2 ˆ^2

 yi^ ^ y^ ^  yi^ ^ y^  ui

Substituyendo en (2-31), tenemos

(^2 ) 2 2 (^2 ) 2 2 2 1 1 1

( ˆ^ ˆ)

( ) ˆ^ ˆ

n i i i^ i^ i n n n i i i i i i

y y y y u u (^) SCR R SCT y y y y y y

  

R^2

Por lo tanto, es igual a 1 menos la proporción de la suma de cuadrados totales ( SCT ), que no es explicada por la regresión ( SCR ).

De acuerdo con la definición de , debe cumplirse que 0  R^2  1 Casos extremos :

a) Si el ajuste es perfecto, entonces se verificará u ˆ^ í^ ^0  i^. Esto implica que

ˆ (^) ( ˆ ˆ)^2 ( )^2

yí  yí  i   yi  y   yi  y  R 

b) Si y ˆ íci , esto implica que

ˆ ˆ ˆ 0 ( ˆ ˆ) 2 0 2 0

y  c  yi  y  c  c   i   yi  y   R 

Si está próximo a cero, esto implica que el ajuste no es bueno. En otras palabras, hay muy poca variación de y que sea explicada por x.

En muchos casos, se obtiene un elevado cuando se ajusta un modelo utilizando datos de series temporales, debido al efecto de una tendencia común. Por el contrario, cuando utilizamos datos de corte transversal es frecuente obtener valores bajos, pero esto no significa que el modelo ajustado sea malo.

¿Cuál es la relación entre el coeficiente de determinación y el coeficiente de correlación estudiados en estadística descriptiva? El coeficiente de determinación es igual al coeficiente de correlación al cuadrado, como puede verse en el apéndice 2.2:

2 2

r xy  R (2-33)

(Esta igualdad es válida en el modelo de regresión lineal simple, pero no en el modelo de regresión lineal múltiple)

EJEMPLO 2.2 Cumplimiento de las propiedades algebraicas y R^2 en la función de consumo

En la columna 2 del cuadro 2.2, se calcula consi ; en las columnas 3, 4 y 5, puede verse el cumplimiento de las implicaciones algebraicas 1, 3 y 4, respectivamente. En el resto de las columnas se realizan cálculos con el fin de obtener

2 41.67^ 0. 42

SCT   SCE   SCR       R  

o, alternativamente, 2 0.33^ 0. 42

R   

C UADRO 2.2. Datos y cálculos para estimar la función de consumo.

Observ.consi u ˆ i^ u ˆ i^ ^ rentai consi^ ´ u ˆ i cons i^2 ( consicons )^2 cons ^2 i ( consi^ -  cons^ )^2

1 4.83 0.17 1.00 0.81 25 16 23.36 17. 2 7.33 -0.33 -3.00 -2.44 49 4 53.78 2. 3 8.17 -0.17 -1.67 -1.36 64 1 66.69 0. 4 9.83 0.17 2.00 1.64 100 1 96.69 0. 5 10.67 0.33 4.33 3.56 121 4 113.78 2. 6 13.17 -0.17 -2.67 -2.19 169 16 173.36 17. 54.00 0.00 0.00 0.00 528 42 527.67 41.

R^2

R^2

R^2

R^2

2.4 Las unidades de medida y la forma funcional

2.4.1 Unidades de medida

Cambio de unidades de medida (cambio de escala) en x

Si x es multiplicada/dividida por una constante c 0, entonces la pendiente de MCO queda dividida/multiplicada por la misma constante, c. Así

2 1

yi (^) c xi c

 

EJEMPLO 2.

Supongamos la siguiente función del consumo estimado, en la que ambas variables se miden en miles de euros:

cons^ ^ i = 0.2 + 0.85´ renta (^) i (2-39) Si ahora se expresan la renta en euros (multiplicando por 1000) y se designa por rentae , el modelo ajustado a las nuevas unidades de medida de la renta será el siguiente:

cons^  i^  0.2  0.00085 rentaei Como puede verse, el cambio de las unidades de medida de la variable explicativa no afecta al término independiente.

Cambio de unidades de medida (cambio de escala) en y

Si y es multiplicada/dividida por una constante c 0, entonces la pendiente y el término independiente calculados por MCO se multiplican/dividen por la misma constante, c. Así,

1 2

( ˆ ) ( ˆ^ ) ( ˆ )

yi  c    c    c xi (2-40)

EJEMPLO 2.

Si expresamos, en el modelo (2-39), el consumo en euros (multiplicando por 1000) y lo denominamos conse , el modelo ajustado a las nuevas unidades de medida del consumo será el siguiente:

conse^  i^  200  850  inci

Cambio del origen

Si se suma/resta una constante d a x y/o y , entonces la pendiente MCO no se ve afectada. Sin embargo, si se cambia el origen de x y/o y el término independiente de la regresión sí se ve afectado.

Si se resta una constante d a x , el término independiente cambia de la siguiente manera:

y ˆ (^) i  ( ˆ 1  ˆ 2  d )  ˆ 2 ( xid ) (2-41)

Si se resta una constante d a y , el término independiente cambia de la siguiente manera:

1 2

ˆ ( ˆ^ ) ˆ

yi  d    d   xi (2-42)

EJEMPLO 2.

Supongamos que la renta media es de 20 mil euros. Si definimos la variable rentad irentairenta y ambas variables se miden en miles de euros, el modelo ajustado con este cambio en el origen será el siguiente:

cons^ ^ (^) i  (0.2  0.85  20)  0.85  ( rentai  20)  17.2  0.85 rentadi

EJEMPLO 2.

Supongamos que el consumo medio es de 15 mil euros. Si definimos la variable consd iconsicons y medimos ambas variables en euros, el modelo ajustado con el cambio en el origen será el siguiente:

cons^ ^ i  15  0.2  15  0.85 rentai

Es decir,

 (^) i 14.8 0. consd = - + ´ rentai Hay que observar que R^2 no varía al realizar cambios de unidades de x y/o y , y tampoco varia cuando se cambia el origen de las variables.

2.4.2 Forma funcional

En muchos casos las relaciones lineales no son adecuadas en las aplicaciones económicas. Sin embargo, en el modelo de regresión simple podemos incorporar no linealidades (en las variables) redefiniendo de forma apropiada la variable dependiente y la variable independiente.

Algunas definiciones

Vamos a estudiar ahora algunas definiciones de las medidas de variación que serán útiles en la interpretación de los coeficientes de distintas formas funcionales. En concreto, vamos a estudiar las siguientes medidas: cambio proporcional y cambio en logaritmos.

El cambio proporcional (o tasa de variación relativa) entre x 1 y x 0 viene dado

por:

1 1 0 0 0

x x x x x

Multiplicando un cambio proporcional por 100 se obtiene un cambio proporcional en %. Es decir:

1 0

x x

El cambio en logaritmos y el cambio en logaritmos en % entre x 1^ y x 0^ , vienen

dados por

ln( ) ln( 1 ) ln( 0 ) 100 ln( )%

x x x x

El cambio en logaritmos es una aproximación del cambio proporcional , como puede verse en el apéndice 2.3. Esta aproximación es buena cuando la variación es

ye^ ^1 x ^2

Si se introduce el término de perturbación de forma multiplicativa se obtiene

ye^ ^1 x ^2 eu (2-48)

Tomando logaritmos en ambos miembros de (2-48), se obtiene un modelo lineal en los parámetros:

ln( ) y   1   2 ln( ) x  u (2-49)

Por el contrario, si se introduce el término de perturbación de forma aditiva, se obtiene

ye^ ^1 x ^2  u

En este caso no existe una transformación que permita convertirlo en un modelo lineal. Será, por tanto, un modelo no linealizable.

Ahora, vamos a considerar algunos modelos con formas funcionales alternativas, pero todos ellos son lineales en los parámetros. Estudiaremos en cada caso la

interpretación del coeficiente ˆ 2 :

a) Modelo lineal

El coeficiente ˆ 2 mide el efecto del regresor x sobre y. Veamos esto con detalle.

La observación i de la función de regresión muestral se expresa de acuerdo con (2-5) por

y ˆ i  ˆ 1  ˆ 2 xi (2-50)

Consideremos ahora la observación h del modelo ajustado en la cual el valor del regresor y, en consecuencia, del regresando han cambiado con respecto a (2-50):

1 2

ˆ ˆ^ ˆ

yh     xh (2-51)

Si restamos (2-51) de (2-50), vemos que x tiene un efecto lineal sobre y ˆ :

1

ˆ y  ˆ x (2-52)

donde ˆ y^^ ^ y ˆ^ i^ ^ y ˆ^ h^ y  x^^ ^ xi^  xh

Por lo tanto, ˆ 2 es el cambio producido en y (en las unidades en qué esté medida

y ) al cambiar x en una unidad (en las unidades en qué esté medida x ).

Por ejemplo, en la función ajustada (2-39), si la renta aumenta en una unidad, el consumo se incrementará en 0.85 unidades.

La linealidad de este modelo implica que un cambio de una unidad en x tiene siempre el mismo efecto en y , con independencia del valor de x considerado.

EJEMPLO 2.7 Cantidad de café vendido como una función de su precio. Modelo lineal

En un experimento de marketing^1 se formuló el siguiente modelo para explicar la cantidad de café vendido por semana ( coffqty ) en función del precio del café ( coffpric ).

coffqty   1   2 coffpricu La variable coffpric toma el valor 1, el precio habitual, y también los valores 0.95 y 0.85 en dos acciones cuyos efectos están bajo investigación. El experimento duró 12 semanas, coffqty está expresado en miles de unidades y coffpric en francos franceses. Los datos aparecen en el cuadro 2.4 y en el fichero coffee.

El modelo ajustado es el siguiente: coffqty^ ^   - 693.33 coffpric R^2  0.95 n  

Interpretación del coeficiente ˆ 2 : si el precio del café se incrementa en 1 franco francés, la cantidad vendida de café se reducirá en 693.33 miles de unidades. En la medida que el precio del café es una magnitud pequeña, es preferible dar la siguiente interpretación: si aumenta el precio del café en 1 céntimo de franco francés, la cantidad vendida de café se reducirá en 6.93 miles de unidades.

C UADRO 2.4. Datos sobre cantidades y precios del café. semana coffpric coffqty 1 1.00 89 2 1.00 86 3 1.00 74 4 1.00 79 5 1.00 68 6 1.00 84 7 0.95 139 8 0.95 122 9 0.95 102 10 0.85 186 11 0.85 179 12 0.85 187

EJEMPLO 2.8 Explicando el valor de mercado de los bancos españoles. Modelo lineal

Utilizando datos de la Bolsa de Madrid ( Bolsa de Madrid ) del 18 de agosto de 1995 (fichero bolmad95 , 20 primeras observaciones), se ha estimado el siguiente modelo para explicar el valor de mercado de bancos e instituciones financieras:

marktval^ ^  29.42 +1.219 bookval R^2 =0.836 n =

donde

- marktval es el valor en mercado de una empresa. Se calcula multiplicando el precio de la acción por el número de acciones emitidas. - bookval es el valor contable o el valor neto de la compañía. El valor contable se calcula como la diferencia entre los activos de una empresa y sus pasivos. - Los datos de marktval y bookval están expresados en millones de pesetas. Interpretación del coeficiente β 2: si el valor contable de un banco se incrementa en 1 millón de pesetas, la capitalización de mercado de ese banco se incrementará en 1.219 millones de pesetas.

(^1) Los datos de este ejercicio se han obtenido de un experimento controlado de marketing, sobre el

gasto en café en tiendas de París. La referencia es A. C.Bemmaor and D. Mouchoux, “Measuring the Short-Term Effect of In-Store Promotion and Retail Advertising on Brand Sales: A Factorial Experiment”. Journal of Marketing Research , 28 ( 1991), 202–14.

Por lo tanto, si x aumenta en 1%, entonces y ˆ se incrementará un ˆ 2 %. Hay que

resaltar que, en este modelo, ˆ 2 es la elasticidad estimada de y con respecto a x , para

cualquier valor de x e y. En consecuencia, en este modelo la elasticidad es constante.

En el anexo 1 en un caso de estudio de la curva de Engel para la demanda de productos lácteos se analizan seis formas funcionales alternativas.

EJEMPLO 2.9 Cantidad de café vendido en función de su precio. Modelo doblemente logarítmico (Continuación del ejemplo 2.7)

Como una alternativa al modelo lineal se ha estimado el modelo doblemente logarítmico:

ln( coffqty^ ^ )   - 5.132ln( coffpric ) R^2  0.90 n  

Interpretación del coeficiente ˆ 2 : si el precio del café aumenta en un 1%, la cantidad vendida de

café se reducirá en un 5,13%. En este caso, ˆ 2 es el estimador de la elasticidad de la demanda/precio.

EJEMPLO 2.10 Explicando el valor de mercado de los bancos españoles. M odelo doblemente logarítmico (Continuación del ejemplo 2.8)

Utilizando datos del ejemplo 2.8, se ha estimado el siguiente modelo doblemente logarítmico:

ln(^  marktval )  0.6756 +0.938ln( bookval ) R^2 =0.928^ n = Interpretación del coeficiente ˆ 2 : si el valor contable de un banco se incrementa en 1%, el valor

de mercado de ese banco se incrementará en un 0.938%. En este caso ˆ 2 es el estimador de la elasticidad del valor de mercado/valor contable.

En el cuadro 2.5 se muestra, para el modelo ajustado, la interpretación de los cuatro modelos estudiados. Si hubiéramos considerando el modelo poblacional en lugar del muestral, la interpretación de  2 es la misma pero teniendo en cuenta que  u debería ser igual a 0.

C UADRO 2.5. Interpretación de ˆ 2 en los diferentes modelos. Modelo Si x aumenta en (^) se incrementará enentonces^ y lineal 1 unidad ˆ 2 unidades lineal logarítmico 1% ( ˆ 2 /100)unidades logarítmico lineal 1 unidad (100 ˆ 2 )% doblemente logarítmico 1%^2 ˆ %

2.5 Supuestos y propiedades estadísticas de los MCO

Vamos ahora a estudiar las propiedades estadísticas de los estimadores de MCO , 1

ˆ y

2

ˆ , del modelo de regresión lineal simple. Previamente, es necesario formular un

conjunto de supuestos estadísticos. Específicamente, al conjunto de supuestos que vamos a formular se les denomina supuestos del modelo lineal cásico ( MLC ). Es de resaltar que los supuestos del MLC son sencillos, y que los estimadores MCO tienen, bajo estos supuestos, muy buenas propiedades.

2.5.1 Supuestos estadísticos del MLC en regresión lineal simple

a) Supuesto sobre la forma funcional

1) La relación entre el regresando, regresor y perturbación aleatoria es lineal en los parámetros:

y   1   2 x  u (2-58)

El regresando y los regresores pueden ser cualquier función de la variable endógena y de las variables explicativas, respectivamente, a condición de que entre los regresores y el regresando exista una relación lineal. Es decir, el modelo es lineal en los parámetros. La aditividad de la perturbación garantiza la relación lineal con el resto de los elementos.

b) Supuestos sobre el regresor x

2) Los valores que toma x son fijos en repetidas muestras : De acuerdo con este supuesto, cada observación del regresor toma el mismo valor para diferentes muestras del regresando. Este es un supuesto fuerte en el caso de las ciencias sociales, donde, en general, no es posible la experimentación. Los datos se obtienen mediante observación, no mediante experimentación. Es importante destacar que los resultados obtenidos basados en este supuesto permanecen virtualmente idénticos a los que se obtienen cuando asumimos que los regresores son estocásticos, siempre, que postulemos el supuesto adicional de independencia entre los regresores y la perturbación aleatoria. Este supuesto alternativo se puede formular así:

2*) El regresor x se distribuye de forma independiente de la perturbación aleatoria. En cualquier caso, a lo largo de este capítulo y los siguientes vamos a adoptar el supuesto 2.

3 ) El regresor x no contiene errores de medición Se trata de un supuesto que a menudo no se cumple en la práctica, ya que los instrumentos de medición no son siempre fiables en la economía. Pensemos, por ejemplo, en la multitud de errores que se pueden cometer en la recopilación de información cuando se realizan encuestas a las familias.

4) La varianza muestral de x es distinta de 0 y tiene un límite finito cuando n tiende a infinito

Por lo tanto, este supuesto implica que

2 (^2 1 )

n i X i

x x S n

c) Supuesto sobre los parámetros

5) Los parámetros  1 y  2 son fijos

Si no se adopta este supuesto, el modelo de regresión sería muy difícil de aplicar. En cualquier caso, puede ser aceptable postular que los parámetros del modelo son estables en el tiempo (si no es un período muy largo) o en el espacio (si es relativamente limitado).