









































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Econometría, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UV
Tipo: Apuntes
1 / 49
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!










































Ezequiel Uriel Universidad de Valencia 09-
2.1 Algunas definiciones en el modelo de regresión simple 1 2.1.1 El modelo de regresión poblacional y la función de regresión poblacional 1 2.1.2 La función de regresión muestral 3 2.2 Obtención de las estimaciones por Mínimos Cuadrados Ordinarios ( MCO ) 4 2.2.1 Diferentes criterios de estimación 4 2.2.2 Aplicación del criterio de mínimo cuadrados 6 2.3 Algunas características de los estimadores de MCO 8 2.3.1 Implicaciones algebraicas de la estimación 8 2.3.2 Descomposición de la varianza de y 9 2.3.3 Bondad del ajuste: Coeficiente de determinación ( R^2 ) 10 2.3.4 Regresión a través del origen 12 2.4 Las unidades de medida y la forma funcional 13 2.4.1 Unidades de medida 13 2.4.2 Forma funcional 14 2.5 Supuestos y propiedades estadísticas de los MCO 19 2.5.1 Supuestos estadísticos del MLC en regresión lineal simple 20 2.5.2 Propiedades deseables de los estimadores 22 2.5.3 Propiedades estadísticas de los estimadores MCO 23 Ejercicios 27 Anexo 2.1 Un caso de estudio: Curvas de Engel para la demanda de productos lácteos 34 Apéndices 40
Apéndice 2.2. Demostración de que r xy^2 R^241 Apéndice 2.3. Cambio proporcional versus cambio en logaritmos 41 Apéndice 2.4. Demostración de que los estimadores MCO son lineales e insesgados 42
Apéndice 2.6. Demostración del teorema de Gauss-Markov para la pendiente en la regresión simple 43 Apéndice 2.7. Demostración de que ^2
es un estimador insesgado de la varianza de las perturbaciones 45 Apéndice 2.8. Consistencia de los estimadores de MCO 47 Apéndice 2.9 Estimación por máxima verosimilitud 48
2.1.1 El modelo de regresión poblacional y la función de regresión poblacional
En el modelo de regresión simple, el modelo de regresión poblacional o, simplemente, el modelo poblacional es el siguiente:
Vamos a ver los diferentes elementos del modelo (2-1) y la terminología utilizada para designarlos. En primer lugar, en el modelo hay tres tipos de variables: y , x y u. En este modelo el único un factor explícito para explicar y es x. El resto de los factores que afectan a y están recogidos en u.
Denominamos a y variable endógena (del griego: generada dentro) o variable dependiente. Se utilizan también otras denominaciones para designar a y : variable
explicada o regresando. En este modelo todas estas denominaciones son equivalentes, pero en otros modelos, como veremos más adelante, puede haber algunas diferencias.
En la regresión lineal simple de y sobre x , a la variable x se le denomina variable exógena (del griego: generado fuera de) o variable independiente. Otras denominaciones utilizadas también para designar a x son: variable explicativa, regresor, covariable o variable de control. Todas estas denominaciones son equivalentes, pero en otros modelos, como veremos más adelante, puede haber algunas diferencias.
La variable u recoge todos aquellos factores distintos de x que afectan a y. Es denominada error o perturbación aleatoria. El término de perturbación puede captar también el error de medición de la variable dependiente. La perturbación es una variable no observable.
En el segundo miembro de (2-1) se pueden distinguir dos componentes: un
componente sistemático, podemos escribir:
Esta ecuación es conocida como la función de regresión poblacional ( FRP ) o
La linealidad significa que un aumento de una unidad en x implica que el valor
Ahora, supongamos que disponemos de una muestra aleatoria de tamaño n {( y (^) i , x (^) i ): i = 1, ..., n } extraída de la población estudiada. En el diagrama de dispersión de la figura 2.2, se muestran los hipotéticos valores de la muestra.
FIGURA 2.1. La función de regresión poblacional. ( FRP )
FIGURA 2.2. Diagrama de dispersión.
El modelo poblacional para cada observación de la muestra se puede expresar de la siguiente forma:
y
x
1
2 i^
x
^
^
^
y
x
(^)
FIGURA 2.3. La función de regresión poblacional y el diagrama de dispersión.
FIGURA 2.4. La función de regresión muestral y el diagrama de dispersión.
desconocidos.
2.2.1 Diferentes criterios de estimación
Antes de obtener las estimaciones por mínimos cuadrados, vamos a examinar tres métodos alternativos para ilustrar el problema que tenemos planteado. Estos tres métodos tienen en común que tratan de minimizar, de alguna forma, el valor de los residuos en su conjunto.
Criterio 1
valores que hagan la suma de todos los residuos tan próxima a cero como sea posible. Con este criterio la expresión a minimizar sería la siguiente:
Min 1
n i i
u
El problema principal de este método de estimación radica en que los residuos de distinto signo pueden compensarse. Tal situación puede observarse gráficamente en la figura 2.5, en la que se representan tres observaciones alineadas, ( x (^) i , y i ), ( ) y
( x 3 (^) , y 3 ). En este caso, ocurre lo siguiente:
2 1 3 1 2 1 3 1
y y y y x x x x
y
x
(^)
yi
μy
μyi
xi
ui
1
2 i^
x
^
^
^
y
x
(^)
xi
yi u ˆ i y^ ˆ i
y^ ˆ i
1 ˆ^ ˆ^2 ˆ i
i y^
x ^ ^
x 2 (^) , y 2
FIGURA 2.5. Los problemas del criterio 1. Si una línea recta se ajusta de forma que pase a través de los tres puntos, cada uno de los residuos tomará el valor cero, de modo que
3
1
ˆ (^) i 0 i
u
Este ajuste podría ser considerado óptimo. Pero también es posible obtener 3
dirección, como muestra la figura 2.5, porque u ˆ 3 (^) u ˆ 1. En otras palabras, haciendo
girar de esta manera la recta, se obtiene siempre el resultado de que
3
simple ejemplo muestra que este criterio no es adecuado para la estimación de los parámetros, ya que, para cualquier conjunto de observaciones, existe un número infinito de líneas rectas que satisfacen este criterio.
Criterio 2 Con el fin de evitar la compensación de los residuos positivos con los negativos, de acuerdo con este criterio se toman los valores absolutos de los residuos. En este caso se minimizaría la siguiente expresión:
Min 1
n i i
u
Desgraciadamente, aunque los estimadores así obtenidos tienen algunas propiedades interesantes, su cálculo es complicado, requiriendo la resolución de un problema de programación lineal o la aplicación de un procedimiento de cálculo iterativo.
Criterio 3 Un tercer método consiste en minimizar la suma de los cuadrados de los residuos, es decir,
2 1
Min Min ˆ
n i i
S u
Los estimadores obtenidos se denominan estimadores de mínimos cuadrados ( MC ), y gozan de ciertas propiedades estadísticas deseables, que se estudiarán más
y
x 1 x 2 x 3 x
x
x
1 2
Por tanto,
1 2
que
2 2 2 1 1 1
n n n i i i i i i i
2 2 2 1 1 1 1
n n n n i i i i i i i i i
1 1 2 2 1 1
n n i i i i i n n i i i i
y x y x
x x x
O, como se puede ver en el apéndice 2.1,
1 2 2 1
n i i i n i i
y y x x
x x
el cociente entre la covarianza de las dos variables y la varianza de x. Por lo tanto, el
Estos son los estimadores de MC. Dado que existen métodos más complejos, que también se denominan de MC , al método que acabamos de desarrollar le denominaremos método de mínimos cuadrados ordinarios ( MCO ), debido a su simplicidad.
genéricos. A partir de ahora con esta notación sólo designaremos a los estimadores MCO.
EJEMPLO 2.1 La estimación de la función de consumo Dada la función de consumo keynesiana, cons 1 2 renta ui
vamos a estimarla utilizando los datos de 6 hogares que aparecen en el cuadro 2.1.
C UADRO 2.1. Datos y cálculos para estimar la función de consumo.
Observ. consi^ rentai^ consi^ ^ rentai renta i^^2 consi consrentai renta
( )
( )
i
i
cons cons
renta renta
( )^2 rentai renta
1 5 6 30 36 -4 -5 20 25 2 7 9 63 81 -2 -2 4 4 3 8 10 80 100 -1 -1 1 1 4 10 12 120 144 1 1 1 1 5 11 13 143 169 2 2 4 4 6 13 16 208 256 4 5 20 25 Suma 54 66 644 786 0 0 50 60
Calculando cons y renta , y aplicando la fórmula (2-17), o alternativamente (2-18), a los datos de la cuadro 2.1, obtenemos: 54 9 6 cons ;^ 66 11 6 renta ;(2-17):^2 ˆ 644 9 66
786 11 66
;(2-18): ˆ 2 50 0. 60
Aplicando después (2-16), obtenemos que ˆ 1 9 ^ 0.83^ ^11 0.
2.3.1 Implicaciones algebraicas de la estimación
Las implicaciones algebraicas de la estimación son derivadas exclusivamente de la aplicación del procedimiento de MCO al modelo de regresión lineal simple:
1. La suma de los residuos de MCO es igual a 0 :
1
n i i
u
De la definición de los residuos:
1 2
Si sumamos para las n observaciones, se obtiene:
1 2 1 1
n n i i i i i
que es precisamente la primera ecuación (2-11) del sistema de ecuaciones normales.
Obsérvese que, si (2-19) se cumple, esto implica que
1 1
n n i i i i
y y
y, dividiendo (2-19) y (2-22) por n, se obtiene
u ˆ^ 0 y y ˆ (2-23)
2. La recta de regresión de MCO pasa necesariamente por el punto ( x , y ). Efectivamente, dividiendo la ecuación (2-13) por n , se obtiene:
1 2
(^2 2 )
En palabras, Suma de cuadrados totales ( SCT ) = Suma de cuadrados explicados ( SCE )+Suma de los cuadrados de los residuos ( SCR ) Debe recalcarse que se debe cumplir la relación (2-19) para asegurar que (2-28) es igual a 0. Hay que recordar que (2-19) está asociada a la primera ecuación normal, es decir, a la ecuación correspondiente al término independiente. Si en el modelo ajustado no hay término independiente, entonces, en general, no se cumplirá la descomposición obtenida en (2-29).
Esta descomposición puede aplicarse a las varianzas, dividiendo ambos miembros de (2-29) por n :
(^2 2 ) yi y ( y ˆ^ i y ˆ^ ) u ˆ i n n n
En palabras, Varianza total=varianza explicada+ varianza residual
2.3.3 Bondad del ajuste: Coeficiente de determinación ( R^2 )
A priori , se han obtenido unos estimadores que minimizan la suma de los cuadrados de los residuos.
Ahora, una vez hecha la estimación, podremos ver en qué medida la recta de regresión muestral se ajusta a los datos.
Una medida que indique el grado de ajuste de la recta de regresión muestral con los datos se denomina medida de bondad del ajuste. Vamos a estudiar ahora la medida
más conocida: el coeficiente de determinación o R cuadrado ( R^2 ). Esta medida se define de la siguiente manera:
2 (^2 ) 2 1
n i i n i i y y R y y
Por lo tanto, R^2 es la proporción de la suma de cuadrados totales ( SCT ), que se explica por la regresión ( SCE ), es decir, que se explica por el modelo. También podemos decir que 100 es el porcentaje de variación muestral de y explicada por x.
Alternativamente, teniendo en cuenta (2-29), tenemos:
( ˆ^ ˆ^ ) 2 ( )^2 ˆ^2
Substituyendo en (2-31), tenemos
(^2 ) 2 2 (^2 ) 2 2 2 1 1 1
n i i i^ i^ i n n n i i i i i i
y y y y u u (^) SCR R SCT y y y y y y
Por lo tanto, es igual a 1 menos la proporción de la suma de cuadrados totales ( SCT ), que no es explicada por la regresión ( SCR ).
De acuerdo con la definición de , debe cumplirse que 0 R^2 1 Casos extremos :
a) Si el ajuste es perfecto, entonces se verificará u ˆ^ í^ ^0 i^. Esto implica que
ˆ (^) ( ˆ ˆ)^2 ( )^2
b) Si y ˆ í c i , esto implica que
ˆ ˆ ˆ 0 ( ˆ ˆ) 2 0 2 0
Si está próximo a cero, esto implica que el ajuste no es bueno. En otras palabras, hay muy poca variación de y que sea explicada por x.
En muchos casos, se obtiene un elevado cuando se ajusta un modelo utilizando datos de series temporales, debido al efecto de una tendencia común. Por el contrario, cuando utilizamos datos de corte transversal es frecuente obtener valores bajos, pero esto no significa que el modelo ajustado sea malo.
¿Cuál es la relación entre el coeficiente de determinación y el coeficiente de correlación estudiados en estadística descriptiva? El coeficiente de determinación es igual al coeficiente de correlación al cuadrado, como puede verse en el apéndice 2.2:
2 2
(Esta igualdad es válida en el modelo de regresión lineal simple, pero no en el modelo de regresión lineal múltiple)
EJEMPLO 2.2 Cumplimiento de las propiedades algebraicas y R^2 en la función de consumo
En la columna 2 del cuadro 2.2, se calcula cons i ; en las columnas 3, 4 y 5, puede verse el cumplimiento de las implicaciones algebraicas 1, 3 y 4, respectivamente. En el resto de las columnas se realizan cálculos con el fin de obtener
2 41.67^ 0. 42
SCT SCE SCR R
o, alternativamente, 2 0.33^ 0. 42
R
C UADRO 2.2. Datos y cálculos para estimar la función de consumo.
Observ. consi u ˆ i^ u ˆ i^ ^ rentai cons i^ ´ u ˆ i cons i^2 ( consi cons )^2 cons ^2 i ( cons i^ - cons^ )^2
1 4.83 0.17 1.00 0.81 25 16 23.36 17. 2 7.33 -0.33 -3.00 -2.44 49 4 53.78 2. 3 8.17 -0.17 -1.67 -1.36 64 1 66.69 0. 4 9.83 0.17 2.00 1.64 100 1 96.69 0. 5 10.67 0.33 4.33 3.56 121 4 113.78 2. 6 13.17 -0.17 -2.67 -2.19 169 16 173.36 17. 54.00 0.00 0.00 0.00 528 42 527.67 41.
2.4.1 Unidades de medida
Cambio de unidades de medida (cambio de escala) en x
Si x es multiplicada/dividida por una constante c 0, entonces la pendiente de MCO queda dividida/multiplicada por la misma constante, c. Así
2 1
yi (^) c xi c
EJEMPLO 2.
Supongamos la siguiente función del consumo estimado, en la que ambas variables se miden en miles de euros:
cons^ ^ i = 0.2 + 0.85´ renta (^) i (2-39) Si ahora se expresan la renta en euros (multiplicando por 1000) y se designa por rentae , el modelo ajustado a las nuevas unidades de medida de la renta será el siguiente:
cons^ i^ 0.2 0.00085 rentaei Como puede verse, el cambio de las unidades de medida de la variable explicativa no afecta al término independiente.
Cambio de unidades de medida (cambio de escala) en y
Si y es multiplicada/dividida por una constante c 0, entonces la pendiente y el término independiente calculados por MCO se multiplican/dividen por la misma constante, c. Así,
1 2
EJEMPLO 2.
Si expresamos, en el modelo (2-39), el consumo en euros (multiplicando por 1000) y lo denominamos conse , el modelo ajustado a las nuevas unidades de medida del consumo será el siguiente:
conse^ i^ 200 850 inci
Cambio del origen
Si se suma/resta una constante d a x y/o y , entonces la pendiente MCO no se ve afectada. Sin embargo, si se cambia el origen de x y/o y el término independiente de la regresión sí se ve afectado.
Si se resta una constante d a x , el término independiente cambia de la siguiente manera:
y ˆ (^) i ( ˆ 1 ˆ 2 d ) ˆ 2 ( xi d ) (2-41)
Si se resta una constante d a y , el término independiente cambia de la siguiente manera:
1 2
EJEMPLO 2.
Supongamos que la renta media es de 20 mil euros. Si definimos la variable rentad i rentai renta y ambas variables se miden en miles de euros, el modelo ajustado con este cambio en el origen será el siguiente:
cons^ ^ (^) i (0.2 0.85 20) 0.85 ( rentai 20) 17.2 0.85 rentadi
EJEMPLO 2.
Supongamos que el consumo medio es de 15 mil euros. Si definimos la variable consd i consi cons y medimos ambas variables en euros, el modelo ajustado con el cambio en el origen será el siguiente:
cons^ ^ i 15 0.2 15 0.85 rentai
Es decir,
(^) i 14.8 0. consd = - + ´ rentai Hay que observar que R^2 no varía al realizar cambios de unidades de x y/o y , y tampoco varia cuando se cambia el origen de las variables.
2.4.2 Forma funcional
En muchos casos las relaciones lineales no son adecuadas en las aplicaciones económicas. Sin embargo, en el modelo de regresión simple podemos incorporar no linealidades (en las variables) redefiniendo de forma apropiada la variable dependiente y la variable independiente.
Algunas definiciones
Vamos a estudiar ahora algunas definiciones de las medidas de variación que serán útiles en la interpretación de los coeficientes de distintas formas funcionales. En concreto, vamos a estudiar las siguientes medidas: cambio proporcional y cambio en logaritmos.
El cambio proporcional (o tasa de variación relativa) entre x 1 y x 0 viene dado
por:
1 1 0 0 0
x x x x x
Multiplicando un cambio proporcional por 100 se obtiene un cambio proporcional en %. Es decir:
1 0
x x
El cambio en logaritmos y el cambio en logaritmos en % entre x 1^ y x 0^ , vienen
dados por
ln( ) ln( 1 ) ln( 0 ) 100 ln( )%
x x x x
El cambio en logaritmos es una aproximación del cambio proporcional , como puede verse en el apéndice 2.3. Esta aproximación es buena cuando la variación es
y e^ ^1 x ^2
Si se introduce el término de perturbación de forma multiplicativa se obtiene
y e^ ^1 x ^2 eu (2-48)
Tomando logaritmos en ambos miembros de (2-48), se obtiene un modelo lineal en los parámetros:
Por el contrario, si se introduce el término de perturbación de forma aditiva, se obtiene
y e^ ^1 x ^2 u
En este caso no existe una transformación que permita convertirlo en un modelo lineal. Será, por tanto, un modelo no linealizable.
Ahora, vamos a considerar algunos modelos con formas funcionales alternativas, pero todos ellos son lineales en los parámetros. Estudiaremos en cada caso la
a) Modelo lineal
La observación i de la función de regresión muestral se expresa de acuerdo con (2-5) por
Consideremos ahora la observación h del modelo ajustado en la cual el valor del regresor y, en consecuencia, del regresando han cambiado con respecto a (2-50):
1 2
Si restamos (2-51) de (2-50), vemos que x tiene un efecto lineal sobre y ˆ :
1
donde ˆ y^^ ^ y ˆ^ i^ ^ y ˆ^ h^ y x^^ ^ xi^ xh
y ) al cambiar x en una unidad (en las unidades en qué esté medida x ).
Por ejemplo, en la función ajustada (2-39), si la renta aumenta en una unidad, el consumo se incrementará en 0.85 unidades.
La linealidad de este modelo implica que un cambio de una unidad en x tiene siempre el mismo efecto en y , con independencia del valor de x considerado.
EJEMPLO 2.7 Cantidad de café vendido como una función de su precio. Modelo lineal
En un experimento de marketing^1 se formuló el siguiente modelo para explicar la cantidad de café vendido por semana ( coffqty ) en función del precio del café ( coffpric ).
coffqty 1 2 coffpric u La variable coffpric toma el valor 1, el precio habitual, y también los valores 0.95 y 0.85 en dos acciones cuyos efectos están bajo investigación. El experimento duró 12 semanas, coffqty está expresado en miles de unidades y coffpric en francos franceses. Los datos aparecen en el cuadro 2.4 y en el fichero coffee.
El modelo ajustado es el siguiente: coffqty^ ^ - 693.33 coffpric R^2 0.95 n
Interpretación del coeficiente ˆ 2 : si el precio del café se incrementa en 1 franco francés, la cantidad vendida de café se reducirá en 693.33 miles de unidades. En la medida que el precio del café es una magnitud pequeña, es preferible dar la siguiente interpretación: si aumenta el precio del café en 1 céntimo de franco francés, la cantidad vendida de café se reducirá en 6.93 miles de unidades.
C UADRO 2.4. Datos sobre cantidades y precios del café. semana coffpric coffqty 1 1.00 89 2 1.00 86 3 1.00 74 4 1.00 79 5 1.00 68 6 1.00 84 7 0.95 139 8 0.95 122 9 0.95 102 10 0.85 186 11 0.85 179 12 0.85 187
EJEMPLO 2.8 Explicando el valor de mercado de los bancos españoles. Modelo lineal
Utilizando datos de la Bolsa de Madrid ( Bolsa de Madrid ) del 18 de agosto de 1995 (fichero bolmad95 , 20 primeras observaciones), se ha estimado el siguiente modelo para explicar el valor de mercado de bancos e instituciones financieras:
marktval^ ^ 29.42 +1.219 bookval R^2 =0.836 n =
donde
- marktval es el valor en mercado de una empresa. Se calcula multiplicando el precio de la acción por el número de acciones emitidas. - bookval es el valor contable o el valor neto de la compañía. El valor contable se calcula como la diferencia entre los activos de una empresa y sus pasivos. - Los datos de marktval y bookval están expresados en millones de pesetas. Interpretación del coeficiente β 2: si el valor contable de un banco se incrementa en 1 millón de pesetas, la capitalización de mercado de ese banco se incrementará en 1.219 millones de pesetas.
(^1) Los datos de este ejercicio se han obtenido de un experimento controlado de marketing, sobre el
gasto en café en tiendas de París. La referencia es A. C.Bemmaor and D. Mouchoux, “Measuring the Short-Term Effect of In-Store Promotion and Retail Advertising on Brand Sales: A Factorial Experiment”. Journal of Marketing Research , 28 ( 1991), 202–14.
cualquier valor de x e y. En consecuencia, en este modelo la elasticidad es constante.
En el anexo 1 en un caso de estudio de la curva de Engel para la demanda de productos lácteos se analizan seis formas funcionales alternativas.
EJEMPLO 2.9 Cantidad de café vendido en función de su precio. Modelo doblemente logarítmico (Continuación del ejemplo 2.7)
Como una alternativa al modelo lineal se ha estimado el modelo doblemente logarítmico:
ln( coffqty^ ^ ) - 5.132ln( coffpric ) R^2 0.90 n
Interpretación del coeficiente ˆ 2 : si el precio del café aumenta en un 1%, la cantidad vendida de
café se reducirá en un 5,13%. En este caso, ˆ 2 es el estimador de la elasticidad de la demanda/precio.
EJEMPLO 2.10 Explicando el valor de mercado de los bancos españoles. M odelo doblemente logarítmico (Continuación del ejemplo 2.8)
Utilizando datos del ejemplo 2.8, se ha estimado el siguiente modelo doblemente logarítmico:
ln(^ marktval ) 0.6756 +0.938ln( bookval ) R^2 =0.928^ n = Interpretación del coeficiente ˆ 2 : si el valor contable de un banco se incrementa en 1%, el valor
de mercado de ese banco se incrementará en un 0.938%. En este caso ˆ 2 es el estimador de la elasticidad del valor de mercado/valor contable.
En el cuadro 2.5 se muestra, para el modelo ajustado, la interpretación de los cuatro modelos estudiados. Si hubiéramos considerando el modelo poblacional en lugar del muestral, la interpretación de 2 es la misma pero teniendo en cuenta que u debería ser igual a 0.
C UADRO 2.5. Interpretación de ˆ 2 en los diferentes modelos. Modelo Si x aumenta en (^) se incrementará enentonces^ y lineal 1 unidad ˆ 2 unidades lineal logarítmico 1% ( ˆ 2 /100)unidades logarítmico lineal 1 unidad (100 ˆ 2 )% doblemente logarítmico 1%^2 ˆ %
Vamos ahora a estudiar las propiedades estadísticas de los estimadores de MCO , 1
2
conjunto de supuestos estadísticos. Específicamente, al conjunto de supuestos que vamos a formular se les denomina supuestos del modelo lineal cásico ( MLC ). Es de resaltar que los supuestos del MLC son sencillos, y que los estimadores MCO tienen, bajo estos supuestos, muy buenas propiedades.
2.5.1 Supuestos estadísticos del MLC en regresión lineal simple
a) Supuesto sobre la forma funcional
1) La relación entre el regresando, regresor y perturbación aleatoria es lineal en los parámetros:
El regresando y los regresores pueden ser cualquier función de la variable endógena y de las variables explicativas, respectivamente, a condición de que entre los regresores y el regresando exista una relación lineal. Es decir, el modelo es lineal en los parámetros. La aditividad de la perturbación garantiza la relación lineal con el resto de los elementos.
b) Supuestos sobre el regresor x
2) Los valores que toma x son fijos en repetidas muestras : De acuerdo con este supuesto, cada observación del regresor toma el mismo valor para diferentes muestras del regresando. Este es un supuesto fuerte en el caso de las ciencias sociales, donde, en general, no es posible la experimentación. Los datos se obtienen mediante observación, no mediante experimentación. Es importante destacar que los resultados obtenidos basados en este supuesto permanecen virtualmente idénticos a los que se obtienen cuando asumimos que los regresores son estocásticos, siempre, que postulemos el supuesto adicional de independencia entre los regresores y la perturbación aleatoria. Este supuesto alternativo se puede formular así:
2*) El regresor x se distribuye de forma independiente de la perturbación aleatoria. En cualquier caso, a lo largo de este capítulo y los siguientes vamos a adoptar el supuesto 2.
3 ) El regresor x no contiene errores de medición Se trata de un supuesto que a menudo no se cumple en la práctica, ya que los instrumentos de medición no son siempre fiables en la economía. Pensemos, por ejemplo, en la multitud de errores que se pueden cometer en la recopilación de información cuando se realizan encuestas a las familias.
4) La varianza muestral de x es distinta de 0 y tiene un límite finito cuando n tiende a infinito
Por lo tanto, este supuesto implica que
2 (^2 1 )
n i X i
x x S n
c) Supuesto sobre los parámetros
Si no se adopta este supuesto, el modelo de regresión sería muy difícil de aplicar. En cualquier caso, puede ser aceptable postular que los parámetros del modelo son estables en el tiempo (si no es un período muy largo) o en el espacio (si es relativamente limitado).