Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Análisis Estadístico de Regresión Lineal: Modelo, Estimación y Pruebas, Apuntes de Matemáticas

Documento que presenta el análisis estadístico de un modelo de regresión lineal, incluye el proceso de estimación de parámetros, la obtención de la recta de regresión y la prueba de hipótesis lineales utilizando el test general de restricciones lineales (tgrl).

Tipo: Apuntes

2016/2017

Subido el 21/11/2017

acarrillo96
acarrillo96 🇪🇸

3.5

(4)

13 documentos

1 / 33

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
LICENCIATURA DE CIENCIAS ACTUARIALES Y FINANCIERAS
ECONOMETRÍA ACTUARIAL
CURSO 2013-2014
TEMA 2:
MODELO DE REGRESIÓN LINEAL GENERAL
Francisco Trujillo Aranda
Catedrático de Economía Aplicada (Econometría)
Departamento de Estadística y Econometría (68)
Facultad de Ciencias Económicas y Empresariales
Universidad de Málaga
Octubre de 2013
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21

Vista previa parcial del texto

¡Descarga Análisis Estadístico de Regresión Lineal: Modelo, Estimación y Pruebas y más Apuntes en PDF de Matemáticas solo en Docsity!

LICENCIATURA DE CIENCIAS ACTUARIALES Y FINANCIERAS

ECONOMETRÍA ACTUARIAL CURSO 2013-

TEMA 2: MODELO DE REGRESIÓN LINEAL GENERAL

Francisco Trujillo Aranda

Catedrático de Economía Aplicada (Econometría)

Departamento de Estadística y Econometría (68)

Facultad de Ciencias Económicas y Empresariales

Universidad de Málaga

Octubre de 2013

2.1.- Introducción

El modelo de Regresión Lineal Simple se establece entre dos variables, Y y X , que se consideran respectivamente como dependiente (endógena) e independiente (exógena). De manera que: i.- Se sabe, porque así lo indica la Teoría Económica, que las variaciones de Y vienen provocadas por las de X. ii.- Se supone que la relación entre ambas variables es lineal y que no hay otras variables explicativas relevantes. iii.- Se dispone de un conjunto de n observaciones muestrales, extraídas mediante muestreo aleatorio simple, de ambas variables.

Supóngase que la relación entre las variables en la población viene dada por la relación (modelo) lineal simple:

yi = α + β xi + ui ; i = 1, 2, ....., N. [1]

Donde:

  • El subíndice i denota al elemento i -ésimo de la población, de tamaño N , de las variables Y y X.
  • ui denota el término de perturbación aleatoria , esto es, un conjunto de variables

aleatorias (v.a.) inobservables que se suponen distribuidas N IID(0, σ^2 u ).

  • Los parámetros poblacionales del modelo son α , β y σ^2 u.

El modelo así considerado se denomina recta de regresión poblacional.

Si la relación poblacional propuesta es cierta, también deberá mantenerse en una muestra aleatoria simple de n observaciones de cada variable, permitiendo escribir

yi = α + β xi + ui ; i = 1, 2, ....., n. [1 bis]

Donde el subíndice i denota ahora la observación i -ésima de la muestra y ui (término de perturbación aleatoria) el conjunto de n v.a. inobservables que corresponden a los elementos de la población incluidos en la muestra (véanse los gráficos 1 y 1B).

El objetivo es estimar de manera precisa y eficiente los parámetros poblacionales

desconocidos ( α , β y σ^2 u ) con la información contenida en la muestra de las variables X e

Y , haciendo uso de los supuestos realizados sobre la distribución de las perturbaciones.

REPRESENTACIÓN GRÁFICA DE LAS NUBES DE PUNTOS Y DE LAS

RECTAS DE REGRESIÓN POBLACIONAL Y MUESTRAL

Gráfico 2A Gráfico 2B

Nótese que:

  • La recta de regresión poblacional no coincide con la muestral, que ha sido estimada con las 1000 observaciones de la muestra. En la regresión poblacional los parámetros

(poblacionales) son α = 1,65 y β = 0,84, mientras que en la regresión muestral las

estimaciones han sido α ˆ^ = 2 , 02 y β ˆ = 0 , 81.

  • Si se eligiese otra muestra de 1000 observaciones se obtendrían otras estimaciones de

los parámetros poblacionales. Esto es, los estimadores α ˆ^ y β ˆ^ son variables aleatorias

en el muestreo, tienen su propia distribución de probabilidad y sus momentos. Suponiendo que x es no estocástica (fija en el muestreo) la distribución de probabilidad de los estimadores dependerá de cuál sea la de la perturbación.

  • Las perturbaciones, ui , son v.a. inobservables en la muestra (realizaciones de su

proceso generador en la población), mientras que los errores, ei , son observables, pues son la diferencia entre yi e y ˆ^ i (valor ajustado con la regresión muestral).

  • En la realidad no se dispone de los datos de la población, por tanto no se conoce el valor de los parámetros poblacionales, sólo el de las estimaciones muestrales.

4

6

8

10

12

14

16

5 6 7 8 9 10 11 12 13 14 X

Y

POBLACIÓN (N=10000): Y = 1,65 + 0,84 X + u

4

6

8

10

12

14

16

5 6 7 8 9 10 11 12 13 14 x

y

MUESTRA (n=1000): y = 2,02 + 0,81 x + e

2.2.- Hipótesis del Modelo de Regresión Lineal general

El modelo de regresión lineal simple es demasiado sencillo para representar

adecuadamente las relaciones entre la mayoría de las variables económicas, por tanto se ha

generalizado al considerar que existen k variables explicativas (exógenas) potencialmente

relevantes, dando lugar al Modelo de Regresión Lineal General :

yi = β 1 + β 2 x 2 i + β 3 x 3 i + ....+ β k xki + ui ; i = 1, 2, ....., n. [3]

Escribiendo el modelo para las n observaciones disponibles de las k variables

exógenas se tendrá un sistema de n ecuaciones, en las que los parámetros son

desconocidos, ese sistema se puede escribir matricialmente definiendo las siguientes

matrices y vectores:

( 1)^ (^ )^ ( 1) ( 1)

y X u

k

nx nxk^ kx nx

n n kn k n

y x x β u

y x x β u

=^  ^ = ^ = ^ = 

L

M M M L M M M

L

ββββ , [4]

de manera que el modelo se escribe matricialmente como

y = X ββββ + u ; [5]

Para que este modelo se pueda estimar convenientemente y los estimadores tengan las mejores propiedades se formulan una serie de Hipótesis :

1.- u ∼ N IID( 0 , σ^2 u I ). ⇒ cuatro hipótesis:

1.1.- Perturbaciones de media nula: E ( ui ) = 0; ∀ i ,

1.2.- Perturbaciones no Autocorrelacionadas: E ( ui·uj ) = 0; ∀ i ≠ j ,

1.3.- Perturbaciones Homoscedásticas: V ( ui ) = E ( u^2 i ) = σ^2 u ; ∀ i.

Las hipótesis 1.1 a 1.3 implican que la matriz de varianzas y covarianzas de u tiene la forma





 = ⋅ = ⋅ 0 0 1

0 1 0

1 0 0 ( ')^22 L

M M M M

L

L E uu σ u In σ u [6]

1.4.- Las perturbaciones tienen una Distribución Normal

2.- Las variables explicativas son exógenas : independientes de las perturbaciones.

Ello implica que, si las x son estocásticas, se debe verificar que:

E ( ui·xji ) = E ( ui )· E ( xji ) = 0; ∀ i,j ⇒ Cov ( ui·xji ) = 0,

matricialmente E ( X'u ) = E ( X' ) E ( u ) = 0.

Alternativamente, si se supone que las x no son estocásticas, sino fijas en el

muestreo, la única fuente de variación en el muestreo son las perturbaciones, lo que

implica la variación muestral de la y. En esas condiciones es fácil demostrar que:

Cov ( uixji ) = E ( ui· ( xji- (^) x (^) j ) = E ( ui xji ) - E(ui· (^) x (^) j ) = xji·E ( ui· ) - (^) x (^) j·E(ui ) = 0,

matricialmente E ( X'u ) = X' E ( u ) = 0.

La hipótesis de que las x no son estocásticas, sino fijas en el muestreo, es poco realista, sólo se justificaría si realmente el investigador controlase los valores de las x en el muestreo, o si sólo se está interesado en los resultados condicionados a unos valores muestrales determinados de las x. Desde un punto de vista pedagógico sí resulta conveniente y por eso la admitiremos inicialmente. Más adelante se tratará el caso de los regresores estocásticos y la incidencia que ello tiene sobre las propiedades de los estimadores.

Si las x son estocásticas e independientes de la perturbación, E ( X'u )= E ( X' ) E ( u )= 0 , se tiene que:

E ( y ) = E ( X ββββ) + E ( u ) = E ( X ββ ββ) = E ( X ) ββββ,

la esperanza de y depende de los valores esperados de las exógenas ( X ). Esto es, la esperanza condicional de yi será:

E ( yi / x 2 i , x 3 i ,..., xki ) = β 1 + β 2 x 2 i + β 3 x 3 i + ....+ β kxki.

La varianza de y también dependerá de los valores esperados de las exógenas ( X ) y

de la varianza de la perturbación

E ( yy' ) = E [( X ββ ββ + u - E ( X ) ββββ) ( X ββββ + u - E ( X ) ββββ)']

= E [( X ββ ββ + u - E ( X ) ββββ) (ββ ββ 'X' + u' - ββ ββ ' E ( X' ))]

= E ( X βββ βββββ 'X' ) - E ( X ) ββββββββ ' E ( X' ) + σ^2 u I.

La distribución de y depende de la distribución de las exógenas y de la perturbación. Si las x no son estocásticas, sino fijas en el muestreo, E ( X'u ) = X' E ( u ) = 0 ,

E ( y ) = E ( X ββββ) + E ( u ) = X ββ ββ,

con lo que la esperanza de yi es incondicional dados los valores "fijos" de las exógenas

E ( yi ) = β 1 + β 2 x 2 i + β 3 x 3 i + ....+ β kxki ,

y la línea de regresión se interpreta como la "línea media o promedio". En este caso la varianza de y sólo depende de la varianza de la perturbación

E ( yy' ) = E [( X ββββ + u - X ββββ) ( X ββ ββ + u - X ββ ββ)']

= E ( uu ') = σ^2 u I.

La distribución de y sólo depende de la distribución de la perturbación.

3.- No existe Multicolinealidad Perfecta : ρ( X ) = k.

La matriz de las exógenas, X , es de rango completo, ello garantiza que no existe ninguna combinación lineal perfecta entre las columnas de dicha matriz. Si existiese dicha combinación al menos una de las exógenas se podría expresar exactamente como una combinación lineal de las demás, con lo que la especificación sería redundante, y se verificaría que

ρ( X'X ) < k ⇒ | X'X | = 0 (matriz singular) imposibilidad de aplicar MCO.

La multicolinealidad perfecta es una situación extrema que no se produce en la práctica, salvo error al definir las exógenas. Sin embargo, un cierto grado de multicolinealidad (relación lineal) entre las exógenas es muy común. Dependiendo de si la relación lineal entre las exógenas es más o menos estrecha, los efectos sobre las estimaciones serán más o menos perjudiciales. La cuestión no es si existe multicolinealidad, o no, sino su grado. Esta cuestión se tratará en un tema posterior. La situación extrema opuesta a la multicolinealidad perfecta sería la de ortogonalidad entre los regresores (exógenas). En este caso no existiría ninguna relación lineal entre los regresores (covarianzas nulas). Esta situación tampoco se produce e la práctica operando con datos económicos.

∑^ =

n i i

e 1

(^2) e'e = ( y - X ββ ββˆ )'( y - X ββ ββˆ )

= y'y - y'X ββββˆ - (^) ββ ββˆ ' X'y + ββββˆ ' X'X ββββˆ = y'y - 2 ββββˆ ' X'y + ββ ββˆ ' X'X ββββˆ. [9]

Minimizando la suma de errores al cuadrado

(^1) β ˆ e' β ˆ^ e 2 X'y 2 X'X β ˆ

2 ∂ =∂∂ =^ +

∂∑

n i i

e = 0, [10]

ˆ 1 ˆ^2 (^ )

2 2 ∂ ββ' = X'^ X

∂ (^) ∑

n i i

e

. [11]

Si ( X'X ) es definida positiva, lo que se demuestra fácilmente si ρ( X ) = k, la solución

obtenida para los estimadores implica un mínimo de la suma de los errores al cuadrado. De

la primera igualdad se obtiene,

X' Xβ ˆ^ = X' y , [12]

que constituye el Sistema de Ecuaciones Normales. Despejando se obtiene la expresión del vector ( k x1) de Estimadores Mínimo Cuadráticos Ordinarios (MCO),

ββββˆ^ =( X ' X ) −^1 X ' y. [13]

Operando con el sistema de ecuaciones normales [12] y sustituyendo y por su

expresión en [7] resulta

X' Xβ ˆ^ = X' ( ˆ+ e ) X' Xβ ˆ^ = X'Xβ ˆ+ X' eX' e = 0.

Nótese que:

=

=

=

1

1 2

1

M^ M

ki

n i i

i

n i i

n i i

e x

ex

e

X' e , [14]

por tanto, al aplicar MCO se garantiza que la suma de los errores es nula, así como que los errores y cada una de las regresores (exógenas) no están relacionados, de manera que no existe correlación muestral entre errores y regresores. La media nula de los errores implica que el plano de regresión pasa por el centro de gravedad de la nube de puntos k - dimensional.

2.4.- Propiedades de los estimadores por Mínimos Cuadrados

Ordinarios

Si las hipótesis antes expuestas se verifican, los estimadores MCO son lineales, insesgados y óptimos ( ELIO ). Linealidad:

ββββˆ^ =( X ' X ) −^1 X ' y

= ( X' X ) −^1 X' ( + u ) = ( X' X ) −^1^^ X'Xβ + ( X'X ) −^1 X'u = β + ( X'X ) −^1 X'u [15]

Queda demostrado que los estimadores son una combinación lineal de las perturbaciones,

u. Supuesto que las X no son estocásticas, toda la variabilidad muestral de los ββββˆ proviene

de las perturbaciones. Por tanto, los ββββˆ también se distribuyen Normalmente.

Insesgadez : E ( βˆ^ ) = E( β + ( X'X ) −^1 X'u ) = β + ( X'X ) −^1 X' E( u ) = β [16]

Queda demostrado que, suponiendo que se cumplen las hipótesis 1.1 y 2, los ββ ββˆ son

estimadores insesgados. Óptimos: La matriz de varianzas y covarianzas de los estimadores MCO es: V( βˆ^ ) = E[( βˆE( βˆ ))( βˆE( βˆ )) ' ] V( βˆ^ ) = E[( X'X ) −^1 X'uu'X ( X'X ) −^1 ] = ( X' X ) −^1^^ X' E( uu' ) X ( X'X ) −^1

Teniendo en cuenta [21], se deduce que el estimador insesgado de la varianza de las

perturbaciones , σ u^2 , es la varianza residual corregida, S e^2 , definida como:

n k n k

e S

n

e i i

2 ∑ = 1 2 e'e

. [22]

2.5.- Estimadores Máximoverosimiles

En general, si z es un vector ( n x1) de v.a., tal que z ∼ N (μμ μμ, ΣΣΣΣ z ), dondeΣΣ ΣΣ z denota la

matriz de varianzas y covarianzas^2 , su función de densidad conjunta será Normal Multivariante, con la siguiente expresión:



f ( ) = exp ^ − ()z^ () n (^) z · z μ'Σ z μ · Σ

z (^) 2 12 21 1 2

[23]

En el caso del modelo de regresión lineal general, y = X ββββ + u , hemos supuesto X no

estocástica y que

u ∼ N IID( 0 , σ^2 u I ) ⇒ p ( y ) = p ( u ) ∂∂ yu^ = p ( u ),

esto es^3 , la variable endógena también se distribuye normalmente

E ( y ) = X ββββ;

V ( y ) = E [( y - X ββ ββ)( y - X ββ ββ) ’ ] = E ( uu’ ) = σ^2 u I ,

y ∼ N ( X ββββ, σ^2 u I ). [24]

Luego, ΣΣΣΣ y = σ^2 u I ⇒ | ΣΣΣΣ y | = ( σ^ u^2 ) n , Σ^1 12 I

y σ u

− (^) = , por tanto la función de densidad

conjunta de las yi , condicionada a los valores de las exógenas y a los parámetros poblacionales tendrá la expresión:

(^2) ΣΣ ΣΣ z será definida positiva si es de rango n , esto es, si no existe ninguna combinación lineal entre las zi variables que integran el vector z. (^3) ∂∂ yu (^) denota el jacobiano de la transformación: matriz de derivadas parciales de las ui respecto a las yi. Bajo

el supuesto de que las ui no están autocorrelacionadas, coincide con la matriz identidad.

f( / ) = (^) ( ) exp ^ − ()() u (^) n u n u

y X,β, σ^22 π 21 σ 2 2 · 2 σ^12 y Xβ' y Xβ

Si consideramos dados (conocidos) los valores de las variables, endógena y exógenas, y desconocidos los parámetros poblacionales se podrá escribir:

L = f( / ) = ( ) exp ^ − ()() u (^) n u n u

β , σ 2 y,X 2 π 21 σ 2 2 · 2 σ^12 y Xβ' y Xβ , [25]

que se denomina Función de Verosimilitud. En esta función los parámetros poblacionales están condicionados a los valores muestrales observados de la variable endógena y de las exógenas. La estimación máximoverosimil se basa en asignar a los parámetros poblacionales aquellos valores que maximizan la probabilidad de los datos muestrales, esto es, las estimaciones máximoverosimiles son aquellas que maximizan [25] dados los valores observados de las variables.

Tomando ln en [25] y denotando como β^ ~^ y σ ~ u^^2 a los Estimadores

Máximoverosimiles (EMV) tendremos:

lnL nln( ) nln( ) ( )( ) u (^) u

= − 2 2 π − 2 σ ~^^2 − 2 σ^12 y − Xβ^ ~' y − Xβ^ ~. [26]

Para obtener la expresión de los β^ ~^ hay que derivar en [26] respecto a β^ ~^ , igualar a cero y

despejar. Nótese que en ese proceso σ ~ u^^2 actúa como una constante, por lo que la derivada

sólo opera sobre la “suma de cuadrados” dada por ( y^ ~ ) ' ( y^ ~ ) y que dicha

expresión es formalmente idéntica a la que se minimiza en [9] al obtener los estimadores MCO^4. Por tanto, la expresión final de los EMV coincide con la de los MCO:

β^ ~^ = ( X'X ) −^1 X'y = βˆ. [27]

En resumen, bajo los supuestos habituales y la distribución Normal de las perturbaciones, los estimadores máximoverosimiles coinciden con los estimadores MCO y, por tanto, éstos tienen las propiedades asintóticas de los EMV: Consistencia asintótica, Eficiencia asintótica y Distribución Asintótica Normal.

(^4) También en este caso se puede demostrar que se cumplen las condiciones de segundo orden de la maximización.

ββ ββ^ ˆ ∼ N ( ββββ, σ^2 u ( X’X )-1), [32]

y se puede demostrar que e’e y ββββˆ son independientes. De todo ello resulta que, para

cualquiera de los estimadores β ˆ^ i , ( i = 1, 2,…, k ), se verifica que

u ii

i i

σ a

β ˆ^ −β ∼ N (0, 1), [33]

denotando aii el elemento i -ésimo de la matriz ( X’X )-1. El problema es que σ u es

desconocida y si se sustituye por su estimador, S (^) e , el cociente [33] deja de distribuirse

como una Normal tipificada, con lo que deja de tener utilidad. Sin embargo, es sabido que

el cociente entre una v.a. N (0, 1) y la raíz cuadrada de otra v.a. χ r^2 , corregida de la pérdida

de grados de libertad, e independiente de la primera, se distribuye siguiendo una distribución t-Student con r grados de libertad. En este caso, [33] define una v.a. N (0, 1) y [31] define una v.a. χ (^) n^2 − k , independientes entre sí. Por tanto:

u ii

i i t σ a

  • = βˆ^ −β : e ii

i u^2

e (n k) S^ a

(n k)S β β

=^ −

− 2 ˆtn-k. [34]

El error estándar de β ˆ i^ , denotado S β ˆ i , se estima como

S β ˆ i = S (^) e aii ,

de manera que [34] permite el contraste de hipótesis sobre cualquier coeficiente β i y

construir intervalos de confianza para el mismo.

Si se quiere contrastar la hipótesis H 0 : (^) β (^) i = β i __* H 1 : β i ≠ β i __*

donde β i __* denota cualquier valor admisible para el parámetro, basta calcular [34] con el

valor estimado del parámetro, el valor establecido en la hipótesis nula y el error estándar estimado. Si t* , valor obtenido del estadístico en [34], está incluido en la región crítica

bilateral de tamaño ε correspondiente a una distribución t-Student con n-k grados de

libertad, se rechaza la H 0 , en caso contrario se acepta (no se rechaza). Si la H 1 fuese unilateral, por ejemplo

H 0 : (^) β (^) i = β i * H 1 : β (^) i > β i *

se operaría igual, pero toda la región crítica se concentraría en la cola derecha de la distribución t-Student con n-k grados de libertad.

Una hipótesis que se contrasta siempre es la de “no significatividad del parámetro”, esto es, en la H 0 se postula que el parámetro no es significativamente distinto de cero

H 0 : β i =^0

H 1 : β i ≠ 0

En este caso el estadístico del contraste se reduce a

S a^ S i t i e ii

i β

ˆ

__* = =. [34bis]

Si no se rechaza H 0 implica que la variable exógena Xi no es relevante en el modelo y se puede eliminar del mismo supuesto que no hay problemas que invaliden el contraste.

La distribución tn-k del estadístico muestral, véase [34], también permite construir

intervalos de confianza al (1- ε) por ciento para cualquier β i , ( i = 1, 2, ....., k ), en la forma:

( β ˆ^ i ± tε 2 Se aii ). [35]

En [35] t ε 2 denota el valor de una tn-k que define una región crítica de tamaño ε / 2 en cada

cola de la distribución. En el caso de los intervalos de confianza se trata de una probabilidad "fiduciaria" o derivada, esto es, si pudiésemos construir L intervalos de

confianza para β i , a partir de L muestras de tamaño n , el (1- ε) por ciento de ellos

contendrían el verdadero valor del parámetro poblacional β i. En la práctica sólo se

construye un intervalo, con la única muestra disponible, y se "confía" en que contendrá el

verdadero valor de β i con un grado de confianza del (1- ε) por ciento.

R = [0 1 1 0....0];









=

β k

β

β

β

M

3

2

1 β ; r = [1].

2) H 0 : β 2 = β 4 ⇒ β 2 - β 4 = 0,

R = [0 1 0 -1 0....0];













=

β k

β

β

β

M

3

2

1 β ; r = [0].

3) H 0 : β 2 = β 4 ; β 3 + 2· β 4 + β 5 = 1,

R = 

 

 − 0 0 1 2 1 0

0 1 0 1 0 0 L

L ;













=

β k

β

β

β

M

3

2

1 β ; r = (^)  

 

 1

Si las restricciones son ciertas, no se rechaza la H 0 correspondiente, los estimadores eficientes serían los estimadores mínimocuadraticos con restricciones (MCr), que son aquellos que incorporan (cumplen) las restricciones que se suponen ciertas. En el modelo de regresión lineal general:

y = X ββββ + u , s.a.: R ββββ = r ,

se demuestra que el estimador mínimocuadratico con restricciones , β ˆ *es

βˆ^ __*^ = βˆ +( X'X )−^1 R' [ R ( X'X )−^1 R' ]−^1 ( rRβˆ ). [37]

Alternativamente, se puede estimar por MCO el modelo restringido, aquél en el que se han impuesto las restricciones, y se obtendría el mismo resultado que aplicando MCr. Así, por ejemplo, dado el modelo

yi = β 1 + β 2 x 2 i + β 3 x 3 i + ui ; i = 1, 2, ....., n ,

s.a.: β 2 + β 3 = 1 ⇒ β 3 = 1 - β 2

se puede aplicar el estimador MCr, con el que se verificará que β ˆ^2 * (^)^ + β ˆ 3 * = 1 , o bien estimar

el modelo restringido

yi = β 1 + β 2 x 2 i + (1- β 2 ) x 3 i + ui ⇒

aplicando MCO en el modelo restringido se obtendrían β ˆ 1 *^^ ˆ * 2 y β ˆ^ * 3^ = 1 − β ˆ * 2 , de manera que

se verificaría la restricción.

Dado el modelo de regresión lineal general

y = X ββββ + u ,

¿cómo contrastar las q restricciones establecidas en H 0 : R ββββ = r? Se demuestra que,

suponiendo H 0 cierta, la expresión del Test General de Restricciones Lineales (TGRL) es la siguiente:

n k F q − = − −^ − − e' e/

  • (^ ^ ˆ r )'[ R ( X'X )^1 R ']^1 ( ˆ r ) /Fq,n-k. [38]

Alternativamente, se demuestra también que el estadístico de contraste se puede escribir como:

SCRn k

SCR q n k F q − = −

e'e/

* (^ e'rer e'e)/^ ∆^ ∼ Fq,n-k , [39]

donde:

e'r e r denota la Suma de Cuadrados de Errores del modelo restringido, er = y ˆ*. e' e denota la Suma de Cuadrados de Errores del modelo no restringido, e = y ˆ.

∆∆∆∆ SCR = SCRr - SCR , denota el incremento de la suma de cuadrados de los errores

(residuos) que se produce al estimar por MCr ( SCRr = e'r er ) respecto a la estimación por MCO ( SCR = e' e ). Si las estimaciones por ambos procedimientos

coincidieran ∆∆∆∆ SCR = 0. Si no coinciden ∆∆ ∆∆ SCR > 0, dado que al estimar con

restricciones la suma de cuadrados de los residuos aumenta respecto a la de la estimación no restringida. _F_* denota el valor del estadístico del TGRL.

Si F^ εεεε q,n-k denota el valor que, en una distribución F de Snedecor (Fisher) con q

grados de libertad en el numerador y n-k g. de l. en el denominador, define una región

crítica de tamaño ε en la cola derecha, se tendrá que:

( yi - x 3 i ) = β 1 + β 2 ( x 2 i - x 3 i ) + ui