Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


econometria ade complutense, Apuntes de Introducción a la Econometría

.......................................................................................

Tipo: Apuntes

2022/2023

Subido el 29/04/2023

alis-asasasas
alis-asasasas 🇪🇸

5 documentos

1 / 56

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema 4. Cuestiones importantes
en el MLG
Econometría
Universidad Complutense de Madrid
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38

Vista previa parcial del texto

¡Descarga econometria ade complutense y más Apuntes en PDF de Introducción a la Econometría solo en Docsity!

Tema 4. Cuestiones importantes

en el MLG

Econometría

Universidad Complutense de Madrid

¿Qué aprenderá en este tema?

4.1 Colinealidad

4.2 Variables ficticias

4.3 Introducción de términos polinómicos en el modelo.

Contraste RESET.

Colinealidad

  • La multicolinealidad surge cuando las variables

explicativas de un modelo econométrico están

relacionadas linealmente entre sí. Este es un problema

complejo, porque en cualquier regresión las variables

explicativas van a presentar algún grado de correlación.

  • Por ello, debemos distinguir entre:

multicolinealidad exacta (perfecta), y

multicolinealidad de grado (aproximada)

  • Matemáticamente, existe multicolinealidad cuando

tenemos problemas a la hora de invertir la matriz (X

T

X)

Si existe multicolinealidad exacta

Si existe multicolinealidad de grado

  • Si es exacta, se incumple uno de los supuestos de

partida del MLG:

H5. Independencia lineal entre las variables

explicativas

Colinealidad

0

T

X X 

0

T

X X 

  • En este caso, Rango (X) = Rango (X

T X) < k+1, el determinante

de (X

T X) es igual a cero y no se puede invertir la matriz (X

T X)

  • El sistema de ecuaciones normales tiene infinitas soluciones y

la matriz de varianzas y covarianzas del estimador MCO no

está definida.

  • Situaciones más habituales en las que habría relaciones

lineales exactas:

  • Metemos en el modelo la misma variable en distintas unidades
  • Metemos en el modelo todas las categorías de una variable ficticia
  • Metemos en el modelo una variable que no varía (constante)
  • Fácil de detectar: no es posible estimar por MCO
  • El software nos avisa de que no se puede estimar
  • Fácil de resolver: eliminando algún regresor colineal con otro(s)

Colinealidad exacta

  • La multicolinealidad de grado (aproximada): ocurre cuando

una variable explicativa es aproximadamente igual a una

combinación lineal de las restantes. Es decir, hay variables

explicativas altamente correlacionadas.

  • En este caso, Rango (X) = Rango (X

T X) = k+1, el determinante

de (X

T X) es distinto de cero pero muy pequeño y se puede invertir

la matriz (X

T X). El sistema de ecuaciones normales tiene una

única solución

-La solución del sistema de ecuaciones normales es poco precisa.

  • No es fácil de detectar ni de solucionar. Una pista para detectar

este tipo de multicolinealidad es reconocer una serie de efectos

perniciosos que presenta sobre los resultados de la estimación

MCO.

Colinealidad de grado

Ejemplo: (^) t 1 2 t 2 3 t 3 t con y     x   x   t t t

x   x   2 3

8

• R

2

j

= R

2 de la regresión de x j

sobre las demás x (incluyendo un

término constante).

  • Componentes de la varianza:
    • Varianza del error (σ

2 ): Cuanto mayor sea la variación en

los no observables que afectan a y, menos preciso será

  • Variación muestral total en x j

: cuanto más dispersas estén

las x j

mayor precisión en la estimación de β j

. Y aumenta al

aumentar la muestra!

  • Relaciones lineales entre las variables independientes
(R

2

j

): Proporción de la varianza de x j

explicada por el resto

de variables independientes

 Cuanto mayor sea, menos precisa será la estimación de β j

10

Efectos de la colinealidad de grado

Más varianza del estimador

quiere decir menor precisión

2

2 2

1

var( )

j (^) n

j j j

i

x x R

(2) Los estadísticos t de significación individual

estarán sesgados a la baja. Esto hará que

tendamos a NO RECHAZAR la H 0

: β j

= 0 más

frecuentemente.

(3) El contraste de significación global de las

pendientes del modelo no se verá afectado.

La bondad del ajuste seguirá siendo parecida

ante la presencia de variables explicativas

superfluas.

ˆ

ˆ varˆ

j

j

t

( 1 ) 1

2

2

  

R n k

R k

F

Efectos de la colinealidad de grado

De hecho, un síntoma claro de multicolinealidad de grado es

que los parámetros NO sean INDIVIDUALMENTE significativos,

pero SÍ lo sean de manera CONJUNTA. Esto es una contradicción

estadística, salvo que exista un problema en los datos.

  • Los efectos de la multicolinealidad de grado serán parecidos

a los de disponer de una muestra pequeña

(micronumerosidad) o de una variable independiente que

varíe poco por sí misma (aún sin estar relacionada

linealmente con otras).

  • El problema de la menor precisión de los estimadores (por

multicolinealidad, muestra pequeña o escasa variabilidad de

las variables independientes):

  • Se debe a que no disponemos de suficiente información

(nuestra muestra no es lo bastante “rica”) para estimar

adecuadamente todos los parámetros.

  • Que dos variables estén muy relacionadas linealmente NO

afecta a la precisión de la estimación del efecto de una

tercera variable

Efectos de la colinealidad de grado

(a) Métodos basados en la correlación entre variables explicativas

(a.1) Calcular la correlación lineal simple existente entre pares

de variables explicativas. Si hacemos esto para los k

regresores del modelo, obtenemos una matriz R con la

forma:

  • Si las correlaciones entre pares de variables explicativas son

elevadas (cercanas a uno en valor absoluto)  síntoma de

multicolinealidad. Sin embargo, estas correlaciones no captan

dependencias lineales más complejas entre las variables

explicativas.

Detección de la colinealidad

12 1

21 2

1 2

.. 1. . 1

k

k

k k

r r

r r

R

r r

 

 

  

 

 

 

(b) Métodos basados en medir el tamaño de la matriz (X

T X)

  • Se podría calcular el valor numérico del determinante de
X

T X. El problema es que este determinante depende de

las unidades de medida de las variables explicativas.

  • Se podría usar la propiedad de que el determinante de

una matriz simétrica es igual al producto de sus

autovalores. Es decir,. Si alguno de

estos autovalores es cercano a cero, el determinante

también lo será. El problema es que los autovalores de

una matriz también dependen de las unidades de medida

de las variables explicativas.

Detección de la colinealidad

1 2

...

T

k

X X      

(b) Métodos basados en medir el tamaño de la matriz (X

T X)

  • Para eliminar el problema de las unidades de medida, se

suele medir el tamaño relativo de los autovalores. En

concreto, se calcula el “número de condición” de la matriz

(X

T X) como la raíz cuadrada del cociente entre el mayor y

el menor autovalor

  • Mayor número de condición implica mayor colinealidad
  • Valores por encima de 20 ó 25 sugieren la presencia de

alta colinealidad

Detección de la colinealidad

max

min

N º de condición

Descripción de los datos: 88 viviendas

  • precio de la casa (price, en miles de dls)
  • valor de tasación (assess, en miles de dls)
  • nº de habitaciones (bdrms)
  • tamaño de la parcela (lotsize, en pies cuadrados)
  • tamaño de la casa (sqrft, en pies cuadrados)
  • estilo de la casa (colonial)

Estimamos el precio de la casa en función de todos los

posibles determinantes

Ejemplo: dataset hprice1.gdt (Wooldridge)

Modelo 1: MCO, usando las observaciones 1-

Variable dependiente: price

Coeficiente Desv. Típica Estadístico t Valor p

const -40.4477 21.5942 -1.8731 0.06462 *

assess 0.904078 0.104268 8.6707 <0.00001 ***

bdrms 9.63026 6.91629 1.3924 0.

lotsize 0.000599268 0.000497077 1.2056 0.

sqrft 0.00107136 0.0171966 0.0623 0.

colonial 9.54757 10.6473 0.8967 0.

Media de la vble. dep. 293.5460 D.T. de la vble. dep. 102.

Suma de cuad. residuos 155242.4 D.T. de la regresión 43.

R-cuadrado 0.830864 R-cuadrado corregido 0.

F(5, 82) 80.56328 Valor p (de F) 3.59e-

Log-verosimilitud - 453.7845 Criterio de Akaike 919.

Criterio de Schwarz 934.4330 Crit. de Hannan-Quinn 925.

 ¿Quiere eso decir que el número de habitaciones, el tamaño de la casa,

el de la parcela o el estilo no afectan al precio?

 Puede ser que la información contenida en estas variables esté recogida,

total o parcialmente, en el valor de tasación

Ejemplo: dataset hprice1.gdt (Wooldridge)