Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Regresión Lineal con Múltiples Regresores: Sesgo por Variables Omitidas y Causalidad, Apuntes de Econometría

PARTE DEL TEMARIO DE LA ASIGNATURA DE ECONOMETRÍA

Tipo: Apuntes

2020/2021

Subido el 14/02/2021

lucas-costa-dqp
lucas-costa-dqp 🇪🇸

15 documentos

1 / 44

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
SW Ch 5
1/44
Regresión Lineal con Múltiples Regresores
(SW Capítulo 6)
Resumen
1. Sesgo por variables omitidas
2. Causalidad y análisis de regresión
3. Regresión Múltiple y MCO
4. Medidas de ajuste
5. Distribución muestral del estimador MCO
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c

Vista previa parcial del texto

¡Descarga Regresión Lineal con Múltiples Regresores: Sesgo por Variables Omitidas y Causalidad y más Apuntes en PDF de Econometría solo en Docsity!

Regresión Lineal con Múltiples Regresores

(SW Capítulo 6 )

Resumen

  1. Sesgo por variables omitidas
  2. Causalidad y análisis de regresión
  3. Regresión Múltiple y MCO
  4. Medidas de ajuste
  5. Distribución muestral del estimador MCO

Sesgo por Variables Omitidas

(SW Sección 6 .1)

El error u aparece porque hay factores, o variables, que influyen

en Y pero que no están incluidos en la función de regresión.

Siempre hay variables omitidas.

A veces, la omisión de esas variables puede llevar a un sesgo en

el estimador MCO.

Sesgo de variables omitidas, ctn.

En el ejemplo de la calificación del examen (score tests) :

  1. La habilidad en el idioma inglés (si el estudiante es ESL :

tiene Inglés como Segundo Idioma) razonablemente puede

afectar los resultados del examen estandarizado: Z es un

determinante de Y.

  1. Las comunidades de inmigrantes tienden a ser menos ricas,

y tienden a tener colegios con menores presupuestos y STR

más alto: Z está correlada con X.

Por tanto, está sesgado. ¿Cuál es la dirección de este sesgo?

  • ¿Qué es lo que sugiere el sentido común?
  • Si te falla el sentido común, hay una fórmula…

1

b

Sesgo de variables omitidas, ctn.

Una fórmula para el sesgo por variables omitidas: recuerda la

ecuación,

  • b

1

1

2

n

i

i

X

v

n

n

s

n

=

æ ö

ç ÷

è ø

å

donde v

i

= ( X

i

  • X ) u

i

» ( X

i

  • μ

X

) u

i

. Bajo el Supuesto # 1 de

Mínimos Cuadrados, SMCO#1 ,

E [( X

i

  • μ

X

) u

i

] = cov( X

i

, u

i

¿Pero qué pasa si E [( X

i

  • μ

X

) u

i

] = cov( X

i

, u

i

) = s

Xu

1

b

1

2

1

n

i i

i

n

i

i

X X u

X X

=

=

å

å

La formula del sesgo de variables omitidas :

p

® b

1

u

Xu

X

s

r

s

æ ö

ç ÷

è ø

  • Si una variable omitida Z cumple estas dos condiciones:

(1) Es un determinante de Y (está contenido en u ); y

(2) Correlacionada con X ,

entonces r

Xu

¹ 0 y el estimador MCO está sesgado y no es

consistente.

  • Por ejemplo, distritos con pocos estudiantes ESL [ English

Second Language ] (1) son mejores en tests estandarizados y

(2) y tienen clases menores (más presupuesto), por lo que

ignorar el efecto de tener muchos estudiantes ESL resultaría

en sobreestimar el efecto del tamaño de la clase. ¿Realmente

está esto ocurriendo en los datos de CA?

1

b

1

b

  • Distritos con menos estudiantes aprendiendo Inglés (EL, English Learners )

tienen resultados más altos en los tests.

  • Distritos con menor porcentaje de EL ’s ( PctEL ) tienen clases más pequeñas.
  • Entre los distritos con PctEL comparables, el efecto del tamaño de la clase es

pequeño (la divergencia en resultados de los tests, “ test score gap ” = 7.4)

¿Qué queremos estimar exactamente cuando hacemos una

regresión?

Hay (al menos) tres posibles respuestas para esta pregunta:

  1. Queremos estimar la pendiente de una línea a través de un

diagrama de dispersión como un simple resumen de los

datos al que no asociamos ningún significado sustantivo.

Esto puede ser útil algunas veces, pero no es muy

interesante intelectualmente, y no es de lo que va este

curso.

  1. Queremos hacer predicciones sobre el valor de Y para un

individuo que no está en nuestra base de datos, pero para

el que conocemos su valor de X.

Hacer predicciones es una importante tarea para los

economistas, y es posible obtener predicciones

excelentes usando métodos de regresión sin necesidad

de conocer efectos causales. Volveremos más tarde al

problema de predicción durante el curso.

¿Qué es, exactamente, un efecto causal?

  • ¡“Causalidad” es un concepto complejo!
  • En este curso, usamos un enfoque práctico para definir

causalidad:

Un efecto causal se define como el efecto medido en un

experimento controlado aleatorizado ideal.

Experimento Controlado Aleatorizado Ideal

  • Ideal : todos los sujetos siguen el protocolo de tratamiento –

¡todos siguen el tratamiento completo (conformidad

completa), no hay errores de registro, etc.!

  • Aleatorizado : Los sujetos de la población de interés se

asignan aleatoriamente a los grupos de tratamiento o de

control (por lo que no hay factores que lleven a confusión:

factores confusos)

  • Controlado : tener un grupo de control permite medir el

efecto diferencial de tratamiento.

  • Experimento : el tratamiento se asigna como parte del

experimento: los sujetos no tienen elección, por lo que no

hay “causalidad inversa“ en la que los individuos eligen el

tratamiento que piensan les irá mejor.

¿En qué sentido nuestros datos observacionales son

diferentes de esta situación ideal?

  • El tratamiento no se asigna aleatoriamente.
  • Consideremos PctEL – el porcentaje de English Learners – en

el distrito. Posiblemente satisface los dos criterios para el sesgo

de omisión de variables: Z = PctEL es:

(1) un determinante of Y ; y

(2) está correlado con el regresor X.

  • Por tanto, los grupos de “control” y de “tratamiento” son

diferentes en una forma sistemática, y entonces

corr( STR , PctEL ) ¹ 0

  • Aleatorización + grupo de control significa que cualquier

diferencia entre los grupos de control y tratamiento son

aleatorias – no relacionadas sistemáticamente con el

tratamiento.

  • Podemos eliminar la diferencia en PctEL entre los grupos

grandes (control) y pequeños (tratamiento) examinando el

efecto del tamaño de la clase entre los distritos con el mismo

PctEL.

o Si la única diferencia entre los grupos grandes y los

pequeños es en PctEL , entonces estamos de vuelta al

experimento controlado aleatorizado – dentro de cada

grupo PctEL.

o Esta es una forma de “controlar” el efecto de PctEL

cuando se estima el efecto de STR.

El Modelo Poblacional de Regresión Múltiple

(Sección 6. 2 de SW)

Consideremos el caso de dos regresores:

Y

i

= b

0

+ b

1

X

1 i

+ b

2

X

2 i

  • u

i

, , E(u

i

)=0 , i = 1,…, n

  • Y es la variable explicada (denominada tmb dependiente o

regresando ).

• X

1

, X

2

son dos variables explicativas (denominadas tmb

independientes o regresores )

• ( Y

i

, X

1 i

, X

2 i

) denotan la observación i

ésima

de Y , X

1

, y X

2

  • b

0

= término constante poblacional desconocido.

  • b

1

= efecto s/ Y de un cambio en X

1

, manteniendo X

2

constante

  • b

2

= efecto s/ Y de un cambio en X

2

, manteniendo X

1

constante

  • u

i

= error de regresión (factores omitidos) con media 0.

Interpretación de los coeficientes en regresión múltiple

Y

i

= b

0

+ b

1

X

1 i

+ b

2

X

2 i

  • u

i

, E(u

i

)=0 , i = 1,…,n

Para interpretar los coeficientes como la relación causal de las

variables explicativas (las X’s ) sobre la explicada Y es

fundamental suponer que al variar una de las variables,

permaneciendo la otra constante, el término de error no varía.

Pero, no varía ¿en qué sentido?

En media : lo que quiere decir que manteniendo las variables

explicativas constantes, la media de los errores no varía:

%#

%

)#

)

%

)