Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


regresion multiple, Apuntes de Econometría

Asignatura: econometria, Profesor: vicente Rodriguez Sosa, Carrera: Administración y Dirección de Empresas, Universidad: US

Tipo: Apuntes

2013/2014

Subido el 12/12/2014

carcue
carcue 🇪🇸

1 documento

1 / 77

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
MODELO MULTIVARIANTE
Modelo con varias variables explicativas
GRADO EN ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS
ECONOMETRÍA EMPRESARIAL
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27
pf28
pf29
pf2a
pf2b
pf2c
pf2d
pf2e
pf2f
pf30
pf31
pf32
pf33
pf34
pf35
pf36
pf37
pf38
pf39
pf3a
pf3b
pf3c
pf3d
pf3e
pf3f
pf40
pf41
pf42
pf43
pf44
pf45
pf46
pf47
pf48
pf49
pf4a
pf4b
pf4c
pf4d

Vista previa parcial del texto

¡Descarga regresion multiple y más Apuntes en PDF de Econometría solo en Docsity!

MODELO MULTIVARIANTE

Modelo con varias variables explicativas

GRADO EN ADMINISTRACIÓN Y DIRECCIÓN DE EMPRESAS

ECONOMETRÍA EMPRESARIAL

MODELO DE REGRESIÓN LINEAL MULTIVARIANTE

1 1 2 2 3 3

...

i i i i k ki i

Y   X   X   X    X 

Con esta nomenclatura el nº de variables explicativas es k-1.

β 1

se denomina intersección, ordenada en el origen o

constante de regresión.

2

a β k

son los coeficientes parciales de la pendiente,

pendientes de la regresión o coeficientes de regresión

parcial.

Una forma alternativa de expresar esta ecuación es:

en la que X 1i

= 1, para i = 1, 2, …, n.

...

i i i k ki i

Y     X   X    X 

SISTEMA DE N ECUACIONES CON K INCÓGNITAS EN NOTACIÓN

MATRICIAL

1 11 21 31 1 1 1

2 12 22 32 2 2 2

1 2 3

...

...

... ......................... ... ...

...

( 1) ( ) ( 1) ( 1)

k

k

n n n n kn k n

Y X X X X

Y X X X X

Y X X X X

Y X

n n k k n

 

 

 

 

       

       

       

  

       

       

       

  (^)      

 

   

SISTEMA DE ECUACIONES EN NOTACIÓN MATRICIAL

  • (^) Y: vector columna (n x 1) de los valores muestrales

de Y.

X: matriz (n x k) con las n observaciones de las k-

variables explicativas. La primera columna de unos

correspondientes a los valores de la variable

artificial X

1

Β: vector columna (k x 1) de los parámetros

desconocidos o de los coeficientes.

  • (^) ε: vector columna (n x 1) de las n perturbaciones

aleatorias.

  • Obsérvese que el criterio de utilizar X ki

para designar a la i-ésima

observación de la variable X k

supone que los subíndices de la matriz X

están en un orden contrario al habitual (1º subíndice para la fila y 2º

para la columna).

HIPOTESIS SOBRE LAS PERTURBACIONES

2ª) Homocedasticidad: Las distribuciones de las

perturbaciones aleatorias tienen todas la misma

varianza, que denominaremos σ

2

Var [ε

i

] = E [ε

i

2

] = σ

2

para i = 1, 2, …,n.

3ª) Las perturbaciones son independientes entre

sí. Equivale a decir que sus covariancias son nulas.

Para datos transversales se habla de no correlación por

parejas, para datos temporales se denomina supuesto de no

autocorrelación.

siendo i ≠ j para i, j = 1, 2, …, n.

, , 0

i j i j

Cov ^   ^  E ^    

   

MATRIZ DE VARIANCIAS-COVARIANCIAS DE LAS PERTURBACIONES

La consideración conjunta de las hipótesis 2ª y 3ª hace que:

   

2

1 1 2 1 1

2

2 2 1 2 2

1 2

2

1 2

     

     

   

    

n

n

n

n

n n n

E E E

   

   

   

2

2

1 1 2 1

2 2

(^2 1 2 2 )

2

2

1 2

  ^ 

n

n

n n n

E E E
E E E
E E E

2

I

CONSECUENCIAS DE LAS HIPOTESIS SOBRE LAS PERTURBACIONES

Las distribuciones de las Y i

son Normales, igual que en el

caso del modelo de regresión simple, siendo sus medidas:

y sus varianzas:

y dada la independencia de las perturbaciones,

por lo que el vector columna de las Y i

seguirá una distribución

Normal Multivariante cuyo vector de medidas estaría

formado por los valores esperados de las Y i

y su matriz de

variancias y covariancias sería 

2

, , 0

i j i j

Cov Y Y ^ ^  E ^     ij

   

 

1 2 2

....

i i k ki

E Y     X   X

10

   

2

2 2

i i i i

Var Y E Y E Y E  

       

   

HIPÓTESIS SOBRE LAS VARIABLES

5ª) Este supuesto hace referencia al método de extracción de

la muestra. Si las observaciones se extraen mediante muestreo

aleatorio simple de una única y gran población,

(X

i

, Y

i

), para i = 1, 2,…, n, son independientes e

idénticamente distribuidas (i.i.d)

Es decir, las n-tuplas de valores (X

1i

, X

2i

, … , Y

i

), presentan la

misma distribución y se distribuyen además de forma

independiente de una observación a otra, son i.i.d.

Este supuesto es razonable para muchos sistemas de elección

de datos, aunque no todas las técnicas de selección de la

muestra proporcionan observaciones i.i.d. de las variables del

modelo. Así, para un método de selección de la muestra

empleado con frecuencia,

HIPÓTESIS SOBRE LOS PARÁMETROS

7ª) El tamaño de la muestra (n) ha de ser igual o

mayor que el número de coeficientes o

parámetros a estimar (k).

Las hipótesis 6ª y 7ª conjuntamente consideradas

equivalen a decir que la matriz de datos X, de

orden (n x k), ha de tener rango completo por

columnas, es decir, ha de ser de rango k.

Si el rango de dicha matriz fuera menor que k,

conllevaría que el rango de la matriz simétrica (X

´X), de orden (k x k), también sería menor que k,

por lo que al ser una matriz singular no existiría su

inversa (X´X)

que es imprescindible para el

proceso de estimación del modelo.

HIPÓTESIS SOBRE LOS DATOS

8ª) Los datos atípicos elevados son improbables

Es decir, observaciones con valores X

i

o Y

i

, o ambos, muy lejos

del ámbito habitual de los datos, son poco probables.

Esto se expresa matemáticamente suponiendo que los

momentos de cuarto orden de X e Y existen y son finitos. En

otros términos: que X e Y tiene curtosis finita.

4 4

0 [ ] 0 [ ]

i i

E X   yE Y 

Es utilizado para justificar matemáticamente las aproximaciones

para muestras grandes de los estadísticos MCO empleados en

los contrastes. En casos de alta frecuencia de valores atípicos y,

dada la sensibilidad a ellos de los estimadores MCO, se pueden

calcular estimadores de mínima desviación absoluta (MDA), más

eficientes y que proporciona inferencias más fiables. 14

INTERPRETACIÓN DE LOS PARÁMETROS DEL MODELO

  • β

1

: Ordenada en el origen o constante de

regresión. Es el valor medio de Y

i

cuando todas

las variables explicativas son iguales a cero.

  • (^)

2

k

: Pendientes de la regresión o

coeficientes de regresión parcial. Corresponde

al valor de la derivada parcial de E[Y

i

] respecto

a (X

2

…) X

k

. Se interpreta como la variación

promedio del valor medio de la variable

endógena ante variaciones unitarias de (X

2

X

k

, manteniéndose constante el resto de las

variables explicativas.

ESTIMACIÓN DE LOS PARAMETROS DEL MODELO DE REGRESIÓN

Condición minímocuadrática:

 

2

2

1 2 2

ˆ ˆ ˆ

...

i i i k ki

e  Y     X   X sea minima

 

1

2

2 2 2 2

1 2 1 2

... .. ...

..

n n i

n

e

e

e e e e e e e e e

e

 

 

 

        

 

 

 

 

ESTIMACIÓN DE LOS PARAMETROS DEL MODELO DE REGRESIÓN

 

ˆ

2 2 0

ˆ

e e

X Y X X

 

    

ˆ

X Y X X

  

ˆ ˆ ˆ

e e Y Y 2  X YX X

        

ESTIMACIÓN DE LOS PARAMETROS DEL MODELO DE REGRESIÓN

  • (^) Premultiplicando ambos miembros de la igualdad por la

inversa de la matriz X’ X,

     

1 1

ˆ

X X X XX X X Y

 

    

 

IX X X Y

20

 

1

( 1) ( ) ( )

ˆ

k k k k ( 1)

X X X

n

Y

n

  

 

En el modelo en notación matricial, las estimaciones de los

parámetros se obtienen por MCO a partir de los datos.