


















Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Econometría I, Profesor: , Carrera: Economía, Universidad: UniZar
Tipo: Apuntes
Subido el 30/09/2008
3.8
(109)33 documentos
1 / 26
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!



















Licenciatura: ECONOMICAS
Asignatura: ECONOMETRÍA I
TEMA 6
INTRODUCCIÓN A LA TEORÍA ASINTÓTICA
Curso Académico: 2006/
1.- Conceptos previos. Series y sucesiones.
El objetivo fundamental de la Inferencia Estadística es el de obtener conclusiones sobre las características de una población determinada utilizando la información contenida en una muestra representativa. Por población se entiende toda la colección, posiblemente infinita, de elementos de interés en un estudio determinado; mientras que una muestra es una colección finita de estos elementos la cual, para que sea de utilidad, debe ser representativa de la población. Es decir, no debe estar concentrada en un tipo concreto de elementos, sino que las diferentes tipologías de la población deben estar bien reflejadas en la muestra.
Las características de la población, en relación con el atributo que se estudia, se encuentran resumidas en la función de distribución de probabilidad. Conociendo esta última, se conoce toda la población, por lo tanto el objetivo de la Inferencia Estadística es caracterizar la función de distribución asociada a una población determinada. La estrategia habitual para lograr este objetivo consiste en, una vez obtenida una muestra que sea adecuada, proponer de manera tentativa un conjunto de modelos probabilísticos (funciones de distribución) con los que pretendemos aproximarnos a la población de referencia (desconocida). A continuación, se evalúa la capacidad de cada uno de ellos para explicar los datos efectivamente observados y, por último, se selecciona el que mayor capacidad ofrezca en este sentido, que será el que se emplee para estimar o para contrastar hipótesis sobre los parámetros de la función de distribución poblacional.
Cuando se hace referencia a Teoría Asintótica se está ante un problema de Inferencia Estadística habitual, tal como el que se acaba de describir, pero en el que se tiene un volumen de información muestral muy grande, casi de orden infinito. En otros términos, es prácticamente como si se pudiesen observar todos los elementos de la población, aunque se sigue desconociendo la función de distribución asociada y sus características. La estrategia de investigación que se desarrolla es la misma, puesto que los objetivos coinciden, sin embargo existe una diferencia importante en los medios. Cuando se dispone de escasa información muestral, los resultados de la investigación son muy dependientes de las decisiones que se han adoptado a priori (qué tipo de familias de funciones de distribución se investigan, cuál es el rango apropiado de los parámetros del modelo...); esto es, de información teórica.
Este tipo de resultados asintóticos llevan implícito un precio. Estos resultados son válidos en ese contexto y, únicamente en ese, mientras que habitualmente trabajaremos con muestras de tamaño finito (no importa su tamaño, pero nunca serán infinitas observaciones) situación en la cual nos interesará realmente resolver problemas de inferencia estadística. Esto nos llevaría a decir que, aunque estos resultados asintóticos son muy interesantes, carecen de utilidad en el trabajo de investigación aplicado ya que no podemos emplearlos. La afirmación no es totalmente cierta; los resultados asintóticos deben entenderse como un límite hacia el cual se van aproximando los resultados obtenidos en un marco de muestras finitas. Si se va disponiendo de muestras progresivamente mayores en tamaño, la aproximación será cada vez mejor. En los trabajos de aplicación nos conformamos con saber que el resultado asintótico que se utiliza en un contexto de muestras finitas es sólo una aproximación al resultado verdadero; seguramente existirá una discrepancia entre ambos, pero se asume como un coste que se debe pagar por utilizar ese resultado asintótico.
Anteriormente, hemos definido la Teoría Asintótica como el conjunto de técnicas de Inferencia Estadística que tratan con volúmenes crecientes de información muestral, y sus temas fundamentales de trabajo de la Teoría Asintótica pueden agruparse en dos grandes bloques:
a) Obtener estimadores que garanticen un uso óptimo de la información muestral a medida que esta se hace más abundante.
b) Estudiar el comportamiento de determinados estadísticos cuando aumenta indefinidamente el tamaño muestral.
Ambos bloques están relacionados y, a menudo, se superponen. Por ejemplo, una situación relativamente frecuente en el trabajo aplicado se caracteriza por disponer de varios estimadores alternativos para un mismo parámetro, posiblemente con propiedades desconocidas en un marco de muestra finitas (consecuencia de que la función de distribución de probabilidad es compleja o desconocida, etc.). Se trata, por lo tanto, de una situación de incertidumbre que no sabemos resolver. Una posible solución consiste en analizar las propiedades de estos estimadores en un contexto asintótico y seleccionar aquel que mejores propiedades ofrezca.
Un caso como el indicado podría ser el siguiente: en una muestra aleatoria de
pueden proponer distintos estimadores para la esperanza poblacional. El que se utiliza
habitualmente es la media muestral x = ∑ T^ x^ t , pero también se pueden utilizar
versiones corregidas de la misma, como el estimador: ⎥
∑= 2 1
x x x
T t t. Ambos
estimadores son insesgados, sin embargo sus varianzas son distintas:
Var [ x ] = (^) T
diferentes tamaños muestrales y analizar la diferencia entre ellas.
TABLA 1: Comparativa de varianzas. Tamaño muestral Var [ x ] Var [ x ~^ ] Relación Var[ x ~^ ]/Var[ x ] 2 3 4 5 10 100 1000
Como se puede observar, en el último caso con un tamaño muestral de 1000 observaciones, la varianza del estimador x ~^ es superior en un 25000% a la varianza de la media muestral, situación que –salvo cuando T = 2- se reproduce para todo tamaño muestral, aunque con diferentes porcentajes. Observando estos resultados, es evidente por qué el estimador media muestral, x , es tan popular.
Lo que se ha hecho en la Tabla 1 ha sido comparar la evolución de las series Var [ x ]t y Var [ x ~^ ]t y comprobar que Var [ x ]t < Var [ x ~^ ]t ,∀ T>2. Además, si analizamos más detenidamente la evolución de estas series, se comprueba que la varianza de la media muestral tiende a cero conforme incrementa el tamaño muestral (es decir,
En otros términos, existe un tamaño muestral determinado T a partir del cual las discrepancias entre los valores de la serie y el límite son despreciables, es decir:
limt → ∞ at = a
Se debe aclarar que, aunque en estas definiciones se ha utilizado el término ‘ serie real’ , como colección de números reales que tienden a un determinado límite, el dominio de la Teoría Asintótica es el de la inferencia estadística la cual trata con elementos aleatorios. Esto significa que el tipo de series que se analizaran en Teoría Asintótica son de naturaleza aleatoria; por tanto se estudiaran series de variables aleatorias ordenadas de acuerdo a un índice discreto (el tamaño de la muestra) y obtenidas todas ellas a través de una regla común.
En cuanto al uso del concepto de límite en este contexto de series de términos aleatorios hay que indicar que una sucesión de variables aleatorias puede converger asintóticamente (esto es, tener un límite asintótico) a otra variable aleatoria bien definida o hacia una constante. En el primer caso, la serie de términos aleatorios se acaba convirtiendo en otra variable aleatoria bien definida, por ejemplo una N(0,1), manteniendo su carácter aleatorio; mientras que, en el segundo, esa serie de variables aleatorias degenera para convertirse en una constante y pierde, por tanto, su naturaleza aleatoria. En ambos casos, dado que se trata de convergencia de series de elementos aleatorios, se habla de resultados de convergencia estocástica.
2.-Modos de convergencia.
El hecho de que una sucesión de términos aleatorios converja o no es un resultado importante en si mismo, pero necesitamos conocer algo más, por ejemplo ¿cómo se está desarrollando ese proceso?, ¿con qué exactitud?, ¿a qué velocidad?. Estas cuestiones son relevantes porque, en definitiva, se está tratando con elementos aleatorios que mostraran determinadas fluctuaciones en ese proceso de convergencia, reflejo de su propia naturaleza aleatoria. A medida que el tamaño muestral aumenta se espera que dichas fluctuaciones en torno al límite sean cada vez menores, para desaparecer asintóticamente.
Para estudiar como se van amortiguando las fluctuaciones propias de todo proceso de convergencia se debe introducir la discusión acerca de los modos de
convergencia, centrándonos en los siguientes: convergencia en probabilidad, convergencia en el momento r y convergencia en distribución.
reales converge en probabilidad a la variable aleatoria ( o a la constante) a , si
Pr (^) ( at − a < ε (^) ) > 1 − δ (2)
Lo que esta indicando la expresión (2) es que, aumentando el tamaño t de la muestra, se puede conseguir que la variable aleatoria at se encuentre tan cerca como queramos de la variable aleatoria (o de la constante) a con una probabilidad arbitrariamente próxima a uno. El resultado anterior también podemos expresarlo como :
limt →∞ Pr [ at − a <ε] = 1 (3)
En este caso, a es lo que se llama el límite en probabilidad, la probabilidad límite
La misma definición puede generalizarse al caso de series de vectores o de matrices aleatorias.
Una propiedad interesante en relación con el resultado de convergencia en probabilidad es la denominada de Slutsky con respecto a funciones continuas de variables aleatorias. Este resultado establece lo siguiente: el límite probabilístico de una función continua de una variable aleatoria es la función del límite probabilístico de la variable. Es decir, supongamos que:
plim x (^) t = x 0
y que f ( x ) es una función continua de x , entonces:
La convergencia en momentos es un tipo de convergencia más fuerte que la convergencia en probabilidad dado que excluye la probabilidad de error en un contexto asintótico.
se dice que converge en distribución a la variable aleatoria a , si:
para todo número real b en el que la función de distribución límite [Pr ( a ≤ b )] es continua.
cuya función de distribución es F si:
limt →∞ Pr [ Ft − F <ε] = 1 (7)
Tal convergencia se puede expresar como: at ⎯ ⎯→ D a.
Tanto (6) como (7) indican que convergencia en distribución implica que la sucesión de funciones de distribución asociada a la serie se acaba convirtiendo en otra función de distribución, concreta y bien definida, la cual puede pertenecer o no a la misma familia. Por ejemplo, la distribución t de Student con (T-k) grados de libertad converge a la N(0,1) cuando T tiende a infinito. Por otro lado, no es necesariamente cierto que los momentos de F sean los límites de los momentos de Ft cuando t →∞.
El teorema de Sverdrup se encuentra relacionado con el resultado el resultado de convergencia en distribución y tiene implicaciones interesantes puesto que extiende este tipo de convergencias a funciones continuas de las variables de la sucesión y que se
entonces la sucesión g ( xt ) converge a g ( x ) en distribución, es decir, g ( xt ) ⎯ ⎯→ D g ( x ).
Este Teorema sólo asegura que, asintóticamente, g ( xt ) convergerá a la función de
distribución de g ( x ), cuya forma concreta se deberá obtener en los diferentes planteamientos Es decir, aunque la distribución de x sea conocida, la determinación de la distribución de g ( x ) no resulta siempre inmediata, lo cual hace que este resultado tenga una aplicabilidad limitada.
En cuanto a resultados que combinan tanto la convergencia en probabilidad como la convergencia en distribución destaca el siguiente Teorema de Slutsky: sean
siendo c una constante. Se verifica que:
c
x z
x (^) D t
t (^) ⎯⎯→ ⎭⎬
La relación entre los tres tipos de convergencia es la siguiente:
a (^) t ⎯⎯→ r^ a ⇒ a (^) t ⎯⎯→ p^ a ⇒ at ⎯ ⎯→ D a (11)
Normalmente, en un contexto asintótico se está interesado en obtener resultados de convergencia en probabilidad por dos razones fundamentales:
a) Asegura un grado de exactitud razonable.
b) Permite utilizar directamente el resultado de convergencia en distribución.
La forma usual de demostrar convergencia en probabilidad de una determinada serie de variables aleatorias consiste en verificar la existencia de convergencia en momentos (de orden 2 o inferior puede bastar). Por ejemplo, dada una sucesión de
limt →∞ E ⎢⎣⎡ (^ θ ˆ^ t −θ) (^2) ⎥⎦⎤ = 0 (12)
Pr ˆ^1
Prˆ^1
Aplicando la expresión (3), resulta:
Tlim →∞^ T
con lo cual dicho estimador converge en probabilidad al verdadero valor del parámetro.
No obstante no satisface las condiciones suficientes de consistencia como se va a probar a continuación.
Se trata de un estimador sesgado y, además, el sesgo no desaparece asintóticamente. En cuanto a la varianza:
la cual tiende a infinito conforme aumenta el tamaño muestral.
Como se ha mencionado al principio de este apartado, no sólo interesa conocer la forma en que se desarrolla el proceso de convergencia y su exactitud (cuestiones ambas que recogen los modos de convergencia) sino que también puede interesar la velocidad a la cual se está desarrollando ese proceso de convergencia, lo cual se analiza a través de los denominados ratios de convergencia. Para identificar estos ratios se utiliza la notación O(·) y o(·) que se entienden, respectivamente, como “de orden de magnitud” o simplemente “de orden” y “de orden menor que”.
En términos matemáticos, las definiciones son las siguientes:
Notación O(·): si f ( t ) y g ( t ) son dos funciones reales de la variable entera positiva t, entonces la notación:
f ( t ) = O ( g ( t ))
indica que existe una constante K> 0, tal que:
Tlim → ∞^ ()
g t
f t < k
Por lo general, la función g ( t ) se hace corresponder con alguna potencia de T. Para entender más claramente esta definición consideremos la secuencia:
f ( t ) = 4 + t - 3 t^2
Se aprecia directamente que conforme t aumenta, los términos 4 y t son cada vez más pequeños en relación a -3 (^) t^2 ; de modo que este último término es el denominado término principal de la secuencia y determina su orden de magnitud. En tal caso
diremos, que la secuencia es de orden de magnitud t^2 , y se escribe O( t^2 ), ya que:
Tlim → ∞^^2
t
t^2 +^ t − = 3
En general, se dice que una secuencia es de orden de magnitud t k [O( t k )]
cuando t −^ kf ( t )se encuentre acotada y sea diferente de cero.
Notación o(·): si f ( t ) y g ( t ) son dos funciones reales de la variable entera positiva t, entonces la notación:
f ( t ) = o ( g ( t ))
indica que:
Tlim → ∞^ ()
g t
f t = 0
es decir, el cociente entre ambas funciones es asintóticamente nulo porque la segunda crece a mayor velocidad que la primera.
por lo tanto, la estructura del término encerrado entre paréntesis será de la forma T
a
en el primer caso y de la forma (^) Ta^ en el segundo, siendo a una constante. En definitiva,
consistencia a mayor velocidad y en ese sentido sería preferible.
Una última definición de interés es la de equivalencia asintótica.
Equivalencia asintótica : si f ( t ) y g ( t ) son dos funciones reales de la variable entera positiva t, serán asintóticamente equivalentes si:
Tlim → ∞^ ()
g t
f t = 1
y se denota como: f ( t ) (^) as = g ( t ).
Por ejemplo, resulta claro que el estimador MCO del parámetro de
dispersión
2 2 1
T t ut
∑ y el estimador MV
2 2 1
T t ut
(^) =∑= son asintóticamente equivalentes ya que:
Tlim → ∞^ ()
g t
f t = Tlim →∞
T k T
3.-Leyes de los Grandes Números y Teoremas Centrales del Límite.
Las Leyes de los Grandes Números y los Teoremas Centrales del Límite constituyen un conjunto de resultados que aseguran el cumplimiento de ciertos procesos de convergencia, bajo condiciones diferentes. En el primer caso se garantiza la convergencia en probabilidad de la sucesión de momentos muestrales hacia los respectivos momentos poblacionales; mientras que en el segundo se sientan las bases
para mantener el resultado de convergencia en distribución de grandes agregados de variables aleatorias hacia la distribución Normal.
Leyes de los grandes Números. Antes de presentar las diferentes versiones de la Ley de los Grandes Números (LGN) conviene comentar un resultado previo, valido para todo tamaño muestral, y que, en un contexto asintótico, garantiza las implicaciones de la LGN. Tal resultado es la denominada Desigualdad de Chebyshev. Su finalidad es examinar, acotando, la masa probabilística existente en las colas de una función de distribución. La versión más simple sería la siguiente: sea x una variable aleatoria con
verifica:
Pr x^ p ⎥≤ p^12 ⎦
Es decir, si tipificamos la variable aleatoria, la probabilidad de observar un suceso extraño decrece de forma más que proporcional en relación con el tamaño de la sorpresa.
Esta desigualdad tiene una aplicación inmediata para garantizar la convergencia en probabilidad de la media muestral de una sucesión de variables aleatorias, idéntica e
poblacional. A partir de la expresión (14) también se puede escribir:
Pr x pT ⎥≤ p^12 ⎦
si el tamaño muestral aumenta indefinidamente se puede acotar la discrepancia entre la media muestral y la esperanza poblacional tanto como se quiera; es decir, existe convergencia en probabilidad.
Esta formulación de la desigualdad de Chebyshev requiere únicamente la existencia de los dos primeros momentos; suponiendo que existan momentos de orden superior se pueden obtener acotaciones más precisas como la de Markov.
sucesión de variables aleatorias iid con esperanza y varianza finitas dadas por E( xt ) =
T T (^) t t S x 1
, de modo
en distribución a la N(0,1), es decir:
V T = ⎯⎯→
sucesión de variables aleatorias iid con esperanza y varianza finitas dadas por E ( xt ) =
z = 1
1 T^ t D t
x T
∑ N (0,1)
Para apreciar la potencia de ese resultado, podemos considerar la siguiente
mantener que:
x
o bien:
Este Teorema es el que ha proporcionado a la distribución Normal un papel central en la teoría estadística ya que, aun cuando las variables individualmente no sean normales, un gran agregado de ellas tenderá hacia la Normal.
La versión anterior del TCL se ha obtenido bajo la cláusula iid, aunque se puede renunciar al supuesto de idénticamente distribuidas en cuyo caso se deberán imponer ciertas restricciones sobre el grado de heterogeneidad admisible en la sucesión. Para
1 ∑^1 σ^ =^ σ → ∞ = t
T T (^) t T lim. Si se define la sucesión de sumas parciales (^) ∑ =
T T (^) t t S x 1
de modo que E( S (^) T ) = (^) T
T t t^ ∑ = m = 1
( T )− 1 ( ST − mT ) ⎯⎯→ D N ( 0 , σ 02 ) (19)
Una aplicación de este resultado podría ser la siguiente: dada una muestra
(^22) lim 1 0
T t T (^) t T
→∞ ∑=^ = ,
sin necesidad de conocer la distribución de probabilidad de la población, el Teorema garantiza que:
siendo μ = ∑ T^ μ t.
Por último, se puede establecer la versión matricial del Teorema Central del
tal que 1
lim
T t T →∞ (^) t = T ∑ Σ^ = Σ. Además, siendo todos los momentos de tercer orden de la
distribución multivariante son finitos. Si se define la sucesión de sumas parciales
= ∑=
T T (^) t t S x 1
G (^) de modo que E( S (^) T ) = (^) ∑=
T t 1 t
( ) ⎟⎯⎯→ ( Σ) ⎠
1
T t t
o bien: