Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


guion tema 2, Apuntes de Administración de Empresas

Asignatura: Anàlisi dels comptes anuals de l'administració pública, Profesor: , Carrera: Administració i Direcció d'Empreses, Universidad: UA

Tipo: Apuntes

2013/2014

Subido el 30/06/2014

sso1988
sso1988 🇪🇸

4.3

(22)

7 documentos

1 / 19

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
ESTADISTICA E INTRODUCCION A LA ECONOMETRIA
Departamento de Fundamentos del Análisis Económico
Universidad de Alicante. Curso 2013/14
GUN TEMA 2: ESTIMACION PUNTUAL
Y POR INTERVALOS DE CONFIANZA
1. Estimadores puntuales y sus propiedades
Bibliografía: Newbold et al., Sección 7.1.
Supongamos que nos interesa una determinada característica - parámetro -
de una v.a. Xy que disponemos de una muestra aleatoria simple X1; :::; Xn
de X: En general, el valor del parámetro es desconocido y la muestra aleato-
ria simple de la que disponemos nos será de utilidad para estimarlo. Es
importante entender la diferencia entre los tres conceptos: parámetro,es-
timador yestimación:
Parámetro: Valor poblacional desconocido que es de nuestro interés. Es un
número desconocido.
Estimador: Variable aleatoria que toma distintos valores en función de la mues-
tra. No es un número sino una v.a.
Estimación: Valor concreto que toma el estimador en una muestra determinada.
Dada la muestra, es un mero conocido.
Ejemplo 1:
Estamos interesados en la media de la v.a. Xque tiene una distribución
N(; 1). Como es desconocida, extraemos una m.a.s. X1; X2; X3; X4; X5
de la v.a. Xque resulta ser: 0:4336;0:3426;3:5784;2:7694;1:3499.
Parámetro:
Estimador: X=X1+X2+X3+X4+X5
5
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13

Vista previa parcial del texto

¡Descarga guion tema 2 y más Apuntes en PDF de Administración de Empresas solo en Docsity!

ESTADISTICA E INTRODUCCION A LA ECONOMETRIA

Departamento de Fundamentos del An·lisis EconÛmico Universidad de Alicante. Curso 2013/

GUI”N TEMA 2: ESTIMACION PUNTUAL

Y POR INTERVALOS DE CONFIANZA

1. Estimadores puntuales y sus propiedades

BibliografÌa: Newbold et al., SecciÛn 7.1.

 Supongamos que nos interesa una determinada caracterÌstica - par·metro - de una v.a. X y que disponemos de una muestra aleatoria simple X 1 ; :::; Xn de X: En general, el valor del par·metro es desconocido y la muestra aleato- ria simple de la que disponemos nos ser· de utilidad para estimarlo. Es importante entender la diferencia entre los tres conceptos: par·metro, es- timador y estimaciÛn:

Par·metro: Valor poblacional desconocido que es de nuestro interÈs. Es un n˙mero desconocido.

Estimador: Variable aleatoria que toma distintos valores en funciÛn de la mues- tra. No es un n˙mero sino una v.a.

EstimaciÛn: Valor concreto que toma el estimador en una muestra determinada. Dada la muestra, es un n˙mero conocido.

 Ejemplo 1: Estamos interesados en la media de la v.a. X que tiene una distribuciÛn N (; 1). Como  es desconocida, extraemos una m.a.s. X 1 ; X 2 ; X 3 ; X 4 ; X 5 de la v.a. X que resulta ser: 0 : 4336 ; 0 : 3426 ; 3 : 5784 ; 2 : 7694 ; 1 : 3499.

Par·metro: 

Estimador: X = X^1 +X^2 +X 53 +X^4 +X^5

EstimaciÛn: x = ^0 :4336+0:3426+3:5784+2 5 :^7694 ^1 :^3499 = 0: 9814

 En este caso particular, la media es 0. Notar que x 6 = 0: Por tanto, la estimaciÛn no es el par·metro, aunque los dos sean n˙meros.

 Para estimar un par·metro podemos usar distintos estimadores. Por tanto, debemos estudiar las propiedades de los estimadores para asÌ poder elegir. Sea  nuestro par·metro de interÈs. Diremos que b es un estimador inses- gado de  si E

b

=  para todo valor de 

 Ejemplos de estimadores insesgados:

ñ Media muestral, ya que como vimos en el Tema 1, E

X

ñ Varianza muestral, ya que como vimos en el Tema 1, E (S^2 ) = ^2 ñ ProporciÛn muestral, ya que como vimos en el Tema 1, E (pb) = p

 Un estimador que no es insesgado, se dice que es sesgado. Sea b un estimador de . Se deÖne el sesgo de b como la diferencia entre su esperanza y : Sesgo

b

= E

b

El sesgo de un estimador insesgado es cero.

 Supongamos que tenemos dos estimadores insesgados del par·metro . El siguiente gr·Öco contiene las funciones de densidad de los dos estimadores insesgados

El primer investigador decide utilizar la media de la muestra. Su estimador es: b 1 =

X 1 + X 2 + X 3 + X 4

El segundo investigador cree que la 4a^ observaciÛn es m·s importante que las otras, y por ello decide utilizar una media ponderada, dando un peso del 70% a la 4a^ observaciÛn y del 10% al resto. Su estimador es:

 b 2 = 0: 1 X 1 + 0: 1 X 2 + 0: 1 X 3 + 0: 7 X 4

El tercer investigador conoce los estimadores de los otros investigadores, y decide utilizar una media entre ellos. Su estimador es:

b 3 =

b 1 + b 2 2

 Para estudiar estos tres estimadores, primero veremos si son insesgados. Si lo son, calcularemos su varianza con el Ön de poder compararlos y estudiar cu·l es m·s eÖciente. Como b 1 es la media muestral, sabemos que E(b 1 ) = , y este estimador es insesgado. Adem·s, como tambiÈn vimos en el Tema 1, teniendo en cuenta que hay cuatro observaciones en la muestra, su varianza es:

V ar(b 1 ) =

^2

= 0: 25 ^2

Para calcular la esperanza de b 2 ; basta tener en cuenta la propiedad de linealidad de la esperanza:

E(b 2 ) = 0 : 1 E(X 1 ) + 0: 1 E(X 2 ) + 0: 1 E(X 3 ) + 0: 7 E(X 4 ) = 0 : 1  + 0: 1  + 0: 1  + 0: 7  = 

Luego b 2 es insesgado. Por otra parte:

V ar(b 2 ) = V ar(0: 1 X 1 + 0: 1 X 2 + 0: 1 X 3 + 0: 7 X 4 ) = 0: 12 V ar(X 1 ) + 0: 12 V ar(X 2 ) + 0: 12 V ar(X 3 ) + 0: 72 V ar(X 4 ) = 0: 01 ^2 + 0: 01 ^2 + 0: 01 ^2 + 0: 49 ^2 = 0: 52 ^2

En cuanto al tercer estimador, nuevamente por la propiedad de linealidad de la esperanza se tiene que E(b 3 ) = [E(b 1 ) + E(b 2 )]=2 = ( + )=2 = ; luego este estimador tambiÈn es insesgado. Por otra parte:

V ar(b 3 ) = V ar

b 1 + b 2 2

V ar(b 1 + b 2 )

V ar

X 1 + X 2 + X 3 + X 4

+ 0: 1 X 1 + 0: 1 X 2 + 0: 1 X 3 + 0: 7 X 4

V ar(0: 35 X 1 + 0: 35 X 2 + 0: 35 X 3 + 0: 95 X 4 )

=

0 : 352 V ar(X 1 ) + 0: 352 V ar(X 2 ) + 0: 352 V ar(X 3 ) + 0: 952 V ar(X 4 )

[0: 1225 ^2 + 0: 1225 ^2 + 0: 1225 ^2 + 0: 9025 ^2 ] = 0: 3175 ^2

ObsÈrvese que no serÌa correcto decir que V ar(b 1 +b 2 ) coincide con V ar(b 1 )+ V ar(b 2 ); porque b 1 y b 2 no son independientes.

 Los tres estimadores son insesgados, pero no tienen la misma varianza. Hemos visto que: V ar(b 1 ) < V ar(b 3 ) < V ar(b 2 ) Por tanto, b 1 es m·s eÖciente que b 2 y que b 3 ; mientras que b 3 es m·s eÖciente que b 2 : La eÖciencia relativa de b 1 con respecto a b 2 es:

V ar(b 2 ) V ar(b 1 )

0 : 52 ^2

0 : 25 ^2

La eÖciencia relativa de b 1 con respecto a b 3 es:

V ar(b 3 ) V ar(b 1 )

0 : 3175 ^2

0 : 25 ^2

La eÖciencia relativa de b 2 con respecto a b 3 es:

V ar(b 2 ) V ar(b 3 )

0 : 52 ^2

0 : 3175 ^2

Si la media muestral es x, entonces un intervalo de conÖanza de nivel 100(1 )% para la media poblacional ; cuando ^2 es conocida, es  x z (^) = 2

p n

; x + z (^) = 2

p n

DemostraciÛn: En el Tema 1 vimos que X  q ^2 n

 N (0; 1)

Por tanto, podemos decir que

P

@z (^) = 2 < X q^ ^  ^2 n

< z (^) = 2

A = 1 =)

P

z (^) = 2

p n

< X  < z (^) = 2

p n

P

X z (^) = 2

p n

<  < X + z (^) = 2

p n

Y por tanto

x z (^) = 2 pn ; x + z (^) = 2 pn

es un intervalo de conÖanza de nivel 100(1 )% para la media poblacional :

Por ejemplo,

x 1 : 96 pn ; x + 1: 96 pn

es un intervalo de conÖanza de nivel 95% para la media poblacional :

 Dado

x z (^) = 2 pn ; x + z (^) = 2 pn

un intervalo de conÖanza de nivel 100(1 )% para la media poblacional  diremos que su amplitud (tambiÈn lla- mada longitud o anchura) es 2 z (^) = 2 pn y llamaremos margen de error a la mitad de la amplitud, esto es M E = z (^) = 2 pn :

 Notar que:

ñ cuanto menor sea la amplitud de un intervalo, m·s informativo resulta.

ñ los factores que determinan la amplitud del intervalo son ; n y el nivel de conÖanza. ñ la amplitud del intervalo disminuye a medida que n aumenta. Intu- iciÛn: cuantas m·s observaciones tenemos, m·s informativo resulta el intervalo. ñ la amplitud del intervalo aumenta a medida que el nivel de conÖanza aumenta. IntuiciÛn: cuanto m·s seguros queramos estar de contener al verdadero valor del par·metro mayor tendr· que ser el intervalo.

 Ejemplo 3: El tiempo (en minutos) que tarda un empleado en hacer una reparaciÛn es una v.a. con distribuciÛn N (; ^2 ); siendo  = 1: 5. Queremos obtener un intervalo de conÖanza para  con nivel de conÖanza del 95% a partir de una muestra con 25 observaciones de X: En este caso, como podemos ver en Gretl, z 0 : 025 = 1: 96 ; la expresiÛn del intervalo de conÖanza es:  x 1 : 96

p 25

; x + 1: 96

p 25

ObsÈrvese que, como suponemos conocida , la ˙nica informaciÛn muestral necesaria para obtener este intervalo es X: Si x = 20 minutos, el intervalo que se obtiene es:

(20 0 : 588 ; 20 + 0:588) = (19: 412 ; 20 :588)

La amplitud de este intervalo es el doble del margen de error, esto es 2  0 :588 = 1: 176 : Si quisiÈramos obtener el intervalo de conÖanza para  con nivel de conÖanza del 99% con esta misma muestra, como z 0 : 005 = 2: 58 ; el intervalo que obtendrÌamos serÌa:  x 2 : 58

p 25

; x + 2: 58

p 25

Por tanto, si la media muestral es 20 minutos el intervalo que se obtiene es:

(20 0 : 744 ; 20 + 0:744) = (19: 256 ; 20 :744)

  1. Su esperanza es 0, para k > 1 , y su varianza es k=(k 2), para k > 2 :
  2. A continuaciÛn podemos ver el gr·Öco de la funciÛn de densidad de una distribuciÛn tk para diferentes valores de k; compar·ndola con la funciÛn de densidad normal est·ndar

0

0,

0,

0,

0,

0,

0,

0,

0,

-5 -4 -3 -2 -1 0 1 2 3 4 5

N(0, 1) t(5) t(20)

Como podemos observar, la tk tiene m·s varianza, pero conforme au- menta k se parece cada vez m·s a la normal est·ndar. ObsÈrvese que puede tomar valores positivos y negativos, y que es simÈtrica respecto a 0 :

  1. Al igual que en el caso de las distribuciones normal y chi-cuadrado, las probabilidades de una v.a. con distribuciÛn t de Student (es decir, las ·reas bajo la funciÛn de densidad) no se calculan integrando, sino que estos valores pueden obtenerse con Gretl. Concretamente usando la opciÛn Herramientas )Buscador de valores p.

 Notar adem·s que por la simetrÌa de esta distribuciÛn, P (tk > x) para un n˙mero real negativo x; coincide con 1 P (tk > x):

 RecÌprocamente, en ocasiones dada una probabilidad conocida, querre- mos calcular cu·l es valor, que denotaremos por tk; , tal que se satisface la condiciÛn P (tk > tk; ) = : La opciÛn de Gretl Herramientas )Tablas estadÌsticas nos permite obtener tk; muy f·cilmente.

 Ejemplo 4:

Sea Y una v.a. con distribuciÛn t 10 : Supongamos que queremos calcular P (Y < 3). Usando en Gretl la opciÛn Herramientas )Buscador de valores p. obtenemos que P (Y < 3) = 0: 0067 :

Por simetrÌa, esta probabilidad coincide con P (Y > 3): Por tanto:

P (Y < 3) = P (Y > 3) = 0: 0067

Supongamos ahora que queremos obtener el n˙mero real c que satisface la condiciÛn P (Y > c) = 0:04; usando en Gretl la opciÛn Herramientas )Tablas estadÌsticas tenemos que

c = 1: 9481

En el apartado anterior, la derivaciÛn del intervalo de conÖanza para la media de una poblaciÛn normal con varianza conocida, partÌa del hecho de que X  q ^2 n

 N (0; 1)

Cuando ^2 es desconocido, lo natural es reemplazar este valor por la varianza muestral. El siguiente teorema indica cu·l es la distribuciÛn de la v.a. que resulta cuando hacemos esta sustituciÛn.

 Teorema: Si X 1 ; :::; Xn es una m.a.s. de una v.a. X  N (; ^2 ); entonces:

ñ X y S^2 son v.a. independientes. ñ qX^ S 2 n

es una v.a. con distribuciÛn t de Student con n 1 grados de libertad.

DemostraciÛn: No demostraremos que X y S^2 son v.a. independientes pero si es cierto, ver que Xq^ S 2 n

es una v.a. con distribuciÛn t de Student con n 1 grados de libertad es inmediato ya que

X 

q S^2 n

Xq   n^2 r (n1)S^2 ^2 n 1

 tn 1

A continuaciÛn vamos a obtener el intervalo de conÖanza para la media de una poblaciÛn normal con varianza desconocida, partiendo del resultado que acabamos de demostrar: (X )=(S^2 =n)^1 =^2  tn 1.

 Ejemplo 5: Una clÌnica de adelgazamiento aÖrma que sus clientes pierden, por tÈrmino medio, 10 kg en un trimestre. Para estudiar la veracidad de esta informaciÛn, se dispone de una muestra con el peso que han perdido en un trimestre 36 clientes de la clÌnica. Supongamos que el peso que pierde un cliente de la clÌnica es una v.a. X con distribuciÛn N (; ^2 ): Queremos obtener el intervalo de conÖanza para  con nivel de conÖanza del 95%: En este caso, como t35;0: 025 = 2: 03 ; la expresiÛn del intervalo de conÖanza es: (^)  x 2 : 03

s p 36

; x + 2: 03

s p 36

Si la media muestral es 8 : 68 kg. y la desviaciÛn tÌpica muestral es 1 : 2 kg, entonces el intervalo que se obtiene es:

(8: 68 0 : 406 ; 8 :68 + 0:406) = (8: 274 ; 9 :086)

 Si ahora quisiÈramos obtener el intervalo de conÖanza para  con nivel de conÖanza del 99% utilizando esta misma muestra, como t35;0: 005 = 2: 724 ; el intervalo que obtendrÌamos serÌa:  x 2 : 724

s p 36

; x + 2: 724

s p 36

Por tanto, si la media muestral es 8 : 68 kg y la desviaciÛn tÌpica muestral es 1 : 2 kg, el intervalo que se obtiene es:

(8: 68 0 : 545 ; 8 :68 + 0:545) = (8: 135 ; 9 :225)

Como podÌamos anticipar, la amplitud de este intervalo ( 2  0 :545 = 1: 09 ) es mayor que la del anterior ( 2  0 :406 = 0: 812 ). Aun asÌ, sigue sin resultar verosÌmil la aÖrmaciÛn de la clÌnica.

 Si ahora comparamos las fÛrmulas del intervalo de conÖanza para la media , deducidas en el apartado anterior:  x z (^) = 2

p n

; x + z (^) = 2

p n

y en Èste: (^)  x tn1; = 2

s p n

; x + tn1; = 2

s p n

vemos que al reemplazar  por S; tambiÈn tenemos que reemplazar z (^) = 2 por tn1; = 2. Como la distribuciÛn t de Student tiene m·s varianza que la normal est·ndar, tn1; = 2 > z (^) = 2 ; luego el intervalo que obtendremos es m·s amplio que el que habrÌamos obtenido si hubiÈramos utilizado z (^) = 2 ; esto es lÛgico, pues reáeja el hecho de que al no conocer la varianza y tener que estimarla, hay m·s incertidumbre.

4. Intervalo de conÖanza para una media o una proporciÛn

con muestras de gran tamaÒo

BibliografÌa: Newbold et al., SecciÛn 7.4.

 En los apartados anteriores, el resultado de partida para la obtenciÛn del intervalo de conÖanza ha sido que

X  q ^2 n

 N (0; 1)

Cuando la distribuciÛn de X no es normal, este resultado no es cierto, pero el TCL nos permite asegurar que es aproximadamente cierto si el tamaÒo muestral es suÖcientemente grande. Puede comprobarse adem·s (no lo haremos) que si reemplazamos ^2 por S^2 ese resultado aproximado sigue siendo cierto, es decir, para n suÖcientemente grande: X  q S^2 n

' N (0; 1)

 Antes vimos que sustituir ^2 por S^2 tiene efectos en la distribuciÛn exacta de esta v.a. Sin embargo, ahora vemos que esta sustituciÛn no tiene efectos en la dis- tribuciÛn aproximada si n es suÖcientemente grande. Esto es lÛgico porque S^2 tendr· un valor muy parecido a ^2.

 Ejemplo 7: Supongamos que queremos estimar la proporciÛn p de votantes de una gran poblaciÛn que tienen intenciÛn de votar aÖrmativamente en un referÈndum sobre una cuestiÛn de interÈs. Para ello se dispone de una muestra con la intenciÛn de voto de 10000 votantes. En este caso, el intervalo de conÖanza aproximado para p con un nivel de conÖanza del 100(1 )% es:

bp z (^2)

r bp(1 bp) 10000

; pb + z (^2)

r bp(1 bp) 10000

 Supongamos que 5236 de los votantes encuestados tienen intenciÛn de votar aÖrmativamente, es decir, que la proporciÛn muestral de votantes con inten- ciÛn de votar aÖrmativamente es pb = 0: 5236 : En ese caso, para obtener el intervalo de conÖanza para p con nivel de conÖanza del 95%, debemos utilizar z 0 : 025 = 1:96; con estos valores se obtiene el intervalo: (0: 5236 0 : 0098 ; 0 :5236 + 0:0098) = (0: 5138 ; 0 :5334) An·logamente, si queremos obtener el intervalo de conÖanza para p con nivel de conÖanza del 99%, tenemos que utilizar z 0 : 005 = 2: 58 ; con estos valores se obtiene el intervalo: (0: 5236 0 : 0129 ; 0 :5236 + 0:0129) = (0: 5107 ; 0 :5365) Puesto que todos los valores que est·n dentro de este intervalo de conÖanza son superiores a 0 : 5 , concluimos que con un nivel de conÖanza del 99% el resultado del referÈndum ser· positivo

5. Intervalo de conÖanza para la varianza de una poblaciÛn

normal

BibliografÌa: Newbold et al., SecciÛn 7.5.

 A continuaciÛn vamos a obtener el intervalo de conÖanza para la varianza de una poblaciÛn normal, partiendo del resultado (n 1)S^2 ^2

 ^2 n 1

visto en el tema anterior. Conviene recordar la notaciÛn: dado un n˙mero entre 0 y 1 ; se representa como ^2 n1; = 2 al n˙mero real que deja una probabilidad = 2 a su derecha en una distribuciÛn chi-cuadrado con n 1 grados de libertad, es decir, ^2 n1; = 2 es el n˙mero real que es soluciÛn de la ecuaciÛn: P (W > ^2 n1; = 2 ) = = 2 ; siendo W  ^2 n 1 :

 Sea X 1 ; X 2 ; :::; Xn una m.a.s. de una v.a. X  N (; ^2 ).

Un intervalo de conÖanza de nivel 100(1 )% para la varianza poblacional ^2 es (n 1)s^2 ^2 n1; = 2

(n 1)s^2 ^2 n1;1 = 2

DemostraciÛn: Hemos visto que (n 1)S^2 ^2

 ^2 n 1

Por tanto, podemos decir que

P

^2 n1;1 = 2 <

(n 1)S^2 ^2

< ^2 n1; = 2

P

(n 1)S^2 ^2 n1; = 2

< ^2 <

(n 1)S^2 ^2 n1;1 = 2

Y por tanto

(n1)s^2 ^2 n1; = 2 ;^

(n1)s^2 ^2 n1;1 = 2

es un intervalo de conÖanza de nivel 100(1

)% para la varianza poblacional ^2 :

Por ejemplo, en una muestra de tamaÒo n = 10,

9 s^2 19 : 02 ;^

9 s^2 2 : 70

es un intervalo de conÖanza de nivel 95% para la varianza poblacional ^2 : Si queremos obtener un intervalo de conÖanza para la desviaciÛn tÌpica de una poblaciÛn normal, el razonamiento anterior tambiÈn permite demostrar que puede obtenerse sin m·s que tomar la raÌz cuadrada de los extremos del intervalo de conÖanza obtenido para la varianza. Por tanto s (n 1)s^2 ^2 n1; = 2

s (n 1)s^2 ^2 n1;1 = 2

6. RESUMEN SOBRE INTERVALOS DE CONFIANZA

OBJETIVO EXTREMOS DEL INTERVALO I.C. para  con ^2 conocido y poblaciÛn normal

x  z (^) = 2

p n I.C. para  con ^2 desconocido y poblaciÛn normal

x  tn1; = 2

s p n I.C. para  con ^2 desconocido, poblaciÛn no normal y n grande

x  z (^) = 2

s p n

I.C. para p con n grande (^) bp  z (^) = 2

q pb(1bp) n

I.C. para ^2 con poblaciÛn normal

n 1 ^2 n1; = 2

s^2 ;

n 1 ^2 n1;1 = 2

s^2

I.C. para  con poblaciÛn normal

s n 1 ^2 n1; = 2

s^2 ;

s n 1 ^2 n1;1 = 2

s^2