Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Calculo de Intervalos de Confianza para Parámetros Desconocidos, Diapositivas de Probabilidad

Cómo calcular intervalos de confianza para parámetros desconocidos en estadística, utilizando la teoría de la probabilidad y la distribución de Student t. Se presentan diferentes casos y métodos para encontrar intervalos de confianza para parámetros como media y desviación estándar.

Tipo: Diapositivas

2021/2022

Subido el 10/10/2022

quijote
quijote 🇪🇸

4.3

(12)

77 documentos

1 / 17

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Cap´ıtulo 7
Intervalos de Confianza
7.1. Introducci´on
Con las herramientas que construimos en los cap´ıtulos pasados, sabemos que si nuestra poblaci´on
de inter´es sigue una distribuci´on N(µ, 1) y extraemos una m.a. X1, X2, X3, X4, entonces el mejor
estimador para µque podemos construir con la informaci´on proveniente de la m.a. es ¯
X; sin embargo,
la probabilidad de que estimemos a µcorrectamente con ¯
Xes P(¯
X=µ) = 0. Si en lugar de estimar
puntualmente a µ, la estimamos con un intervalo, por ejemplo; [ ¯
X1,¯
X+1]. Entonces, la probabilidad
de que cubramos a µcon el intervalo [ ¯
X1,¯
X+ 1] ser´ıa 1:
P(µ[¯
X1,¯
X+ 1]) = P(¯
X1µ¯
X+ 1)
=P(1¯
Xµ1)
=P(1
1/4¯
Xµ
1/41
1/4)
=P(2Z2)
=P(Z2) P(Z 2)
=P(Z2) [1 P(Z2)] = 2P(Z2) 1
= 0.9544997
Esto implica, que con una probabilidad de .95, el intervalo [ ¯
X1,¯
X+ 1] cubrir´a a µ, as´ı, sac-
rificando precisi´on en la estimaci´on al utilizar un intervalo en vez de una estimaci´on puntual, hemos
ganado una garant´ıa en erminos de probabilidades.
En la pr´actica no podemos usar ¯
Xcomo estimaci´on de µ, as´ı como tampoco podremos utilizar el
intervalo [ ¯
X1,¯
X+ 1], ya que los dos dependen de la v.a. ¯
Xy por lo tanto uno es una v.a. y el
otro es un intervalo aleatorio. Lo que se hace es utilizar el estimado ¯
X= ¯x, de donde obtenemos el
intervalo x1,¯x+ 1]; sin embargo, claramente ´este no ser´ıa un intervalo aleatorio, sino un intervalo
fijo que depender´ıa del valor observado en la m.a. y por lo tanto, no se puede afirmar que con una
probabilidad de .95, el intervalo x1,¯x+1] cubrir´a a µ(podemos calcular este tipo de probabilidades
1Tenemos que ser cuidadosos en este punto pues µes una cantidad fija, desconocida, pero fija, y la variable aleatoria
es ¯
X. Entonces no podemos decir, la probabilidad de que µcaiga dentro del intervalo el intervalo [ ¯
X1,¯
X+ 1], tenemos
que decir la probabilidad de que el intervalo [ ¯
X1,¯
X+ 1] cubra a µ. El intervalo es aleatorio y µes un par´ametro fijo.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Calculo de Intervalos de Confianza para Parámetros Desconocidos y más Diapositivas en PDF de Probabilidad solo en Docsity!

Cap´ıtulo 7

Intervalos de Confianza

7.1. Introducci´on

Con las herramientas que construimos en los cap´ıtulos pasados, sabemos que si nuestra poblaci´on de inter´es sigue una distribuci´on N (μ, 1) y extraemos una m.a. X 1 , X 2 , X 3 , X 4 , entonces el mejor estimador para μ que podemos construir con la informaci´on proveniente de la m.a. es X¯; sin embargo, la probabilidad de que estimemos a μ correctamente con X¯ es P ( X¯ = μ) = 0. Si en lugar de estimar puntualmente a μ, la estimamos con un intervalo, por ejemplo; [ X¯ − 1 , X¯ +1]. Entonces, la probabilidad de que cubramos a μ con el intervalo [ X¯ − 1 , X¯ + 1] ser´ıa 1 :

P (μ ∈ [ X¯ − 1 , X¯ + 1]) = P ( X¯ − 1 ≤ μ ≤ X¯ + 1) = P (− 1 ≤ X¯ − μ ≤ 1)

= P (

X¯ − μ 1 /

= P (− 2 ≤ Z ≤ 2)

= P (Z ≤ 2) − P (Z ≤ −2)

= P (Z ≤ 2) − [1 − P (Z ≤ 2)] = 2P (Z ≤ 2) − 1

Esto implica, que con una probabilidad de .95, el intervalo [ X¯ − 1 , X¯ + 1] cubrir´a a μ, as´ı, sac- rificando precisi´on en la estimaci´on al utilizar un intervalo en vez de una estimaci´on puntual, hemos ganado una garant´ıa en t´erminos de probabilidades.

En la pr´actica no podemos usar X¯ como estimaci´on de μ, as´ı como tampoco podremos utilizar el intervalo [ X¯ − 1 , X¯ + 1], ya que los dos dependen de la v.a. X¯ y por lo tanto uno es una v.a. y el otro es un intervalo aleatorio. Lo que se hace es utilizar el estimado X¯ = ¯x, de donde obtenemos el intervalo [¯x − 1 , x¯ + 1]; sin embargo, claramente ´este no ser´ıa un intervalo aleatorio, sino un intervalo fijo que depender´ıa del valor observado en la m.a. y por lo tanto, no se puede afirmar que con una probabilidad de .95, el intervalo [¯x − 1 , x¯ + 1] cubrir´a a μ (podemos calcular este tipo de probabilidades

(^1) Tenemos que ser cuidadosos en este punto pues μ es una cantidad fija, desconocida, pero fija, y la variable aleatoria es X¯. Entonces no podemos decir, la probabilidad de que μ caiga dentro del intervalo el intervalo [ X¯ − 1 , X¯ + 1], tenemos que decir la probabilidad de que el intervalo [ X¯ − 1 , X¯ + 1] cubra a μ. El intervalo es aleatorio y μ es un par´ametro fijo.

7.1. INTRODUCCI ON´ Carlos Erwin Rodr´ıguez

para variables aleatorias, m´as no para cantidades fijas, lo m´as que se podr´ıa decir es que la probabili- dad anterior es cero o uno). Sin embargo, se puede ver que si obtenemos muchas muestras, digamos, m, cada una de tama˜no n (en este caso n = 4), entonces, en t´erminos de frecuencias, alrededor del (.95)(m) de los intervalos contendr´an al valor verdadero μ, si lo vi´eramos en t´erminos de porcentajes, entonces, llegar´ıamos a que alrededor del 95 % de los intervalos contendr´ıan a μ. Lo anterior se puede verificar f´acilmente realizando una simulaci´on.

Supongamos que nuestra poblaci´on se comporta como una N (μ, 1) con μ = 6.3. Entonces, para realizar la simulaci´on generamos m = 10, 000 m.a. de tama˜no n = 4, cada una proveniente de la poblaci´on N (6. 3 , 1) as´ı, para cada muestra construimos el intervalo [¯x − 1 , ¯x + 1] y contamos cu´antas veces cae μ = 6.3, en el intervalo respectivo. Con esto podemos calcular el porcentaje de intervalos que efectivamente contienen a μ. Al realizar el experimento en R, se obtuvo que el porcentaje de intervalos que contuvieron a μ fue de 95.2 % que si por un momento lo vi´eramos como una probabilidad, se aproximar´ıa mucho a lo que se obtuvo previamente. El histograma para las medias, junto con la distribuci´on de muestreo (la normal N (6. 3 , 1 /4)) se muestra en la figura 7.1.

Medias

Frecuencias Relativas

4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.

Figura 7.1: Histograma para las medias de las 10, 000 m.a. junto con la distribuci´on de muestreo.

A continuaci´on se define formalmente lo que entenderemos como intervalo de confianza.

Definici´on (Intervalo de Confianza)

Sea X 1 , X 2 ,... , Xn una m.a. de fX (x|θ). Sean L(X) = L(X 1 , X 2 ,... , Xn) y U (X) = U (X 1 , X 2 ,... , Xn) dos estad´ısticas tales que L(X) ≤ U (X) ∀ X = (X 1 , X 2 ,... , Xn) para las cuales

P (L(X) ≤ τ (θ) ≤ U (X)) = γ

en donde γ no depende de θ; entonces al intervalo aleatorio [L(X), U (X)] se le llama intervalo del γ100 % de confianza para τ (θ)

7.2. M ETODO PIVOTAL´ Carlos Erwin Rodr´ıguez

Ejemplo 1 Sea X 1 , X 2 ,... , Xn una m.a. de una N (μ, σ 02 ) (σ 02 conocida)

Q 1 =

X¯ − μ √^ σ^0 n

∼ N (0, 1)

Como Q 1 es funci´on de la m.a. y su distribuci´on no depende de μ ni de ning´un par´ametro desconocido, entonces Q 1 es una cantidad pivotal para μ. ||

A continuaci´on se describe de forma general la implementaci´on del m´etodo pivotal para encontrar un intervalo de confianza para θ.

Sea X 1 , X 2 ,... , Xn una m.a. de fX (x|θ)

  1. Se encuentra una cantidad pivotal Q = q(X|θ) para θ.
  2. Sea 0 < γ < 1 fijo, encontramos q 1 y q 2 tales que q 1 ≤ q 2 y

P (q 1 ≤ Q ≤ q 2 ) = γ

  1. Se pivotea Q de forma que obtengamos

P (L(X) ≤ θ ≤ U (X)) = γ

Entonces, [L(X), U (X)] es un intervalo del γ100 % de confianza para θ.

Vamos a utilizar el m´etodo pivotal para encontrar intervalos de confianza para μ y σ^2 en el caso de la distribuci´on normal.

7.2.1. Muestreando de la Distribuci´on Normal

La fdp normal ocupa un papel central en la inferencia estad´ıstica, por lo que conviene desarrollar detalladamente los m´etodos para encontrar intervalos de confianza para μ y σ^2. En toda esta parte utilizaremos una m.a. X 1 , X 2 ,... , Xn de una N (μ, σ^2 ).

Intervalo de Confianza para μ

Caso en el que σ^2 es conocida.

Sabemos que X¯−μ √^ σ n

∼ N (0, 1), entonces ya tenemos nuestra cantidad pivotal (estamos en el caso en el que σ^2 es conocido). Ahora s´olo hay que encontrar a y b tales que

1 − α = P (a < X¯ − μ √^ σ n

< b) para 0 < α < 1 (7.1)

= P ( X¯ − b σ √ n

< μ < X¯ − a σ √ n

7.2. M ETODO PIVOTAL´ Carlos Erwin Rodr´ıguez

El intervalo que utilizaremos para realizar inferencias acerca de μ vendr´ıa dado por (7.2), sin embargo, necesitamos encontrar el a y b que cumplan con (7.1). En R hay muchos valores para a y b que cumplen con (7.1). Para fijar ideas y mostrar que esto es as´ı; tomemos 1 − α = 0.90, con este valor en particular, en la tabla siguiente presentamos algunos valores para a y b tales que P (a ≤ Z ≤ b) = P (Z ≤ b) − P (Z ≤ a) = 0.90 con Z ∼ N (0, 1)

a b P (Z ≤ a) P (Z ≤ b) P (Z ≤ b) − P (Z ≤ a) b − a -1.43 1.98 0.0763 0.9763 .9 3. -1.9 1.46 0.0287 0.9287 .9 3. -1.65 1.65 0.05 0.95 .9 3.

entonces lo que tenemos que hacer es encontrar el a y b que cumplan con (7.1) y que hagan m´ınima la longitud del intervalo en (7.2), pues mientras m´as chico sea el intervalo vamos a tener m´as informaci´on acerca de μ. La longitud del intervalo es l = (b − a) √σn , sin embargo, la cantidad √^ σ n esta fija y lo ´unico que var´ıa es^ b^ −^ a, entonces vamos a minimizar^ l^ =^ b^ −^ a^ sujeto a (7.1). Pero l claramente es una funci´on de a, pues si a se mueve, b autom´aticamente tiene que ajustarse para cumplir con la condici´on de que la probabilidad de que la cantidad pivotal est´e entre a y b sea 1 − α. En la figura 7.2 a continuaci´on, se muestran dos gr´aficas de la N (0, 1) de forma que entre a 1 y b 1 hay un ´area de 1 − α debajo de la curva y si movemos a 1 a a 2 para conservar el ´area de 1 − α, b 1 se tiene que mover a b 2.

z

f(Z z) 1 − α

a 1 b 1 z

f(Z z) 1 − α

a 2 b 2

Figura 7.2: Gr´aficas de la distribuci´on N (0, 1) al mover a 1 a a 2 manteniendo un ´area de 1−α constante

Entonces, para encontrar el intervalo de longitud m´as peque˜na, que ser´a el que nos llevar´a a la elecci´on ´optima de a y b tenemos que resolver el siguiente problema:

min l(a) = min b(a) − a

s.a.

∫ (^) b(a)

a

fZ (z)dz = 1 − α

En donde l(a) es funci´on de a y Z ∼ N (0, 1) por lo que fZ (z) es la fdp de una N (0, 1).

7.2. M ETODO PIVOTAL´ Carlos Erwin Rodr´ıguez

As´ı, para encontrar a y b en (7.1) hacemos a = −b y desarrollamos:

1 − α = P (−b < X¯ − μ √^ σ n

< b)

= P (−b < Z < b) = P (Z ≤ b) − P (Z ≤ −b) = P (Z ≤ b) − (1 − P (Z ≤ b)) = 2P (Z ≤ b) − 1 ⇔ P (Z ≤ b) = 1 − α 2 Por lo que fijando α, b queda determinado autom´aticamente, pues sabemos que b = zα/ 2 , el cuantil α/2 de una N (0, 1). En la figura 7.3 mostramos c´omo se ve este cuantil.

z

f(Z

z)

α 2

1 − α 2

zα 2

Figura 7.3: Gr´afica del cuantil zα/ 2 de la distribuci´on N (0, 1)

Entonces, sustituyendo el valor de b = zα/ 2 y a (tomando en cuenta que a = −b) en la ecuaci´on (7.2), llegamos a que el intervalo de confianza ´optimo del (1 − α)100 % para μ con σ^2 conocida es

( X¯ − zα/ 2 σ √ n

, X¯ + zα/ 2 σ √ n

Caso en el que se desconoce σ^2 (esta construcci´on se utiliza mucho en regresi´on).

Sabemos que X¯−μ √^ σ n ∼ N (0, 1) y que (n−1)S

2 σ^2 ∼^ χ

(^2) n− 1 (ver secci´on 5.3 corolario 1) como tenemos

una m.a. de una N (μ, σ^2 ), ambas cantidades son independientes y por lo tanto:

X¯ − μ σ/

n √ (n−1)S^2 σ^2 /(n^ −^ 1)

N (0, 1)

χ^2 n− 1 /n − 1

X¯ − μ √^ S n

∼ Tn− 1 (7.11)

7.2. M ETODO PIVOTAL´ Carlos Erwin Rodr´ıguez

en donde S^2 =

∑n 1 (Xi−^ X¯)^2 n− 1. Claramente en la segunda parte de (7.11) estamos cometiendo un abuso de notaci´on, sin embargo, esta transformaci´on es tan importante que es preferible cometer algunos abusos para que el desarrollo quede claro a omitir pasos y que queden dudas acerca de la construcci´on.

Ya tenemos nuestra cantidad pivotal, entonces hay que encontrar a y b de forma que la longitud del intervalo dado por

P (a <

X¯ − μ √^ S n

< b) = 1 − α para 0 < α < 1

sea m´ınima, sin embargo ya que la Tn− 1 tiene una fdp sim´etrica y se comporta de forma similar a la N (0, 1) llegar´ıamos (de forma totalmente an´aloga al caso en el que σ^2 era conocida) a que la mejor opci´on para a y b es tomar a = −b y por lo tanto el intervalo de confianza ´optimo del (1 − α)100 % para μ ser´ıa:

( X¯ − tα/ 2 ,n− 1

S

n

, X¯ + tα/ 2 ,n− 1

S

n

En donde ahora, en lugar de los cuantiles de una una normal est´andar, tenemos los cuantiles de una T de Student con n − 1 grados de libertad. 

Intervalo de Confianza para σ^2

  1. Caso en el que μ es conocida.

La cantidad pivotal es

∑n 1 (Xi−μ)^2 σ^2 ∼^ χ

(^2) n. Formalmente, para elegir el a y b ´optimos, se deber´ıa proseguir como con los intervalos de confianza para μ, sin embargo, este camino no tiene una soluci´on anal´ıtica sencilla, por lo que en la pr´actica no se encuentra el intervalo con amplitud m´ınima, sino el que deja colas iguales a α 2 , as´ı el intervalo de confianza del (1 − α)100 % para σ^2 con μ conocida se obtiene al trabajar con

1 − α = P (χ^21 −α/ 2 ,n <

∑n 1 (Xi^ −^ μ) 2 σ^2

< χ^2 α/ 2 ,n)

= P

n 1 (Xi^ −^ μ) 2 χ^2 α/ 2 ,n

< σ^2 <

∑n 1 (Xi^ −^ μ) 2 χ^21 −α/ 2 ,n

⇔ σ^2 ∈

( ∑n 1 (Xi^ −^ μ) 2 χ^2 α/ 2 ,n

∑n 1 (Xi^ −^ μ) 2 χ^21 −α/ 2 ,n

7.3. INTERVALOS ASINT OTICOS´ Carlos Erwin Rodr´ıguez

Y^ ¯ − X¯−(μ 2 −μ 1 ) σ

√ ( (^) n^1 + (^) m^1 ) √ (^) ∑n 1 (Xi−^ X¯)^2 +

∑m 1 (Yi−^ Y¯^ )^2 (m+n−2)σ^2

Y¯ − X¯ − (μ 2 − μ 1 ) Sp

( (^1) n + (^) m^1 )

∼ tm+n− 2 (7.17)

En donde S p^2 =

∑n 1 (Xi−^ X¯)^2 +

∑m 1 (Yi−^ Y¯^ )^2 n+m− 2. Claramente (7.17) es una cantidad pivotal ya que su distribuci´on no depende de μ 2 − μ 1 y no es funci´on de ning´un par´ametro desconocido. As´ı, llegamos a:

P (−tα/ 2 ,m+n− 2 ≤

Y¯ − X¯ − (μ 2 − μ 1 ) Sp

( (^) n^1 + (^) m^1 )

≤ tα/ 2 ,m+n− 2 ) = 1 − α

Pivoteando de la ecuaci´on anterior, tenemos que el intervalo de confianza del (1 − α)100 % para μ 2 − μ 1 , est´a dado por

( Y¯ − X¯) ∓ tα/ 2 ,m+n− 2 Sp

n

m

7.3. Intervalos Asint´oticos

El m´etodo asint´otico para encontrar intervalos de confianza se basa en el m´etodo pivotal y en el siguiente:

Teorema 1 Si fX (x|θ) satisface ciertas condiciones de regularidad (las del teorema de la cota inferior de Cr´amer-Rao) y si θˆn(X) = θˆ(X 1 , X 2 ,... , Xn) es el estimador m´aximo veros´ımil de θ para una m.a. de tama˜no n, entonces θˆn(X) ∼a N (θ, σ^2 n(θ))

En donde σ n^2 (θ) =

−nE

[

d^2 dθ^2 ln^ fX^ (X|θ)

]

Lo que este teorema nos dice es que a medida que n crece, de forma asint´otica ( ∼a) θˆn(X) se va a distribuir aproximadamente como una normal. Utilizando este resultado, para tama˜nos de muestra suficientemente grandes, podemos emplear

θˆn(X) − θ σn(θ)

∼ N (0, 1)

como una cantidad pivotal y as´ı construir un intervalo de confianza asint´otico para θ.

Observaci´on 6 Para hacer expl´ıcito que el estimador m´aximo veros´ımil, θˆ, depende de la m.a. y de n, el tama˜no de la m.a., en el teorema anterior lo denotamos como θˆn(X), sin embargo, en lo sucesivo lo escribiremos s´olo como ˆθ.

7.3. INTERVALOS ASINT OTICOS´ Carlos Erwin Rodr´ıguez

Ejemplo 2 Sea X 1 , X 2 ,... , Xn una m.a. de

fX (x|θ) = θe−θx

para 0 < x < ∞ y θ > 0.

Para calcular el intervalo asint´otico para θ, tomamos en cuenta que ˆθ = (^) X^1 ¯ y que

σ^2 n(θ) =

−nE

[

d^2 dθ^2 ln^ fX^ (X|θ)

] (^) = θ

2 n

Por lo que, por el Teorema 1,

1 X^ ¯ −^ θ √^ θ n

∼a N (0, 1) entonces para n suficientemente grande

P (−zα/ 2 <

X^ ¯ −^ θ θ √ n

< zα/ 2 ) = 1 − α

pivoteando sobre θ y haciendo algunos manejos algebraicos se llega a que el intervalo asint´otico del (1 − α)100 % de confianza para θ es ( (^) √ n (

n + zα/ 2 ) X ¯

n (

n − zα/ 2 ) X¯

Ejemplo 3 Sea X 1 , X 2 ,... , Xn una m.a. de

f (x|p) = px(1 − p)^1 −x

El estimador m´aximo veros´ımil de p es ˆp = X¯ y σ n^2 (p) = p(1 n− p). Entonces, un intervalo de confianza asint´otico para p del (1 − α)100 % vendr´ıa dado por:

P (−zα/ 2 < X¯ − p √ p(1−p) n

< zα/ 2 ) = 1 − α (7.18)

Sin embargo, pivotear p de (7.18) es un poco complicado, adem´as, al final para n suficientemente grande muchos t´erminos se pueden despreciar por lo que en lugar de trabajar con σ^2 n(p) se usa σ^2 n(ˆp), entonces

1 − α = P

−zα/ 2 < X¯ − p √ (^) ¯ X(1− X¯) n

< zα/ 2

X^ ¯ − zα/ 2

X¯(1 − X¯)

n

, X¯ + zα/ 2

X¯(1 − X¯)

n

es el intervalo asint´otico del (1 − α)100 % de confianza para p. ||

7.4. PIVOTEANDO LA FUNCI ON DE DISTRIBUCI ´ ON´ Carlos Erwin Rodr´ıguez

Ejemplo 4 Sea X 1 , X 2 ,... , Xn una m.a. de

f (x|θ) =

θ

1 (0,θ)(x)

Empleando el Teorema 2 vamos a construir un intervalo de confianza para θ.

Usaremos T = X(n) = m´ax{X 1 , X 2 ,... , Xn} ya que

L(θ|x) =

∏^ n

1

f (xi|θ) =

θ

)n

1 (0,x(n))(x(1)) 1 (0,θ)(x(n))

entonces por el Teorema de Factorizaci´on X(n) = m´ax{X 1 , X 2 ,... , Xn} es una estad´ıstica suficiente para θ

fX(n) (x) = fT (t) = n

θ

)n

tn−^11 (0,θ)(t)

⇒ FT (t|θ) =

t θ

)n

Claramente para t fijo FT (t|θ) es una funci´on decreciente de θ, entonces utilizamos la primera parte del Teorema 2.

Primero encontramos θU (t 0 )

α 1 = FT (t 0 |θU (t 0 )) =

t 0 θU (t 0 )

)n

⇔ θU (t 0 ) = t 0 (α 1 )^1 /n Ahora vamos a encontrar θL(t 0 )

1 − α 2 = FT (t 0 |θL(t 0 )) =

t 0 θU (t 0 )

)n

⇔ θL(t 0 ) = t 0 (1 − α 2 )^1 /n

Entonces el intervalo del (1 − α)100 % de confianza para θ es [ t 0 (1 − α 2 )^1 /n^

t 0 (α 1 )^1 /n

]

Aqu´ı es posible encontrar el intervalo de confianza ´optimo para θ, si minimizamos

t 0

(α 1 )^1 /n^

(1 − α 2 )^1 /n

sujeto a que α 1 + α 2 = α y 0 < α 1 + α 2 < 1. En donde (7.22) es la longitud del intervalo (7.21). Se puede ver que (7.22) es m´ınimo y las restricciones se cumplen si α 2 = 0 ⇒ α 1 = α. Por lo que el intervalo del (1 − α)100 % de confianza ´optimo para θ ser´ıa

7.4. PIVOTEANDO LA FUNCI ON DE DISTRIBUCI ´ ON´ Carlos Erwin Rodr´ıguez

[

t 0 ,

t 0 (α)^1 /n

]

El Teorema 2 es para el caso en el que la distribuci´on de T sea la de una v.a. continua, cuando T es una v.a. discreta podemos utilizar el siguiente

Teorema 3 (Pivoteando de una funci´on de distribuci´on discreta) Sea T una estad´ıstica discreta con funci´on de distribuci´on P (T ≤ t|θ) y sea α 1 +α 2 = α con 0 < α < 1 fijo. Para cada t ∈ ̟ en donde ̟ es el espacio de todos los valores posibles de T. Se define θL(t 0 ) y θU (t 0 ) como sigue (t 0 = T (x 1 , x 2 ,... , xn) es el valor que toma la estad´ıstica al evaluar la m.a. observada)

  1. Si P (T ≤ t|θ) es decreciente como funci´on de θ para cada t, encontramos θL(t 0 ) y θU (t 0 ) de forma que aproximadamente se cumpla que

P (T ≤ t 0 |θU (t 0 )) = α 1 y P (T ≥ t 0 |θL(t 0 )) = α 2

  1. Si P (T ≤ t|θ) es creciente como funci´on de θ para cada t, encontramos θL(t 0 ) y θU (t 0 ) de forma que aproximadamente se cumpla que

P (T ≥ t 0 |θU (t 0 )) = α 1 y P (T ≤ t 0 |θL(t 0 )) = α 2

Entonces [θL(t 0 ), θU (t 0 )] es un intervalo del (1 − α)100 % de confianza para θ.

Una elecci´on com´un es tomar α 1 = α 2 = α/2, pero esto no garantiza que encontremos el intervalo de confianza ´optimo, en el sentido de que tenga longitud m´ınima.

Ejemplo 5 Sea X 1 , X 2 ,... , X 10 una m.a. de una Bernoulli(p), vamos a construir un intervalo del 95 % confianza para p.

Supongamos que en la muestra se observa xi = 0 ∀i 6 = 3 y x 3 = 1, entonces ¯x = 101.

Si utilizamos el intervalo asint´otico (7.20), llegamos a que el intervalo del 95 % de confianza para p ser´ıa (−. 0859 , .2859). Claramente hay un problema con este intervalo, pues 0 ≤ p ≤ 1. Una s´oluci´on ser´ıa cortarlo y reportarlo como (0, .2859); sin embargo, este intervalo ya no es del 95 % de confianza, adem´as si la cota inferior manifestaba problemas obvios, la cota superior tambi´en debe tener problemas aunque no sean evidentes. El problema aqu´ı en realidad es que la m.a. con la que estamos trabajando es de tama˜no 10 y estamos construyendo un intervalo asint´otico, entonces, aunque el intervalo no tuviera problemas visibles, estar´ıamos cometiendo un gran error al basar nuestras inferencias en ´el.

Para evitar este tipo de problemas vamos a utilizar el Teorema 3 para construir un intervalo de confianza para p.

Estamos trabajando con una m.a. de una Bernoulli(p), entonces nos conviene usar como estad´ısti- ca a T =

1 Xi^ que es suficiente para^ p, adem´as, sabemos que^ T^ =^

1 Xi^ ∼^ Bin(10, p), entonces

7.4. PIVOTEANDO LA FUNCI ON DE DISTRIBUCI ´ ON´ Carlos Erwin Rodr´ıguez

  1. 025 = P (T ≥ t 0 |pL(t 0 )) = P (T ≥ 1 |pL(1)) = 1 − P (T < 1 |pL(1)) = 1 − P (T = 0|pL(1)) ⇒ P (T = 0|pL(1)) = 0. 975

Haciendo de nuevo una tabla de valores en R

[,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] p 0.0023 0.0024 0.0025 0.0026 0.0027 0.0028 0.0029 0. P(t=0|p) 0.9772 0.9763 0.9753 0.9743 0.9733 0.9724 0.9714 0.

De donde se tiene que P (T = 0| 0 .0025) = 0. 9753 ⇒ pL(1) = 0.0025. Entonces el intervalo del 95 % de confianza para p es [0. 0025 , 0 .445], que por supuesto es muy amplio, esto se debe a que se cuenta con s´olo una m.a. de tama˜no 10. ||

Ya vimos c´omo funcionan los teoremas 2 y 3, para construir intervalos de confianza, sin embargo, nos falta entender porqu´e podemos derivar un intervalo de confianza de esta forma. Nos remitiremos s´olo a explicar el Teorema 2, el caso en el que T es una v.a. continua con funci´on de distribuci´on FT (t|θ).

Primero hay que recordar c´omo definimos un intervalo de confianza para θ. Necesitamos encontrar dos estad´ısticas L(X) y U (X) tales que L(X) ≤ U (X) ∀ X = (X 1 , X 2 ,... , Xn) para las cuales

P (L(X) ≤ θ ≤ U (X)) = 1 − α (7.23) Entonces la pregunta es ¿c´omo con el Teorema 2 estamos construyendo algo como (7.23)? La primera parte de la respuesta viene dada por el siguiente

Teorema 4 Sea T una v.a. continua con funci´on de distribuci´on FT (t|θ), definamos la variable aleato- ria Y = FT (T |θ)

entonces Y es una v.a. con distribuci´on uniforme en (0, 1) (Y ∼ U (0, 1)).

Observaci´on 7 Hay que poner atenci´on, en c´omo se defini´o Y , Y = FT (T |θ). La funci´on de dis- tribuci´on est´a evaluada en T la v.a. no en t el n´umero real.

No demostraremos este teorema, sin embargo, para convencernos de manera informal de que debe ser cierto, podemos generar una m.a. de tama˜no 10, 000 de normales, gammas, exponenciales, T de Student, etc, cualquier m.a. de variables aleatorias continuas, luego evaluamos cada elemento de la muestra en su funci´on de distribuci´on y por ´ultimo realizamos el histograma de las observaciones resul- tantes. El histograma obtenido debe parecerse a la funci´on de densidad de probabilidad de una U (0, 1).

Con el Teorema 4, la notaci´on del Teorema 2, si α 1 < 1 − α 2 y T es una v.a. continua, entonces

1 − α = 1 − α 2 − α 1 (7.24) = P (α 1 ≤ U ≤ 1 − α 2 ) (7.25) = P (α 1 ≤ FT (T |θ) ≤ 1 − α 2 ) (7.26) = P (θL(T ) ≤ θ ≤ θU (T )) (7.27)

7.4. PIVOTEANDO LA FUNCI ON DE DISTRIBUCI ´ ON´ Carlos Erwin Rodr´ıguez

En donde (7.25) es la probabilidad de que una v.a. U (uniforme (0,1)) est´e entre α 1 y 1 − α 2 , (7.26) es simplemente aplicar el Teorema 4 y en (7.27) estamos “pivoteando” FT (T |θ). Si podemos llegar a (7.27), entonces la definici´on (7.23) se cumple y por lo tanto habremos construido un intervalo de confianza. El ´unico paso que no resulta totalmente claro es (7.27), que explicaremos a continuaci´on.

No podemos manejar el intervalo aleatorio [θL(T ), θU (T )], entonces utilizamos el valor observado de T , t 0 , por lo que tendr´ıamos el intervalo [θL(t 0 ), θU (t 0 )]. Entonces nuestro problema se reduce a “pivotear” FT (t 0 |θ) y obtener [θL(t 0 ), θU (t 0 )]. En el caso en el que FT (t 0 |θ) es una funci´on decreciente de θ, lo que tendr´ıamos que hacer se muestra en la figura 7.5.

θ

FT (t^0

|θ)

θL(t 0 ) θU(t 0 )

α 1

1 − α 2

Figura 7.5: Pivoteando una funci´on de distribuci´on continua

De la gr´afica anterior, podemos ver que si encontramos θL(t 0 ) y θU (t 0 ) de forma que FT (t 0 |θU (t 0 )) = α 1 y FT (t 0 |θL(t 0 )) = 1 − α 2 , entonces habremos obtenido un intervalo de confianza del (1 − α)100 %. Esto es exactamente lo que nos dice el Teorema 2, en el caso en que FT (t|θ) es una funci´on decreciente de θ. En el caso en el que FT (t|θ) es una funci´on creciente de θ las cosas cambiar´ıan, es conveniente realizar el gr´afico correspondiente y comparar el resultado con el Teorema 2.

Observaci´on 8 Si FT (t|θ) no es una funci´on creciente ni decreciente de θ, entonces tambi´en podremos utilizar los teoremas 2 y 3, sin embargo, no obtendremos un intervalo, obtendr´ıamos un conjunto de confianza, que seguramente, en t´erminos pr´acticos, ser´a dif´ıcil de interpretar y manejar.

Observaci´on 9 Los teoremas 2 y 3 no nos garantizan obtener el intervalo de confianza del (1 − α)100 % para θ ´optimo, en el sentido de que sea el que tenga la longitud m´ınima. S´olo nos garantizan un intervalo de confianza.

Con esta explicaci´on concluimos este cap´ıtulo, m´as adelante veremos c´omo construir pruebas de hip´otesis y estableceremos el fuerte v´ınculo entre pruebas de hip´otesis e intervalos de confianza. Por ahora s´olo diremos que a partir de cualquier intervalo de confianza podremos construir una prueba de hip´otesis, adem´as, el rec´ıproco tambi´en es cierto, esto lo veremos en el cap´ıtulo siguiente.