





Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
En este documento, se aborda el tema de la estimación mediante intervalos de confianza, un conjunto de técnicas utilizadas en la inferencia estadística. Se define un intervalo de confianza y el método de la cantidad pivotal para obtenerlo. Además, se presentan distribuciones asociadas a la normal, como la χ2 de pearson, la t de student y la f de fisher-snedecor, que son fundamentales en los intervalos de confianza y contrastes de hipótesis.
Tipo: Apuntes
1 / 9
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!






Juli´an de la Horra Departamento de Matem´aticas U.A.M.
En este cap´ıtulo, vamos a abordar la estimaci´on mediante Intervalos de Con- fianza, que es otro de los tres grandes conjuntos de t´ecnicas que se utilizan en la Inferencia Estad´ıstica. La situaci´on general que vamos a considerar es la misma que en el cap´ıtulo anterior: Disponemos de una muestra aleatoria (X 1 , ..., Xn) de una caracter´ıstica X de una poblaci´on. Pensamos que esta caracter´ıstica puede ser adecuadamente modelizada mediante un modelo de probabilidad con funci´on de masa Pθ(x) (en el caso discreto) o con funci´on de densidad fθ(x) (en el caso continuo). En cualquiera de los casos, lo ´unico que nos falta por conocer es el valor del par´ametro θ ∈ Θ, que es desconocido. Lo que tratamos de hacer en este cap´ıtulo es encontrar intervalos que sirvan para estimar este par´ametro desconocido, fijando el nivel de confianza que queremos que tenga dicha estimaci´on. En primer lugar, se plantear´an dos ejemplos sencillos que servir´an como motivaci´on.
Ejemplo 1.- En los ejercicios de c´alculo de probabilidades, siempre se suele hablar de monedas equilibradas pero, naturalmente, no todas lo son. Nos gustar´ıa conocer aproximadamente (estimar) la probabilidad de cara de una determinada moneda, y llamamos p = P (Cara). Necesitamos datos, para lo cual lanzamos la moneda, por ejemplo, 100 veces, y anotamos los resultados. Supongamos que obtenemos 55 caras y 45 cruces. Desde un punto de vista formal, las caras y las cruces pueden ser codi- ficadas mediante unos y ceros, de modo que tenemos una muestra aleatoria (X 1 , ..., X 100 ) de
{ 1 (si sale cara) con probabilidad p 0 (si sale cruz) con probabilidad 1 − p
y, por tanto, X puede ser modelizada mediante un modelo de Bernoulli con par´ametro p desoconocido. Podemos estimar la probabilidad de cara, p, mediante el estimador de m´axima verosimilitud, que en este caso es:
pˆ = ¯x =
N´umero de caras obtenidas N´umero de lanzamientos
Ahora bien, cuando decimos que estimamos que p es 0,55, no estamos afirmando que p valga exactamente 0,55; lo que realmente queremos decir es que p valdr´a, aproximadamente, 0,55. Esto de aproximadamente lo podemos concretar en diferentes intervalos: (0,54 ; 0,56), (0,50 ; 0,60), ... Para decidir con qu´e intervalo nos quedamos, necesitamos una metodolog´ıa general que nos permita resolver este tipo de problemas de un modo sis- tem´atico y lo m´as objetivo posible.
Ejemplo 2.- En una f´abrica, se est´a ensayando una nueva fibra sint´etica, y se quiere conocer aproximadamente (estimar) cu´al es la resistencia media a la rotura de las cuerdas fabricadas con esta nueva fibra. Llamaremos μ al valor de esta resistencia media que se quiere estimar. Necesitamos datos, para lo cual medimos la resistencia de, por ejemplo, 100 cuerdas, y anotamos los resultados. Supongamos que obtenemos una resistencia media muestral de 31 unidades. Desde un punto de vista formal, lo que tenemos es una muestra aleatoria (X 1 , ..., X 100 ) de la caracter´ıstica X = “Resistencia a la rotura”, que puede ser modelizada mediante una distribuci´on N (μ; σ), con par´ametros μ y σ desconocidos. Podemos estimar la resistencia media de las cuerdas, μ, mediante el esti- mador de m´axima verosimilitud, que en este caso es:
μˆ = ¯x = 31
Ahora bien, cuando decimos que estimamos que μ es 31, no estamos afirmando que μ valga exactamente 31; lo que realmente queremos decir es que μ valdr´a, aproximadamente, 31. Esto de aproximadamente lo podemos concretar en diferentes intervalos: (30 ; 32), (28 ; 34), ... Para decidir con qu´e intervalo nos quedamos, necesitamos una metodolog´ıa general que nos permita resolver este tipo de problemas de un modo sis- tem´atico y lo m´as objetivo posible.
En primer lugar, vamos a definir lo que entenderemos por un intervalo de confianza para estimar un par´ametro:
Definici´on.- Sea (X 1 ,... , Xn) una muestra aleatoria de una caracter´ıstica X de una poblaci´on con funci´on de masa Pθ(x) (caso discreto), o con funci´on de densidad fθ(x) (caso continuo), donde θ = (θ 1 , ..., θk) es desconocido.
La distribuci´on χ^2 n s´olo toma valores positivos.
Definici´on.- Sean Y, X 1 ,... , Xn variables aleatorias independientes con distribuci´on N (0; 1). La distribuci´on t de Student con n grados de libertad (abreviadamente tn) es la distribuci´on de la variable aleatoria:
Y √ 1 n
∑n i=1 X 2 i
esquem´aticamente: N √^ (0; 1) 1 n χ
2 n
La distribuci´on tn es sim´etrica con respecto al cero.
Definici´on.- Sean X 1 ,... , Xm, Y 1 ,... , Yn variables aleatorias independi- entes con distribuci´on N (0; 1). La distribuci´on F de Fisher-Snedecor con m y n grados de libertad (abreviadamente Fm;n) es la distribuci´on de la variable aleatoria: (^1) m
∑m i=1 X 2 i 1 n
∑n i=1 Y^ 2 i
( esquem´aticamente:
1 m χ
2 m 1 n χ
2 n
)
La distribuci´on Fm;n s´olo toma valores positivos.
En esta secci´on, abordamos la cuesti´on de c´omo construir intervalos de con- fianza de un modo sistem´atico y lo m´as objetivo posible. El m´etodo ha- bitualmente utilizado es el m´etodo de la cantidad pivotal. En primer lugar, definimos lo que se entiende por una cantidad pivotal:
Definici´on.- Sea (X 1 ,... , Xn) una muestra aleatoria de una caracter´ıstica X de una poblaci´on con funci´on de masa Pθ(x) (caso discreto), o con funci´on de densidad fθ(x) (caso continuo), donde θ = (θ 1 , ..., θk) es desconocido. Una cantidad pivotal para estimar el par´ametro θi es una funci´on
C(X 1 ,... , Xn; θi)
tal que su distribuci´on es fija (no depende de ning´un par´ametro desconocido).
De manera esquem´atica, los pasos que hay que dar para obtener un inter- valo de confianza mediante el m´etodo de la cantidad pivotal son los siguientes:
Obviamente, la descripci´on que se acaba de dar del m´etodo es muy ab- stracta. Por este motivo, es muy conveniente aplicar el m´etodo a alg´un caso concreto que ayude a entender lo que hacemos en general.
Caso 1.- Consideramos una muestra aleatoria (X 1 , ..., Xn) de una carac- ter´ıstica X ∼ N (μ; σ), donde la media μ es desconocida, pero supondremos (por sencillez) que σ es conocida. Queremos un intervalo de confianza para estimar μ. Aplicamos el m´etodo de la cantidad pivotal:
X¯ ∼ N (μ; σ/√n) ⇒
X¯ − μ σ/
n
Por tanto: C(X 1 , ..., Xn; μ) =
X¯ − μ σ/
n
es una cantidad pivotal para estimar μ.
{ −zα/ 2 <
X¯ − μ σ/
n
< zα/ 2
} = 1 − α
Pero, en este caso, nos encontramos con el problema de que
X¯ − μ σ/
n
no puede ser una cantidad pivotal para estimar μ, ya que depende de σ que ahora es desconocida. Este problema se resuelve sustituyendo σ por una estimaci´on: la cuasi-desviaci´on t´ıpica muestral, S. De este modo, tenemos que:
C(X 1 , ..., Xn; μ) =
X¯ − μ S/
n
∼ tn− 1
es una cantidad pivotal para estimar μ. Obs´ervese que la nueva cantidad pivotal sigue una distribuci´on tn− 1 en vez de seguir una distribuci´on N (0; 1).
{ −tn−1;α/ 2 <
X¯ − μ S/
n
< tn−1;α/ 2
} = 1 − α
μ < X¯ + tn−1;α/ 2
n
μ > X¯ − tn−1;α/ 2
n
El intervalo de confianza que hemos obtenido es:
IC 1 −α(μ) =
( X^ ¯ − tn−1;α/ 2 √^ S n
; X¯ + tn−1;α/ 2
n
( X^ ¯ ± tn−1;α/ 2 √^ S n
)
Observemos que, nuevamente, el intervalo de confianza est´a centrado en X¯, lo cual sigue siendo muy natural. La cantidad que sumamos y restamos a la media muestral para obtener el intervalo de confianza sigue recibiendo el nombre de error en la estimaci´on, y ahora es de la forma:
Error en la estimaci´on = tn−1;α/ 2
n
Este intervalo sigue teniendo el mismo tipo de propiedades que ten´ıa el obtenido en el Caso 1.
Aplicando de manera sistem´atica este m´etodo de la cantidad pivotal, ir´ıamos obteniendo los intervalos de confianza que se utilizan en las situa- ciones m´as habituales:
Una muestra aleatoria de una caracter´ıstica con distribuci´on Normal, Bernoulli, Poisson,... Dos muestras aleatorias independientes de caracter´ısticas con distribuci´on Normal, Bernoulli,...
La mayor´ıa de los libros dedicados a la Estad´ıstica Aplicada incluyen un listado de los intervalos de confianza m´as frecuentemente utilizados.
En esta ´ultima secci´on, abordamos una cuesti´on pr´actica muy interesante: ¿Cu´antos datos ser´an necesarios para estimar un par´ametro (con un nivel de confianza 1 − α), de modo que el error en la estimaci´on quede por debajo de una cierta cantidad, E, previamente fijada? Vamos a ver la respuesta a esta pregunta en los casos analizados en la secci´on anterior:
Caso 1.- Consideramos una muestra aleatoria (X 1 , ..., Xn) de una carac- ter´ıstica X ∼ N (μ; σ), donde σ es conocida. Queremos obtener un intervalo de confianza para estimar μ, con un nivel de confianza 1 − α, y queremos saber cu´antos datos ser´ıan necesarios para estimar μ, de modo que el error en la estimaci´on quede por debajo de una cierta cantidad, E, previamente fijada. El procedimiento es sencillo:
Error en la estimaci´on = zα/ 2
σ √ n
Despejamos n y obtenemos: n >
(zα/ 2 σ)^2 E^2
Caso 2.- Consideramos una muestra aleatoria (X 1 , ..., Xn) de una carac- ter´ıstica X ∼ N (μ; σ), donde tanto μ como σ son desconocidos. Queremos obtener un intervalo de confianza para estimar μ, con un nivel de confianza 1 − α, y queremos saber cu´antos datos ser´ıan necesarios para estimar μ, de