Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Estimación Estadística: Sesgo, Error y Consistencia - Prof. Lorenzo, Apuntes de Estadística

Conceptos básicos de la estimación estadística, incluyendo el sesgo, el error cuadrático medio, la consistencia y los intervalos de confianza. Se explica el concepto de sesgo y su importancia en el contexto de estimadores, así como el error cuadrático medio y cómo se utiliza para comparar diferentes estimadores. Se discute la consistencia, una propiedad deseable de los estimadores, y se presentan ejemplos de estimadores de la media poblacional y la varianza. Además, se introducen intervalos de confianza y se explica cómo se utilizan para determinar rangos de valores en los que se puede confiar que el parámetro real se encuentra.

Tipo: Apuntes

2012/2013

Subido el 21/03/2013

o_connor
o_connor 🇪🇸

3.7

(49)

38 documentos

1 / 12

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 4: Inferencia Estad´ıstica.
1 Conceptos asicos
Poblaci´on.
Par´ametro (θ) y espacio param´etrico (Θ).
Muestra y tama˜no muestral.
etodo de muestreo. El muestreo aleatorio simple (m.a.s.).
Estad´ıstico.
2 Estimaci´on Puntual
2.1 Introducci´on
Se est´a interesado en el estudio de una variable aleatoria Xcuya distribuci´on Fθdepende de
un par´ametro θΘ desconocido. La estimaci´on puntual pretende emplear una muestra para
calcular un umero que aproxime el verdadero valor de ese par´ametro.
Para ello se dispone de una muestra aleatoria simple (m.a.s.) X1, X2,...,Xnsiendo las Xi
variables aleatorias independientes y con la misma distribuci´on Fθque la variable de partida X.
Para estimar un par´ametro, utilizaremos un estimador que es una funci´on de la muestra,
ˆ
θ(X1, X2,...,Xn) y por lo tanto una variable aleatoria. Pueden existir varios estimadores para
un mismo par´ametro.
2.2 Propiedades deseables de los estimadores
2.2.1 Insesgadez
Definimos el sesgo de un estimador b
θ(X1, X2,...,Xn) de un par´ametro θcomo: S esgo(b
θ) =
E(b
θ)θ. Un estimador es insesgado o centrado para un par´ametro cuando Sesgo(b
θ) = 0
(equivalentemente E(b
θ) = θ).
Diremos que un estimador b
θes asint´oticamente insesgado para θsi
lim
n→∞ Sesgo(b
θn) = 0 o equivalentemente lim
n→∞ E(b
θn) = θ
Tenemos que se˜nalar que la insesgadez es una propiedad deseable pero no definitiva, como
podemos ver en las siguientes figuras.
1
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Estimación Estadística: Sesgo, Error y Consistencia - Prof. Lorenzo y más Apuntes en PDF de Estadística solo en Docsity!

TEMA 4: Inferencia Estad´ıstica.

1 Conceptos b´asicos

  • Poblaci´on.
  • Par´ametro (θ) y espacio param´etrico (Θ).
  • Muestra y tama˜no muestral.
  • M´etodo de muestreo. El muestreo aleatorio simple (m.a.s.).
  • Estad´ıstico.

2 Estimaci´on Puntual

2.1 Introducci´on

Se est´a interesado en el estudio de una variable aleatoria X cuya distribuci´on Fθ depende de

un par´ametro θ ∈ Θ desconocido. La estimaci´on puntual pretende emplear una muestra para

calcular un n´umero que aproxime el verdadero valor de ese par´ametro.

Para ello se dispone de una muestra aleatoria simple (m.a.s.) X 1 , X 2 ,... , Xn siendo las Xi

variables aleatorias independientes y con la misma distribuci´on Fθ que la variable de partida X.

Para estimar un par´ametro, utilizaremos un estimador que es una funci´on de la muestra,

ˆ θ(X 1 , X 2 ,... , Xn) y por lo tanto una variable aleatoria. Pueden existir varios estimadores para

un mismo par´ametro.

2.2 Propiedades deseables de los estimadores

2.2.1 Insesgadez

Definimos el sesgo de un estimador θ̂(X 1 , X 2 ,... , Xn) de un par´ametro θ como: Sesgo(̂ θ) =

E(̂ θ) − θ. Un estimador es insesgado o centrado para un par´ametro cuando Sesgo( θ̂) = 0

(equivalentemente E(

θ) = θ).

Diremos que un estimador θ̂ es asint´oticamente insesgado para θ si

lim n→∞

Sesgo(̂ θn) = 0 o equivalentemente lim n→∞

E( θ̂n) = θ

Tenemos que se˜nalar que la insesgadez es una propiedad deseable pero no definitiva, como

podemos ver en las siguientes figuras.

En este caso tenemos dos estimadores de θ = 0, θˆ 1 y θˆ 2. ¿Qu´e estimador prefieres en cada

uno de los casos?

Interesan estimadores insesgados pero no con demasiada varianza y viceversa, interesan

estimadores con baja varianza pero no demasiado sesgados.

2.2.2 Error Cuadr´atico Medio

Se llama Error Cuadr´atico Medio de θ̂ como estimador de θ a

ECM( θ̂) = E[( θ̂ − θ)

2 ] = (Sesgo(̂ θ))

2

  • V ar( θ̂)

Un estimador ̂θ 1 se dice mejor estimador que otro θ̂ 2 para estimar θ, si ECM(̂ θ 1 ) < ECM( θ̂ 2 ).

2.2.3 Consistencia

Un estimador θˆn, donde n indica el tama˜no de la muestra, es consistente cuando

lim n→∞

ECM( θ̂n) = 0

O equivalentemente expresado en t´erminos de media y varianza se pide que

lim n→∞

Sesgo(̂ θn) = lim n→∞

Var(̂ θn) = 0

2.3 Estimador de la media poblacional.

Sea X 1 ,... , Xn una m.a. de una variable aleatoria X con media E(X) = μ y varianza V ar(X) =

σ

2

. Entonces el estimador de la media μ, es la media muestral que viene dado por X =

1

n

∑n

i=1 Xi.

  1. Es insesgado: E(X) = μ.
  2. Es consistente porque Sesgo(X) = 0 y limn→∞ Var(X) = limn→∞

σ

2

n

Sea X 1 ,... , Xn una m.a.s. de una variable aleatoria X ∼ N(μ, σ), entonces

X ∼ N

μ,

σ √ n

Sea X 1 ,... , Xn una m.a.s. con tama˜no muestral n ≥ 30 de una variable aleatoria X ∼ F tal

que E(Xi) = μ y V ar(Xi) = σ

2 , (i = 1, 2 ,... , n) entonces, por el Teorema Central del L´ımite:

X ≈ N

μ,

σ √ n

  1. E(̂ p) = p y V ar(̂ p) =

p(1 − p)

n

  1. Cuando n es grande (n ≥ 30), ˆp ≈ N

p,

p(1 − p)

n

3 Intervalos de confianza

En la pr´actica es habitual adjuntar, junto a la estimaci´on puntual del par´ametro, un cierto

intervalo num´erico que mida el margen de error que, de acuerdo a las observaciones muestrales,

pueda tener dicha estimaci´on. Surge as´ı la idea de intervalo de confianza, que es un rango

de valores entre los que “posiblemente” se encuentre el verdadero valor del par´ametro θ.

Dada una muestra aleatoria X 1 ,... , Xn, se denomina Intervalo de Probabilidad para el

par´ametro θ con nivel de confianza 1 − α, a un intervalo aleatorio

θ 1 , θ̂ 2

(cuyos l´ımites

dependen de la muestra) tal que:

P

θ 1 (X 1 ,... , Xn) ≤ θ ≤ θ̂ 2 (X 1 ,... , Xn)

= 1 − α para cada θ ∈ Θ.

El concepto de “confianza” en el intervalo es muy importante. Supongamos que queremos

que el verdadero valor del par´ametro θ est´e en un intervalo con una confianza del 95%. Esto

significa que, si dispusi´eramos de todas las muestras posibles, el 95% de ellas contendr´ıan al

par´ametro, mientras que habr´a un 5% de muestras que no lo contendr´ıan. Por tanto, dentro

de todas las muestras posibles de una poblaci´on habr´a un 95% de muestras buenas y un 5% de

muestras malas. Si en vez de considerar todas las muestras posibles consideramos 100 muestras,

aproximadamente el 95% de los intervalos obtenidos contendr´an al par´ametro y aproximada-

mente el 5% restante no.

3.1 Obtenci´on de I.C. usando el M´etodo Pivotal

En general, para construir un intervalo de confianza para un par´ametro θ, se utilizar´a el llamado

m´etodo pivotal.

Fijado un nivel de confianza 1 − α, con 0 < α < 1, el procedimiento general para la

construcci´on de un intervalo de confianza al nivel 1 − α para un par´ametro de inter´es sigue los

siguientes pasos:

  1. Elecci´on del pivote. Se elige un estad´ıstico T que dependa del par´ametro que se desea

estimar y cuya distribuci´on sea conocida (´esta no dependa de θ desconocido).

  1. Planteamiento del enunciado probabil´ıstico. Una vez fijado el nivel de confianza

1 − α, se determinan constantes a y b tales que

P (a < T (X 1 ,... , Xn, θ) < b) = 1 − α

  1. Despejar θ del enunciado probabil´ıstico. Hasta llegar a un enunciado en el que el

par´ametro de inter´es figure solo en el centro de la limitaci´on

1 :

P

T

− 1 (X 1 ,... , Xn; a

′ ) < θ < T

− 1 (X 1 ,... , Xn; b

′ )

= 1 − α

(^1) Dependiendo de las operaciones aritmeticas a realizar, a′ (^) = a y b′ (^) = b o a′ (^) = b y b′ (^) = a

Dada una realizaci´on de la muestra aleatoria, es decir, {x 1 , x 2 , · · · , xn} y sustituyendo

estos datos en el intervalo probabil´ıstico construido anteriormente se obtiene el intervalo

de confianza para θ con un nivel de confianza 1 − α, es decir,

( T

− 1 (x 1 ,... , xn; a

′ ) , T

− 1 (x 1 ,... , xn; b

′ )

4 Intervalos de confianza para poblaciones normales

4.1 I.C. para la media

Poblaci´on normal

X ∼ N (μ, σ)

I.C. para la media μ

σ

2 conocida

σ

2 desconocida

4.1.1 Intervalo de confianza para la media μ de una poblaci´on normal con varianza

conocida

El estad´ıstico pivote ser´a

n

X − μ

σ

∼ N(0, 1) y el intervalo ICμ =

X ± zα 2

σ √ n

4.1.2 Intervalo de confianza para la media μ con varianza desconocida

El estad´ıstico pivote ser´a

n

X − μ

S

∼ tn− 1 y el intervalo ICμ =

X ± tn− 1 , α 2

S

n

4.2 I.C. para la varianza

El estad´ıstico pivote ser´a

(n − 1)S

2

σ^2

∼ χ

2 n− 1 y el intervalo^ ICσ^2 =

(n − 1)S

2

χ

2 n− 1 , α 2

(n − 1)S

2

χ

2 n− 1 , 1 − α 2

4.3 I.C. para la diferencia de medias basado en dos muestras para

poblaciones normales

Se disponen de dos muestras aleatorias X 1 ,... , Xn 1 e Y 1 ,... , Yn 2 de dos poblaciones normales

de inter´es X e Y , siendo el objetivo construir intervalos que permitan comparar par´ametros

poblacionales de X e Y.

Poblaciones normales

X ∼ N (μ 1 , σ 1 ), Y ∼ N (μ 2 , σ 2 ) independientes

I.C. para la diferencia μ 1 − μ 2

Varianzas conocidas σ

2 1 , σ

2 2

Var. desconocidas pero supuestas iguales

4.3.1 Intervalo de confianza para la media μ 1 − μ 2 con varianzas conocidas

Puesto que X e Y son independientes:

X ∼ N

μ 1 ,

σ 1 √ n 1

Y ∼ N

μ 2 ,

σ 2 √ n 2

⇒ X − Y ∼ N

μ 1 −^ μ 2 ,

σ

2 1

n 1

σ

2 2

n 2

5 I.C. para muestras grandes que no proceden de pobla-

ciones normales

En esta secci´on se estudiar´an otro tipo de distribuciones y se supondr´a que el tama˜no de la

muestra es suficientemente grande.

5.1 Intervalo de confianza para una proporci´on

Se desea construir un intervalo de confianza para la proporci´on p de elementos de una poblaci´on

que tienen una determinada caracter´ıstica de inter´es. Se toma una muestra aleatoria simple

X 1 ,... , Xn de elementos, anotando 1 si dicho elemento tiene la caracter´ıstica de inter´es y 0 si

carece de ella. Disponemos por tanto de una m.a.s. de una variable Ber(p). Ya vimos en su

momento quer el estimador para la proporci´on poblacional p es la proporci´on muestral

p̂ =

X 1 + · · · + Xn

n

= X

Utilizando el Teorema Central del L´ımite, se tiene que el pivote ser´a:

p̂ − p √

p (1 − p)

n

es una N (0, 1)

El intervalo de confianza para p con un nivel de confianza 1 − α es

ICp =

p ± zα 2

p (1 − p̂)

n

6 Contrastes de hip´otesis

6.1 Introducci´on. Tipos de Hip´otesis

Contrastar una hip´otesis estad´ısticamente es juzgar si cierta propiedad supuesta para la poblaci´on

es compatible con la informaci´on que nos aporta la muestra.

Sea una muestra aleatoria X 1 ,... , Xn, de una variable X ∼ Fθ, definimos:

  • Hip´otesis nula: especifica un valor hipot´etico del par´ametro, o un conjunto de posibles

valores. Se representa como: H 0 : θ ∈ Θ 0 , Θ 0 ⊂ Θ.

  • Hip´otesis alternativa: es la hip´otesis contraria a la hip´otesis nula. Se representa como:

H 1 : θ ∈ Θ 1 , Θ 1 ⊂ Θ \ Θ 0.

Una hip´otesis puede ser simple (si Θ 0 (´o Θ 1 ) contiene un s´olo punto) o compuesta (si Θ 0

(´o Θ 1 ) tiene m´as de un elemento).

6.2 Regi´on Cr´ıtica. Tipos de Error

La hip´otesis nula representa una situaci´on de partida o de referencia, una situaci´on que se asume

cierta de entrada y que no se rechazar´a salvo que haya suficiente evidencia muestral en su contra.

La regi´on cr´ıtica o regi´on de rechazo es el conjunto de valores muestrales que llevan al

rechazo de la hip´otesis nula. Es decir:

R.C. = {(X 1 , ..., Xn) tal que H 0 se rechaza}

Al resolver un contraste de hip´otesis, se pueden cometer dos tipos de error:

  • Error tipo I (eI ): rechazar H 0 cuando ´esta realmente es cierta.
  • Error tipo II (eII ): aceptar H 0 cuando ´esta realmente es falsa.

La probabilidad de cometer el error tipo I determina el llamado nivel de significaci´on del

contraste de hip´otesis:

P (eI ) = P (Rechazar H 0 / H 0 es cierta) = α

En la pr´actica se utilizan contrastes con nivel de significaci´on bajo (0.05, 0.01 ´o 0.001), lo

cual garantiza que s´olo se rechaza incorrectamente la hip´otesis nula en un bajo porcentaje de

ocasiones. Cuanto m´as peque˜no sea α, seremos m´as conservadores (nos costar´a m´as rechazar

H 0 ).

La probabilidad de cometer el error tipo II se representa por 1 − β ser´a

P (eII ) = P (Aceptar H 0 / H 0 es falsa) = 1 − β

donde

β = P (Rechazar H 0 / H 0 es falsa) θ ∈ Θ 1

es lo que denominamos funci´on potencia.

A mayor potencia, menor probabilidad de cometer el error tipo II. Lo ideal ser´ıa que los

errores tipo I y tipo II tengan probabilidad cero, pero en la pr´actica es imposible. Para un

tama˜no muestral fijo, no se pueden disminuir las dos probabilidades a la vez, si disminuye una,

aumenta la otra. Tan s´olo es posible disminuir simult´aneamente las probabilidades de ambos

errores, aumentando el tama˜no muestral, n.

De entre todos los contrastes de hip´otesis que satisfacen un nivel de significaci´on prefijado

α, se considera ´optimo aquel que tiene la mayor potencia (y por tanto, la menor probabilidad

de cometer el error tipo II).

6.3 Etapas en la resoluci´on de un contraste

  1. Especificar las hip´otesis nula H 0 y alternativa H 1.
  2. Elegir un estad´ıstico de contraste apropiado D(X 1 , ..., Xn). El estad´ıstico de contraste

es cualquier funci´on de los datos muestrales y del par´ametro especificado por H 0 , con

distribuci´on conocida cuando H 0 es cierta.

  1. Fijar el nivel de significaci´on α.
  1. Contraste bilateral: H 1 : μ 6 = μ 0. Regi´on cr´ıtica:

n

X − μ 0

σ

zα 2

  1. Contraste unilateral: H 1 : μ > μ 0. Regi´on cr´ıtica:

n

X − μ 0

σ

zα.

  1. Contraste unilateral: H 1 : μ < μ 0. Regi´on cr´ıtica:

n

X − μ 0

σ

< −zα.

Contraste de hip´otesis para la media (μ) con varianza (σ

2 ) desconocida. El es-

tad´ıstico de contraste ser´a D =

n

X − μ 0

S

∼ tn− 1 cuando H 0 es cierta (μ = μ 0 ).

  1. Contraste bilateral: H 1 : μ 6 = μ 0. Regi´on cr´ıtica:

n

X − μ 0

S

tn− 1 , α 2

  1. Contraste unilateral: H 1 : μ > μ 0. Regi´on cr´ıtica:

n

X − μ 0

S

tn− 1 ,α.

  1. Contraste unilateral: H 1 : μ < μ 0. Regi´on cr´ıtica:

n

X − μ 0

S

< −tn− 1 ,α.

Contraste de hip´otesis para la varianza (σ

2 ). El estad´ıstico de contraste ser´a D =

(n − 1)S

2

σ

2 0

nS

2 n

σ

2 0

∼ χ

2 n− 1 cuando^ H^0 es cierta (σ^ =^ σ^0 ).

  1. Contraste bilateral: H 1 : σ 6 = σ 0. Regi´on cr´ıtica:

(n − 1)S

2

σ

2 0

nS

2 n

σ

2 0

< χn− 1 , 1 − α 2

´o

(n − 1)S

2

σ

2 0

nS

2 n

σ

2 0

χn− 1 , α 2

  1. Contraste unilateral: H 1 : σ > σ 0. Regi´on cr´ıtica:

(n − 1)S

2

σ

2 0

nS

2 n

σ

2 0

χn− 1 ,α.

  1. Contraste unilateral: H 1 : σ < σ 0. Regi´on cr´ıtica:

(n − 1)S

2

σ

2 0

nS

2 n

σ

2 0

< χn− 1 , 1 −α.

6.4.2 Muestreo independiente de dos poblaciones normales X ∼ N(μ 1 , σ 1 ) e Y ∼

N(μ 2 , σ 2 )

Sea X 1 ,... , Xn 1 una m.a.s.de X e Y 1 ,... , Yn 2 una m.a.s. de Y.

Contraste de hip´otesis para la igualdad de medias (μ 1 = μ 2 ) con varianzas (σ

2 1 , σ

2 2 )

conocidas. El estad´ıstico de contraste ser´a

X − Y

σ

2 1

n 1

σ

2 2

n 2

∼ N(0, 1) cuando H 0 es cierta (μ 1 = μ 2 ).

  1. Contraste bilateral: H 1 : μ 1 6 = μ 2. Regi´on cr´ıtica:

X − Y

σ

2 1

n 1

σ

2 2

n 2

zα 2

  1. Contraste unilateral: H 1 : μ 1 > μ 2. Regi´on cr´ıtica:

X − Y

σ

2 1

n 1

σ

2 2

n 2

zα.

  1. Contraste unilateral: H 1 : μ 1 < μ 2. Regi´on cr´ıtica:

X − Y

σ

2 1

n 1

σ

2 2

n 2

< −zα.

Contraste de hip´otesis para la igualdad de medias (μ 1 = μ 2 ) con varianzas (σ

2 1 , σ

2 2 )

desconocidas e iguales. El estad´ıstico de contraste ser´a

X − Y

Sp

n 1

n 2

∼ tn 1 +n 2 − 2 cuando H 0

es cierta (μ 1 = μ 2 ).

  1. Contraste bilateral: H 1 : μ 1 6 = μ 2. Regi´on cr´ıtica:

X − Y

Sp

n 1

n 2

tn 1 +n 2 − 2 , α 2

  1. Contraste unilateral: H 1 : μ 1 > μ 2. Regi´on cr´ıtica:

X − Y

Sp

n 1

n 2

tn 1 +n 2 − 2 ,α.

  1. Contraste unilateral: H 1 : μ 1 < μ 2. Regi´on cr´ıtica:

X − Y

Sp

n 1

n 2

< −tn 1 +n 2 − 2 ,α.

Contraste de hip´otesis para la igualdad de varianzas (σ

2 1 =^ σ

2 2 ).^ El estad´ıstico de

contraste ser´a

S

2 X

S

2 Y

∼ Fn 1 − 1 ,n 2 − 1 cuando H 0 es cierta (σ

2 1 =^ σ

2 2 que es equivalente a decir que

σ

2 1

σ

2 2

  1. Contraste bilateral: H 1 : σ

2 1 6 =^ σ

2

  1. Regi´on cr´ıtica:^

S

2 X

S

2 2

< Fn 1 − 1 ,n 2 − 1 , 1 − α 2

Fn 2 − 1 ,n 1 − 1 , α 2

´o

S

2 X

S

2 2

Fn 1 − 1 ,n 2 − 1 , α 2

  1. Contraste unilateral: H 1 : σ

2 1 > σ

2

  1. Regi´on cr´ıtica:^

S

2 X

S

2 Y

Fn 1 − 1 ,n 2 − 1 ,α.

  1. Contraste unilateral: H 1 : σ

2 1 < σ

2

  1. Regi´on cr´ıtica:^

S

2 X

S

2 Y

< Fn 1 − 1 ,n 2 − 1 , 1 −α =

Fn 2 − 1 ,n 1 − 1 ,α

6.5 Muestreo en poblaciones Be(p), con n ≥ 30

Sea X 1 ,... , Xn una m.a.s. de X.

Contraste de hip´otesis para una proporci´on p. El estad´ıstico de contraste ser´a D =

pˆ − p 0 √

p 0 (1 − p 0 )

n

∼ N(0, 1) cuando H 0 es cierta (p = p 0 ).