Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Inferencia paramétrica, Apuntes de Estadística

Apuntes de inferencia pramétrica

Tipo: Apuntes

2017/2018

Subido el 24/08/2018

isaias-davila-delgad
isaias-davila-delgad 🇪🇸

4

(1)

1 documento

1 / 10

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
INFERENCIAPARAMÉTRICA
Tema 5.Estimación
Tema 6.Contraste
InferenciaEstadísticaParamétrica
•Se introducen algunas técnicas estadística útiles en inferencia estadística, esto
es, traspaso de la información suministrada por la muestra a la población de
interés. Por estar en inferencia paramétrica se asumirá que la variable de
interés sigue una distribución normal.
•Es primordial tener claro que la utilización de todas estas técnicas están
asumiendo que el diseño del experimento ha sido el adecuado (tamaños
muestrales,encuestas,tomadelainformación,etc.),yportanto,lamuestra
debería ser representativa de la población.
•Distinguiremosdospartes dependiendodelobjetivodelestudio:
Estimación (Interésenlapredicciónsobrevaloresdelapoblación).Tem a5.
Puntual
Intervalos
ContrasteótestdeHipótesis (Interésporaceptarorechazarhipótesis
planteadassobreparámetrosovariablesdelapoblación).Tem a6.
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga Inferencia paramétrica y más Apuntes en PDF de Estadística solo en Docsity!

INFERENCIA PARAMÉTRICA

Tema 5. Estimación

Tema 6. Contraste

Inferencia Estadística Paramétrica

•Se introducen algunas técnicas estadística útiles en inferencia estadística, esto

es, traspaso de la información suministrada por la muestra a la población de

interés. Por estar en inferencia paramétrica se asumirá que la variable de

interés sigue una distribución normal.

•Es primordial tener claro que la utilización de todas estas técnicas están

asumiendo que el diseño del experimento ha sido el adecuado (tamaños

muestrales, encuestas, toma de la información, etc.), y por tanto, la muestra

debería ser representativa de la población.

•Distinguiremos dos partes dependiendo del objetivo del estudio:

 Estimación (Interés en la predicción sobre valores de la población). Tema 5.

 Puntual

 Intervalos

 Contraste ó test de Hipótesis (Interés por aceptar o rechazar hipótesis

planteadas sobre parámetros o variables de la población). Tema 6.

Estimación paramétrica

Conceptos

Se denomina estimador de un parámetro  ( , , p , ) generalmente

poblacional, a la función o intervalo calculado a partir de la muestra que intenta

obtener una predicción de dicho parámetro ݏ ,̅ݔ ଶ^ , ݌̂, …. El valor que se obtiene

al sustituir en el estimador los valores de una muestra particular, se denomina

estimación.

Cuando el estimador es utilizado para obtener un valor aproximado único del

parámetro poblacional diremos que se trata de una estimación puntual, y

cuando se obtiene un intervalo de precisión de dicha estimación puntual

hablaremos de estimación por intervalos.

Ej. Un estimador para el parámetro poblacional  = , puede ser definido por ߠ෠ ൌ ߤ̂ ൌ ∑^ ௫೔

೙೔సభ ௡ ത ܺൌ

Un estimador, al ser función de los valores muestrales, será también una variable aleatoria (tendrá su media y su varianza). En general, se le exigen las siguientes propiedades:

  • Ser insesgado o centrado, es decir, ߠ ܧመ^ ߠ ൌ. Ej. ത ܺܧ^ ߤ ൌ
  • Mínima varianza (estimador eficiente).

Nota: los estimadores que comentaremos cumplen ambas propiedades

Estimación: Estimadores puntuales

1. Distribución binomial , Bi( n , p ).

El estimador puntual de p es:

Además verifica que:

2. Distribución de Poisson , ࣪ሻߣሺ.

El estimador puntual de  es:

Además verifica que:

Estimación por intervalos: Aplicaciones

Utilizaremos tablas donde se suministran los distintos intervalos dependiendo de

las características distribucionales de las variables empleadas. A continuación se

comentan algunos casos particulares:

I.01 Intervalo de confianza para la media  de una población normal con 

conocida.

Sabemos que

y deseamos encontrar un intervalo ( a 1 , a 2 ) tal que ܽܲ ଵ ܽ൏ ߤ ൏ ଶ ൌ 1 െ ߙ

entonces:

Lo que implica que el intervalo buscado sea

I.02 Intervalo de confianza para la media  de una población normal con  desconocida.

Sabemos que

y deseamos encontrar un intervalo ( a 1 , a 2 ) tal que entonces:

Lo que implica que el intervalo buscado sea

I.04 Intervalo de confianza para la varianza ^2 de una población normal con media desconocida. Sabemos que y deseamos encontrar un intervalo ( a 1 , a 2 ) tal que entonces:

Lo que implica que el intervalo buscado sea

Estimación por intervalos: Aplicaciones

Estimación por intervalos: Aplicaciones

I.06 ó I.07. Intervalos de confianza para la diferencia de medias  1 ‐  2 de dos poblaciones

normales. Distinguiremos dos situaciones: con varianzas desconocidas e iguales ( I.06 ) y con varianzas desconocidas y distintas ( I.07 ).

Ambos intervalos se construyen bajo la distribución t‐student. Para decidir si utilizamos uno o el otro inicialmente realizaremos el intervalo para la razón de varianzas.

Sabemos que:

y deseamos encontrar un intervalo ( a 1 , a 2 ) tal que entonces:

Es interesante comprobar si el valor 1 pertenece a dicho intervalo (con lo que sería razonable considerar la posibilidad de que ).

Una vez seleccionado el I.06 ó I.07 , las únicas diferencias están en los grados de libertad de la t-student y en la estimación conjunta de las varianzas en el caso del I..

Será de interés comprobar si el 0 está en estos intervalos pues indicaría que es razonable considerar que no existen diferencias.

NOTA:

Estimación por intervalos: Aplicaciones

Ej.:( Prob. 1) La duración de una determinada componente electrónica sigue una distribución normal. Los resultados de una muestra aleatoria de esta clase de componentes son: 1200, 1350, 1275, 890, 1125, 1520, 1100 horas. a) Estima la duración media y la varianza. b) Halla los correspondientes intervalos de confianza al 90%.

a) ߤ̂ ൌ ݔ̅ ൌ 1208,57 horas; ߪ෢ ଶݏ ൌ ଶ^ ൌ 40289,29 horas^2 ; ݏൌ 200,72 horas; ݊ൌ 7.

b) Intervalo de confianza (I.C.) para ߤ (I.02)

1 െ ߙൌ 0,90 ⟹ ߙൌ 0,10 ⟹ ߙ 2⁄ ൌ 0,05 ݐ௡ିଵ,ఈ ଶ⁄ ݐ ൌ଺;଴,଴ହ ൌ 1,

Intervalo de confianza (I.C.) para ߪ ଶ^ (I.04)

߯௡ିଵ;ఈ ଶଶ^ ⁄ ߯ൌ (^) ଺;଴,଴ହଶ^ ൌ 12,5916߯ (^) ௡ିଵ;ଵିఈ ଶ ⁄ଶ^ ߯ൌ (^) ଺;଴,ଽହଶ^ ൌ 1,

ൌ ܫ

௡ିଵ;ఈ ଶ⁄

௡ିଵ;ଵିఈ ଶ ⁄

ଶ ൌ^ 19198,17; 147814,

Inferencia Estadística: Contraste

Puesto que nosotros tratamos de aceptar o rechazar una hipótesis sobre la

población a partir de datos muestrales (test), podemos encontrarnos con las

siguientes situaciones:

Población

Es cierta H 0 Es cierta H 1

Muestra (test )

Se “acepta” H 0

Nivel de confianza (1‐)

Error tipo II  Se rechaza H 0 (acepta H 1 )

Error tipo I 

Potencia del test (1‐)

Contraste: Error tipo I

También se le conoce como error  ó nivel de significación. Este error suele venir fijado

por el propio experimentador (antes de comenzar la experimentación) y en general es

pequeño (  =0.1, 0.05 y 0.01), pues representa la probabilidad de que se rechace la

hipótesis nula, H 0 , cuando es realmente cierta.

Ej.:

100

H 0 es cierta (  = 100)

1- 

R. Crítica R. Aceptación R. Crítica

La región crítica (R.C.),

  • Estadístico de contraste (E.C.): función de la muestra (supuesta cierta H 0 ) con la que se evaluará la aceptación o rechazo de la hipótesis nula. Ej.:
  • Región de aceptación: conjunto de valores del estadístico de contraste que llevan a no rechazar H 0.
  • Región Crítica o de rechazo ( R.C. ): conjunto de valores del estadístico de contraste que nos llevan a rechazar H 0. Diciendo en este caso que el test es significativo.

Dependiendo de si la región crítica R está formada por uno o dos intervalos se clasifican en:

  • Test unilaterales (una cola): la región crítica está formada por un solo conjunto de puntos, y está relacionado con hipótesis H 0 de la forma  ó . Ej.:

•Test bilaterales (dos colas): la región crítica está formada por dos conjuntos de puntos, y está relacionada con hipótesis H 0 de igualdad. Ej.:

Contraste: Tipos de contrastes

La probabilidad de cometer error tipo II se denota por . Representa el error que se

comete al aceptar H 0 cuando es cierta la hipótesis H 1 (siendo 1‐  la potencia del test ). Este

error  debería estar fijado por el experimentador al iniciar el estudio (  = 0.1, 0.2 ó 0.25),

puesto que influye en el tamaño muestral a considerar. Cuando no se realiza un estudio del tamaño muestral previamente (que desgraciadamente suele ser lo habitual), si el test nos lleva a concluir H 0 (El estadístico de contraste no ∉ a R ) sólo podremos indicar “ que NO existen evidencias para concluir la hipótesis H 1 ” no implicando esto que estemos demostrando que lo que es cierto es H 0.

Contraste: Error tipo II y potencia

100

H 0 es cierta (  = 100)

1- 

R. Aceptación R. Crítica

H 1 es cierta (  = 110)

110

1- 

Nota: a partir de esta igualdad se podrá obtener una fórmula de tamaño muestral.

Contraste: P-valor

Es el valor que utilizan los paquetes estadísticos a la hora de describir el resultado de un contraste. Representa la probabilidad de que la aceptación de H 1 sea debida al azar. Es por ello, que cuanto más pequeña sea esta probabilidad, más certeza tendremos de que es cierta la hipótesis H 1. También se puede definir como el menor error tipo I necesario para que un resultado sea significativo.

A la hora de su cálculo tendremos que realizar los siguientes pasos

  • Obtener el área o probabilidad que deja el E.C. hacia la región crítica.
  • Si el contraste es bilateral multiplicar ese área por 2.
  • Finalmente comparar el área (p‐valor) dada con el valor de  fijado tal como sigue:

0 E.C.

p-valor Si p‐valor > , No aceptamos H 1 y Si p‐valor ൑ , aceptamos H 1