Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Contraste de Hipótesis: Pruebas Estadísticas para Demostrar la Diferencia entre Parámetros, Apuntes de Bioestadística

En este documento se explica el proceso de contraste de hipótesis en estadística, donde se utilizan hipótesis de trabajo con parámetros estadísticos para comprobar si son ciertas o no. Se discuten los conceptos básicos, como la hipótesis nula (h0) y alternativa (h1), el uso de estadígrafos y el cálculo de n para diferentes tipos de hipótesis. Se incluyen ejemplos para ilustrar el proceso.

Tipo: Apuntes

2012/2013

Subido el 25/07/2013

judithng2
judithng2 🇪🇸

4.5

(42)

13 documentos

1 / 5

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 7. CONTRASTE DE HIPÓTESIS
En estadística, usamos hipótesis de trabajo escritas con parámetros estadísticos para
comprobar si son ciertas o no. Si trabajamos con una variable cuantitativa, se escriben
en función de μ y σ; y para cualitativas, en función de .
Por convenio, se plantean H0= hipótesis nula y H1
= hipótesis alternativa, teniendo
en cuenta los siguientes puntos:
Mi hipótesis de trabajo, lo que yo quiero demostrar, se pone en H 1. Por ejemplo:
para una cuantitativa H1: > 0,8 y para una cualitativa H1: μA < μB
La unión de ambas hipótesis, H0 U H1, cubre el espacio muestral
El igual siempre está situado en H0
H0y H1 se escriben con los parámetros poblacionales μ, σ y
Con los resultados de las muestras sacaremos conclusiones sobre cuál es el valor
correcto en la población y calcularemos probabilidades de equivocarnos. Por ello no
usaremos parámetros muestrales como media muestral ( 1E 8 A) o porcentaje muestral.
Ejemplo: Dos grupos de personas a los que hacemos alimentarse de un alimento
concreto A y estudiamos su nivel de colesterol. Uno da 1=208 y otro 2= 212.
¿Cuándo puedo decir que el colesterol ha cambiado?
Hay que resolver el intervalo de probabilidad de en individuos sanos para saber
cuánto varían las medias de las muestras de sanos. Sabiendo que la μ=200 y la σ= 25,
calculamos el intervalo y nos da entre 190’2 y 209’8. Como 1=208 está dentro de este
intervalo de margen donde se encuentran las medias de los sanos, no podemos
concluir que el alimento A cambia el colesterol. Como 2= 212, podemos concluir que
el alimento A cambia el colesterol.
Bilateral
En el contraste de hipótesis bilateral planteamos una hipótesis sobre si un valor es
distinto a otro.
Ejemplo: La fractura típica de la cabeza del fémur tarda 50 días en curarse por sí sola,
con una desviación típica de 10. Usamos un tratamiento en una muestra de personas,
que dan una media de curación de 45 días.
Nuestras hipótesis de partida son H0: μ=50, H1: μ≠ 50
Normalmente decido si mi hipótesis es correcta o que no lo es desconociendo
realmente qué es lo correcto. Para explicar el procedimiento a seguir partiré de H0 como
la hipótesis correcta y, por lo tanto, consideraré que no tengo la razón porque H1, mi
hipótesis, es incorrecta.
Pongo 50 días como μ y dibujo la curva normal, en la cual habrá valores raros α/2 a
ambos lados de μ.
Si el valor de la media de la muestra cae fuera del intervalo diré que es distinto, si cae
dentro diré que es igual. Por este motivo, se denen 2 zonas bajo la curva:
Zona no rechazo H0: cuando el valor de la media muestral sale dentro de esta
zona digo que no rechazo H0 y que mi hipótesis es incorrecta H0 es correcta.
Zona rechazo H0: cuando el valor de la media muestral sale dentro de esta
zona digo que rechazo H0 y tengo razón en mi hipótesis H1 es correcta.
El valor de α es la probabilidad de equivocarme cuando decido que tengo la razón sin
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Contraste de Hipótesis: Pruebas Estadísticas para Demostrar la Diferencia entre Parámetros y más Apuntes en PDF de Bioestadística solo en Docsity!

TEMA 7. CONTRASTE DE HIPÓTESIS

En estadística, usamos hipótesis de trabajo escritas con parámetros estadísticos para comprobar si son ciertas o no. Si trabajamos con una variable cuantitativa, se escriben en función de μ y σ; y para cualitativas, en función de ∏. Por convenio, se plantean H 0 = hipótesis nula y H 1 = hipótesis alternativa , teniendo en cuenta los siguientes puntos:

  • Mi hipótesis de trabajo, lo que yo quiero demostrar, se pone en H 1. Por ejemplo: para una cuantitativa→ H 1 : ∏ > 0,8 y para una cualitativa→ H 1 : μ (^) A < μ (^) B
  • La unión de ambas hipótesis, H 0 U H 1 , cubre el espacio muestral
  • El igual siempre está situado en H (^0)
  • H 0 y H 1 se escriben con los parámetros poblacionales μ , σ y

Con los resultados de las muestras sacaremos conclusiones sobre cuál es el valor correcto en la población y calcularemos probabilidades de equivocarnos. Por ello no usaremos parámetros muestrales como media muestral ( 1 E 8 A) o porcentaje muestral.

Ejemplo : Dos grupos de personas a los que hacemos alimentarse de un alimento concreto A y estudiamos su nivel de colesterol. Uno da Ẋ 1 =208 y otro Ẋ 2 = 212. ¿Cuándo puedo decir que el colesterol ha cambiado?

Hay que resolver el intervalo de probabilidad de Ẋ en individuos sanos para saber cuánto varían las medias de las muestras de sanos. Sabiendo que la μ=200 y la σ= 25, calculamos el intervalo y nos da entre 190’2 y 209’8. Como Ẋ 1 =208 está dentro de este intervalo de margen donde se encuentran las medias de los sanos, no podemos concluir que el alimento A cambia el colesterol. Como Ẋ 2 = 212, podemos concluir que el alimento A cambia el colesterol.

Bilateral

En el contraste de hipótesis bilateral planteamos una hipótesis sobre si un valor es distinto a otro. Ejemplo: La fractura típica de la cabeza del fémur tarda 50 días en curarse por sí sola, con una desviación típica de 10. Usamos un tratamiento en una muestra de personas, que dan una media de curación de 45 días. Nuestras hipótesis de partida son → H 0 : μ=50, H 1 : μ≠ 50

Normalmente decido si mi hipótesis es correcta o que no lo es desconociendo realmente qué es lo correcto. Para explicar el procedimiento a seguir partiré de H 0 como la hipótesis correcta y, por lo tanto, consideraré que no tengo la razón porque H (^) 1, mi hipótesis, es incorrecta.

Pongo 50 días como μ y dibujo la curva normal, en la cual habrá valores raros α/2 a ambos lados de μ.

Si el valor de la media de la muestra cae fuera del intervalo diré que es distinto, si cae dentro diré que es igual. Por este motivo, se definen 2 zonas bajo la curva:

  • Zona no rechazo H 0 : cuando el valor de la media muestral sale dentro de esta zona digo que no rechazo H 0 y que mi hipótesis es incorrecta→ H 0 es correcta.
  • Zona rechazo H 0 : cuando el valor de la media muestral sale dentro de esta zona digo que rechazo H 0 y tengo razón en mi hipótesis→ H 1 es correcta.

El valor de α es la probabilidad de equivocarme cuando decido que tengo la razón sin

tenerla. Como da la razón a que mi hipótesis es correcta, va a mi favor, por ello cuánto más pequeña, mucho mejor. Por convenio, el valor máximo que puede tener es del 5%. Tipificamos la variable para trabajar mejor y obtenemos las mismas zonas de rechazo

y no rechazo, pero el límite de la zona de confianza ahora es -z α/.

Como siempre se realiza de esta manera, a la fórmula se le llama estadígrafo ( e). Éste puede ser una Z, una T de Student, una Ji cuadrado, etc. Es lo mismo mirar medias en el gráfico rojo que estadígrafos en el gráfico rojo, pero lo haremos con estadígrafos porque es mucho más sencillo.

  • Solamente diré que rechazo cuando me salga un valor raro.

Unilateral

En el contraste de hipótesis unilateral planteamos una hipótesis sobre si un valor es menor o mayor que otro.

Siguiendo con el ejemplo del tratamiento anterior, realmente se tendría que calcular partiendo de que para que el tratamiento sea efectivo las hipótesis tienen que ser → H (^0) > 50 y H 1 : μ < 50. El máximo sigue siendo μ, en este caso 50. Obtener este valor es lo peor para mis intereses porque lo que queremos es que el tratamiento cure en menos de 50 días. Esta vez solo habrá una zona de rechazo de H 0 , que será cuando μ < 50. Esta zona no va justo des del punto 50 a la izquierda porque puede haber personas con media inferior a 50 de manera normal, ya que se trata de una población con cierta variabilidad con respecto al valor de μ. El brazo será α porque es el error que puedo cometer. Hacemos los cálculos de la misma manera que antes y obtenemos que no podemos decir que tenemos razón a no ser que la media sea inferior a 46,3. Este valor me lo dan las áreas. Volvemos a hacerlo con estadígrafos. Obtenemos que el estadígrafo ha de ser menor que -1,64 (para una α=0,05).

Concepto de la P

Usar un valor más pequeño dentro de las medias muestrales obtenidas es beneficioso para mis intereses, por eso nos conviene usar el menor. Ejemplo: si he obtenido Ẋ= 45 y Ẋ= 43, el valor 43 es mucho mejor que 45 porque demuestra de manera más evidente que éste es un tratamiento efectivo. Cuanto más pequeño sea α , mucho mejor porque se trata de un error. Para hacer que α sea menor tenemos que desplazarlo hasta el estadígrafo. En consecuencia, si disminuyo el error, desplazo la línea del límite de confianza a la izquierda, de manera que queda más pequeña la zona de rechazo de H 0. Voy a hacer el contraste de hipótesis teniendo en cuenta que el estadígrafo caiga en -2’2, cuando la Ẋ es 45. A este nuevo límite, se le llama p.

Lo que quiero es que el límite sea -2’2 en vez de -1’64 (que es lo que corresponde cuando α es 0,05). Busco en las tablas de la Z la Z (^) p =-2’2 , que corresponde al área que deja a la derecha un 2’2 (columna B) y veo que la probabilidad correspondiente es p=0’0139. Esto indica que con un resultado muestral de 45 días, la probabilidad de

habido cambios por abajo, y no por abajo y por arriba.

Como he rechazado, no calculo β sino p.

Si las n fueran idénticas, la p del bilateral sería el doble que la p del unilateral, pero en este caso n ha cambiado.

Variaciones de los parámetros estadísticos en el contraste de hipótesis

¿Qué pasa si aumentamos d? β disminuye.

¿Qué pasa si aumentamos α? β disminuye porque son dos valores que se dan

la espalda. Debajo de una línea lo que queda a un lado es α y lo que queda al

otro es β. Pero no podemos aumentar muchísimo α para disminuir β porque α

siempre tiene como máximo 5%.

¿Qué pasa si aumentamos n? β disminuye porque la curva se hace estrecha.

¿Qué pasa si aumentamos σ? β aumenta porque la curva se hace ancha.

Ejemplo 2: a) Un laboratorio farmacéutico afirma que un calmante quita la jaqueca en 14 minutos. Con el fin de rebatir esta afirmación, un laboratorio de la competencia elige al azar 12 pacientes con jaqueca y encuentra una media de 16.5 minutos y s = 7 minutos. ¿A qué conclusión llegará este último laboratorio al nivel de α = 0.05?

Queremos afirmar que el tiempo de curación es mayor que el actual, por ello es unilateral.

No sabremos el valor de β.

Como queremos comparar medias y tenemos como datos las varianzas muestrales, tendremos que usar la T de Student.

La zona de rechazo estará a la derecha porque buscamos que salga un valor mayor al de la media poblacional.

La gráfica que obtenemos es una T de student con 11 grados de libertad (12-1). Buscamos en la tabla para 11 grados de libertad un área de 0,05 porque es el error α que tenemos y obtenemos un estadígrafo límite = 1,796.

Después, calculamos el estadígrafo que corresponde al valor de la media obtenida, que es 1’24. Lo comparamos con el estadígrafo límite y podemos concluir que es menor que el estadígrafo límite. Por ello, no rechazamos H 0.

Este resultado no demuestra nada porque la conclusión no rechazo lleva asociado el valor β , que no conocemos. Si no rechazo y no conozco β no sirve de nada el estudio porque no puedo sacar conclusiones.

b) ¿Cuántos casos hubiesen hecho falta si queremos detectar un aumento de 3 minutos (α=0.05, β=0.05)?

Para calcular n usaríamos la fórmula de la T de Student pero como nunca sé del cierto el valor de T, ajusto a una Z. Esto es correcto siempre y cuando el valor que

obtengamos de n sea mayor que 30. El resultado que obtengo es que para hacer el estudio con errores pequeños necesito 59 personas.

Ejemplo 3: a) Se sabe que el 90% de los niños de 4 años no muestran indicios de caries dental.Se quiere estudiar el efecto de un nuevo dentífrico que afirman protege contra la caries. ¿Cuántos niños hemos de estudiar si queremos detectar un aumento de un 1%?. Es unilateral porque buscamos un aumento de 1%. Usaremos ∏ porque se trata de un estudio de porcentajes de personas, es decir, de una variable cualitativa. La zona de rechazo estará a la derecha porque buscamos un resultado mayor que 0,9. La n se busca en la fórmula de porcentajes. ∏ 1 será el nuevo valor máximo a detectar y se calcula: ∏ 0 más la diferencia a detectar.

En el caso de ser bilateral , ∏ 1 podría ser un nuevo máximo por encima o por debajo. Tendríamos que sumar a ∏ 0 la diferencia a detectar o restársela. Ante esta situación, usaremos el resultado que sea peor porque tenga la curva más ancha, que será el más cercano a 0,5.

b) Hacemos el estudio con ese número de casos y encontramos un porcentaje del 92%. ¿Es el dentífrico realmente eficaz? ¿Cuál es la probabilidad de equivocarnos? Si hago la n muy grande la curva se hace estrecha y como el porcentaje muestral no varía mucho del poblacional, obtendremos una p muy pequeña. Un valor pequeño de p no significa que el dentífrico sea muy bueno sino que es un poco más bueno que el otro con el cual se compara. En otras palabras, p no mide la calidad de un medicamento sino la probabilidad de equivocarme al decir que tengo razón. Lo que realmente mide la calidad de un medicamento es la probabilidad de los casos a favor en relación con los casos en contra.