



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
En este documento se explica el proceso de contraste de hipótesis en estadística, donde se utilizan hipótesis de trabajo con parámetros estadísticos para comprobar si son ciertas o no. Se discuten los conceptos básicos, como la hipótesis nula (h0) y alternativa (h1), el uso de estadígrafos y el cálculo de n para diferentes tipos de hipótesis. Se incluyen ejemplos para ilustrar el proceso.
Tipo: Apuntes
1 / 5
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




En estadística, usamos hipótesis de trabajo escritas con parámetros estadísticos para comprobar si son ciertas o no. Si trabajamos con una variable cuantitativa, se escriben en función de μ y σ; y para cualitativas, en función de ∏. Por convenio, se plantean H 0 = hipótesis nula y H 1 = hipótesis alternativa , teniendo en cuenta los siguientes puntos:
Con los resultados de las muestras sacaremos conclusiones sobre cuál es el valor correcto en la población y calcularemos probabilidades de equivocarnos. Por ello no usaremos parámetros muestrales como media muestral ( 1 E 8 A) o porcentaje muestral.
Ejemplo : Dos grupos de personas a los que hacemos alimentarse de un alimento concreto A y estudiamos su nivel de colesterol. Uno da Ẋ 1 =208 y otro Ẋ 2 = 212. ¿Cuándo puedo decir que el colesterol ha cambiado?
Hay que resolver el intervalo de probabilidad de Ẋ en individuos sanos para saber cuánto varían las medias de las muestras de sanos. Sabiendo que la μ=200 y la σ= 25, calculamos el intervalo y nos da entre 190’2 y 209’8. Como Ẋ 1 =208 está dentro de este intervalo de margen donde se encuentran las medias de los sanos, no podemos concluir que el alimento A cambia el colesterol. Como Ẋ 2 = 212, podemos concluir que el alimento A cambia el colesterol.
En el contraste de hipótesis bilateral planteamos una hipótesis sobre si un valor es distinto a otro. Ejemplo: La fractura típica de la cabeza del fémur tarda 50 días en curarse por sí sola, con una desviación típica de 10. Usamos un tratamiento en una muestra de personas, que dan una media de curación de 45 días. Nuestras hipótesis de partida son → H 0 : μ=50, H 1 : μ≠ 50
Normalmente decido si mi hipótesis es correcta o que no lo es desconociendo realmente qué es lo correcto. Para explicar el procedimiento a seguir partiré de H 0 como la hipótesis correcta y, por lo tanto, consideraré que no tengo la razón porque H (^) 1, mi hipótesis, es incorrecta.
Pongo 50 días como μ y dibujo la curva normal, en la cual habrá valores raros α/2 a ambos lados de μ.
Si el valor de la media de la muestra cae fuera del intervalo diré que es distinto, si cae dentro diré que es igual. Por este motivo, se definen 2 zonas bajo la curva:
El valor de α es la probabilidad de equivocarme cuando decido que tengo la razón sin
tenerla. Como da la razón a que mi hipótesis es correcta, va a mi favor, por ello cuánto más pequeña, mucho mejor. Por convenio, el valor máximo que puede tener es del 5%. Tipificamos la variable para trabajar mejor y obtenemos las mismas zonas de rechazo
Como siempre se realiza de esta manera, a la fórmula se le llama estadígrafo ( e). Éste puede ser una Z, una T de Student, una Ji cuadrado, etc. Es lo mismo mirar medias en el gráfico rojo que estadígrafos en el gráfico rojo, pero lo haremos con estadígrafos porque es mucho más sencillo.
En el contraste de hipótesis unilateral planteamos una hipótesis sobre si un valor es menor o mayor que otro.
Siguiendo con el ejemplo del tratamiento anterior, realmente se tendría que calcular partiendo de que para que el tratamiento sea efectivo las hipótesis tienen que ser → H (^0) > 50 y H 1 : μ < 50. El máximo sigue siendo μ, en este caso 50. Obtener este valor es lo peor para mis intereses porque lo que queremos es que el tratamiento cure en menos de 50 días. Esta vez solo habrá una zona de rechazo de H 0 , que será cuando μ < 50. Esta zona no va justo des del punto 50 a la izquierda porque puede haber personas con media inferior a 50 de manera normal, ya que se trata de una población con cierta variabilidad con respecto al valor de μ. El brazo será α porque es el error que puedo cometer. Hacemos los cálculos de la misma manera que antes y obtenemos que no podemos decir que tenemos razón a no ser que la media sea inferior a 46,3. Este valor me lo dan las áreas. Volvemos a hacerlo con estadígrafos. Obtenemos que el estadígrafo ha de ser menor que -1,64 (para una α=0,05).
Usar un valor más pequeño dentro de las medias muestrales obtenidas es beneficioso para mis intereses, por eso nos conviene usar el menor. Ejemplo: si he obtenido Ẋ= 45 y Ẋ= 43, el valor 43 es mucho mejor que 45 porque demuestra de manera más evidente que éste es un tratamiento efectivo. Cuanto más pequeño sea α , mucho mejor porque se trata de un error. Para hacer que α sea menor tenemos que desplazarlo hasta el estadígrafo. En consecuencia, si disminuyo el error, desplazo la línea del límite de confianza a la izquierda, de manera que queda más pequeña la zona de rechazo de H 0. Voy a hacer el contraste de hipótesis teniendo en cuenta que el estadígrafo caiga en -2’2, cuando la Ẋ es 45. A este nuevo límite, se le llama p.
Lo que quiero es que el límite sea -2’2 en vez de -1’64 (que es lo que corresponde cuando α es 0,05). Busco en las tablas de la Z la Z (^) p =-2’2 , que corresponde al área que deja a la derecha un 2’2 (columna B) y veo que la probabilidad correspondiente es p=0’0139. Esto indica que con un resultado muestral de 45 días, la probabilidad de
habido cambios por abajo, y no por abajo y por arriba.
Como he rechazado, no calculo β sino p.
Si las n fueran idénticas, la p del bilateral sería el doble que la p del unilateral, pero en este caso n ha cambiado.
Ejemplo 2: a) Un laboratorio farmacéutico afirma que un calmante quita la jaqueca en 14 minutos. Con el fin de rebatir esta afirmación, un laboratorio de la competencia elige al azar 12 pacientes con jaqueca y encuentra una media de 16.5 minutos y s = 7 minutos. ¿A qué conclusión llegará este último laboratorio al nivel de α = 0.05?
Queremos afirmar que el tiempo de curación es mayor que el actual, por ello es unilateral.
No sabremos el valor de β.
Como queremos comparar medias y tenemos como datos las varianzas muestrales, tendremos que usar la T de Student.
La zona de rechazo estará a la derecha porque buscamos que salga un valor mayor al de la media poblacional.
La gráfica que obtenemos es una T de student con 11 grados de libertad (12-1). Buscamos en la tabla para 11 grados de libertad un área de 0,05 porque es el error α que tenemos y obtenemos un estadígrafo límite = 1,796.
Después, calculamos el estadígrafo que corresponde al valor de la media obtenida, que es 1’24. Lo comparamos con el estadígrafo límite y podemos concluir que es menor que el estadígrafo límite. Por ello, no rechazamos H 0.
Este resultado no demuestra nada porque la conclusión no rechazo lleva asociado el valor β , que no conocemos. Si no rechazo y no conozco β no sirve de nada el estudio porque no puedo sacar conclusiones.
b) ¿Cuántos casos hubiesen hecho falta si queremos detectar un aumento de 3 minutos (α=0.05, β=0.05)?
Para calcular n usaríamos la fórmula de la T de Student pero como nunca sé del cierto el valor de T, ajusto a una Z. Esto es correcto siempre y cuando el valor que
obtengamos de n sea mayor que 30. El resultado que obtengo es que para hacer el estudio con errores pequeños necesito 59 personas.
Ejemplo 3: a) Se sabe que el 90% de los niños de 4 años no muestran indicios de caries dental.Se quiere estudiar el efecto de un nuevo dentífrico que afirman protege contra la caries. ¿Cuántos niños hemos de estudiar si queremos detectar un aumento de un 1%?. Es unilateral porque buscamos un aumento de 1%. Usaremos ∏ porque se trata de un estudio de porcentajes de personas, es decir, de una variable cualitativa. La zona de rechazo estará a la derecha porque buscamos un resultado mayor que 0,9. La n se busca en la fórmula de porcentajes. ∏ 1 será el nuevo valor máximo a detectar y se calcula: ∏ 0 más la diferencia a detectar.
En el caso de ser bilateral , ∏ 1 podría ser un nuevo máximo por encima o por debajo. Tendríamos que sumar a ∏ 0 la diferencia a detectar o restársela. Ante esta situación, usaremos el resultado que sea peor porque tenga la curva más ancha, que será el más cercano a 0,5.
b) Hacemos el estudio con ese número de casos y encontramos un porcentaje del 92%. ¿Es el dentífrico realmente eficaz? ¿Cuál es la probabilidad de equivocarnos? Si hago la n muy grande la curva se hace estrecha y como el porcentaje muestral no varía mucho del poblacional, obtendremos una p muy pequeña. Un valor pequeño de p no significa que el dentífrico sea muy bueno sino que es un poco más bueno que el otro con el cual se compara. En otras palabras, p no mide la calidad de un medicamento sino la probabilidad de equivocarme al decir que tengo razón. Lo que realmente mide la calidad de un medicamento es la probabilidad de los casos a favor en relación con los casos en contra.