Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Contraste de hipótesis y toma de decisiones en la investigación - Prof. Segura Fragoso, Apuntes de Estadística

El contraste de hipótesis es una herramienta estadística utilizada en la investigación para tomar decisiones informadas. Se compara una hipótesis nula con una hipótesis alternativa y, en base a los datos observados, se decide aceptar o rechazar la hipótesis nula. El valor p, una medida de la disconformidad de los datos con la hipótesis nula, ayuda en esta decisión. Existen diferentes tipos de pruebas de contraste de hipótesis, dependiendo del tipo de variables que se estén comparando.

Tipo: Apuntes

2012/2013

Subido el 29/11/2013

riensita
riensita 🇪🇸

4.4

(96)

80 documentos

1 / 16

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
61
APUNTES
DE
BIOESTADÍSTICA APLICADA
EN
CIENCIAS DE LA SALUD
Capítulo 7
Contraste de Hipótesis. Aspectos generales.
Antonio Segura Fragoso
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff

Vista previa parcial del texto

¡Descarga Contraste de hipótesis y toma de decisiones en la investigación - Prof. Segura Fragoso y más Apuntes en PDF de Estadística solo en Docsity!

APUNTES

DE

BIOESTADÍSTICA APLICADA

EN

CIENCIAS DE LA SALUD

Capítulo 7

Contraste de Hipótesis. Aspectos generales.

Antonio Segura Fragoso

CAPÍTULO 7

CONTRASTE DE HIPÓTESIS

Las Hipótesis en investigación en Ciencias de la Salud

En Ciencias de la Salud, se realizan diversos tipos de estudios de investigación de tipo descriptivo o bien de tipo analítico observacional o experimental. En la figura siguiente se esquematiza un estudio experimental (ECA = ensayo controlado aleatorizado), que stá diseñado para contrastar la hipótesis de que una terapia determinada, mejora más a los pacientes con disartria que la terapia habitual. La hipótesis es que la terapia es efectiva y funciona mejor que el tratamiento habitual.

Pregunta: ¿Una terapia de habla y lenguaje mejorada producirá una mejor recuperación en el habla respecto a los que no la reciban?.

Variables -Independiente: terapia -Dependientes: habla, comunicación, calidad vida Otras, para controlar la confusión: -Paciente (edad, sexo, nivel cultural, gravedad, otras patologías..)

Población ACV N = 500

Terapia n = 100

NO terapia n = 100

Seguimiento

Recuperación

Recuperación

Diferencia

Muestra ACV n = 200

Hipótesis La Terapia produce o es causa de una mejor recuperación

6 meses

Problema: Afasia y disartria en pacientes con Ictus

La hipótesis consiste en anticipar los resultados que se espera se van a obtener cuando finalice el estudio.

Contraste de Hipótesis

Esta Hipótesis previa será contrastada con los datos que se obtengan al finalizar la investigación. Si los datos van a favor de la hipótesis, ésta será aceptada. Si los datos van en contra, la hipótesis será rechazada. En la Figura siguiente se muestra un esquema del proceso de contraste de Hipótesis.

Hipótesis alternativa H1: Las personas con sobrepeso/obesidad tienen la presión sistólica más alta que las que tienen normopeso Hipótesis nula H0: Las personas con sobrepeso/obesidad tienen la presión sistólica igual que las que tienen normopeso

Diseñamos este estudio para contrastar la hipótesis.

Si al finalizar el estudio los datos indican que la magnitud del efecto es grande (diferencia de medias importante), la hipótesis quedará reforzada, se rechazará H0 y se aceptará H1. Si ambos grupos tienen la misma PAS, se aceptará H0.

. …… OJO… no quedará demostrado que H0 o H1 sea falsa, solo que los datos observados no las apoyan. Las Ciencias de la Salud no son ciencias exactas…

Contraste de Hipótesis

  • Población de Talavera de 45 a 80 años N = 31.
  • Muestra aleatoria de 45 a 80 años

n = 255

Normopeso IMC < 25

Sobrepeso/obesidad IMC ≥ 25

PAS media?

PAS media?

Diferencia de medias Magnitud del efecto

Los datos finales nos dirán si es cierto que el grupo de sobrepeso/obesidad tiene la PAS más alta o no. En la figura siguiente se muestran unos resultados que irían a favor de la Hipótesis. En efecto, se aprecia que el grupo con Normopeso tiene una media de PAS de 125,9 mmHg, mientras que el grupo de Sobrepeso/Obesidad, tiene una media de PAS de 137,4 mmHg. La conclusión del estudio sería que la obesidad se relaciona con la presión arterial sistólica.

Aparentemente, la conclusión sería clara: el grupo de sobrepeso/obesidad tiene una PAS muy superior al grupo de normopeso. Esto va en contra de H0 (a favor de H1).

El investigador debe tomar una decisión final como respuesta a la investigación: debe aceptar o rechazar H0. Estos datos le aconsejarían rechazarla (y aceptar H1).

Contraste de Hipótesis

H0: diferencia = 0

Estos son los resultados observados en el estudio:

¿van a favor o en contra de H0?

  • Población de Talavera de 45 a 80 años

N = 31.

  • Muestra aleatoria de 45 a 80 años

n = 255

Normopeso IMC < 25

Sobrepeso/obesidad IMC ≥ 25

PAS media: 126

PAS media: 137,

Diferencia = 11, Magnitud del efecto GRANDE

Hipótesis nula e hipótesis alternativa

La hipótesis formulada en el estudio de investigación que hemos visto en los ejemplos anteriores es la hipótesis alternativa. La hipótesis que se contrasta estadísticamente es la denominada hipótesis nula. La hipótesis nula es la suposición de que los grupos que se comparan son iguales , que no existen diferencias entre ellos, y se designa como (H0). La Hipótesis alternativa es lo contrario, es decir, que los grupos son diferentes, que existen diferencias estadísticamente significativas entre ellos y se designa como H1. Veamos en la tabla siguiente la manera de formular hipótesis en diferentes ejemplos.

Ejemplo Hipótesis nula H

(puede formularse de cualquiera de las tres formas)

Hipótesis alternativa H

Dos variables cualitativas

-El % de diabéticos es igual en los hombres que en las mujeres -No hay asociación estadística entre el SEXO y la DIABETES -Las variables SEXO y DIABETES

-El % de diabéticos es diferente en los hombres y en las mujeres -Hay asociación estadística entre el SEXO y la DIABETES -Las variables SEXO y DIABETES no

Estos son tres posibles resultados observados en el estudio:

¿van a favor o en contra de la hipótesis nula H0?

Contraste de Hipótesis

En contra de H0 claramente. Magnitud del efecto grande. La PAS es muy diferente. Se adoptaría H1, los grupos difieren en PAS.

A favor de H0, claramente. Magnitud del efecto cero. La PAS es similar en ambos grupos.

? ¿Qué decisión tomar en este caso?

-¿Es lo suficientemente grande la diferencia como para considerar que la PAS difiere? -¿Puede ser que por el azar del muestreo (no olvidemos que trabajamos con muestras aleatorias y esto genera incertidumbre) haya salido esa diferencia a pesar de que la intervención no sirva para nada?

1

2

3

PAS Normopeso^126 Sobrepeso/Obesidad 137

PAS Normopeso 137 Sobrepeso/Obesidad 137

PAS Normopeso 135 Sobrepeso/Obesidad 137

El valor P

El “valor P” es un número entre cero y uno (una probabilidad) que nos ayuda a decidir si aceptar o rechazar H0.

Si P < 0,05 rechazo H0, la diferencia observada es estadísticamente significativa Si P ≥ 0,05 acepto H0, la diferencia no alcanza significación estadística

Este valor 0,05 que separa la zona de rechazo de la zona de aceptación, se llama “Nivel de significación”

“El valor P puede entenderse como una medida de la disconformidad de los datos con la Hipótesis Nula H0, indicando cómo de improbables son los datos si H0 es cierta”. “Se entiende que cuanto más pequeño es P, más disconformes son los datos con H0, y más razones hay para rechazar H0.” (Martín-Luna 1990).

Las pruebas estadísticas de contraste de Hipótesis ayudan al investigador en su decisión de aceptar o rechazar H0. Y le facilitan un número (el valor “p”) que le orienta sobre el riesgo de error que asume tanto si acepta como si rechaza H0. Estos riesgos manejados juiciosamente, unidos a la valoración clínica de la magnitud de la diferencia entre los grupos, orientarán al investigador en sus conclusiones y le ayudarán a tomar la decisión de aceptar o rechazar la hipótesis nula H0. Pero cualquiera de las dos decisiones que se tomen (aceptar o rechazar H0) tiene asociado un riesgo de

error.

El problema ahora es calcular el valor de P. Para ello se hará la correspondiente prueba de Contraste de Hipótesis. Son unas pruebas encaminadas a obtener el valor P.

¿Por qué se toma el nivel de significación P < 0,05?. Este es un nivel arbitrario, consensuado por los investigadores (podría cambiarse). Indica que se considera “improbable” algo cuya probabilidad es P < 0,05, es decir < 5%.

Para entenderlo mejor, hay que explicar el concepto de Variabilidad Aleatoria.

Variabilidad aleatoria

La variabilidad aleatoria es la diversidad de resultados (diferencias entre las dos muestras) que se pueden producir por el azar del muestreo en el conjunto de todas las posibles muestras tomadas de la población.

Ejemplo:

Espacio de laEspacio de la Poblaci Poblacióón Dianan Diana (^) AncianosAncianos^30003000

GRUPO BGRUPO B BARTHEL 90BARTHEL 90

GRUPO AGRUPO A BARTHEL90 BARTHEL

H0: no hayH0: no hay diferenciadiferencia DifDif = 0= 0

DIFERENCIA =0DIFERENCIA =

Espacio de lasEspacio de las MUESTRAS MUESTRAS PosiblesPosibles Muestras Grupo A AZUL Muestras Grupo B VERDE

Espacio de lasEspacio de las DIFERENCIASDIFERENCIAS posiblesposibles Entre parejas deEntre parejas de MUESTRASMUESTRAS A A – – BB

- - 44 - - 33 - - 22 - - 11 00 11 22 33 44

Porción de la variabilidad aleatoria “probable”, asumible. Estas diferencias entre -2 y +2 son probables aunque H0 sea cierta. La probabilidad de obtener una de ellas por azar es P = 95%. Aceptaríamos H0.

8686 8888 9090 9292 9494

Variabilidad aleatoriaVariabilidad aleatoria Variabilidad aleatoria

Ejemplo de diferencias AEjemplo de diferencias A^ – –^ BB 9090 - -90 = 090 = 0 9292 - -88 = 488 = 4 8888 - -93 =93 = – – 55

Dependiendo de quDependiendo de quéé pareja de muestraspareja de muestras hayan salido, obtendremos unahayan salido, obtendremos una diferencia pequediferencia pequeñña o grande. Lasa o grande. Las pequepequeññas son muy probables, lasas son muy probables, las grandes son muy improbables.grandes son muy improbables. La diferencia que hemos observado en elLa diferencia que hemos observado en el estudio es la roja. Es demasiado grande,estudio es la roja. Es demasiado grande, eses improbableimprobable si H0 fuera cierta.si H0 fuera cierta. RechazarRechazarííamos H0 .amos H.

Zona aceptar H

Rechazo H0 Rechazo H 2,5% 2,5%

95%

En un estudio podrEn un estudio podríían salir las dosan salir las dos muestras rojas, en otro las dos negras,muestras rojas, en otro las dos negras, en otro las dos amarillas.en otro las dos amarillas. Las dos rojas es muy probable, las dosLas dos rojas es muy probable, las dos amarillas es muy improbable.amarillas es muy improbable.

Tomemos el ejemplo de un estudio para comparar el Índice de Barthel en dos grupos de personas mayores. Supongamos que en la población diana, la H0 es cierta, es decir, no hay diferencia entre

Probabilidad

2,5%^ 2,5%

95 %

Variabilidad aleatoria y contraste de hipótesis Curva de las diferencias entre los grupos en todas las posibles muestras, cuando H0 es cierta en la población (no existe diferencia entre los grupos)

Cuando H0 es cierta en la población, el 95% de las parejas de posibles muestras tendrán nulas o pequeñas diferencias entre los grupos (hasta ± 6 puntos en este ejemplo). Esta es la variabilidad aleatoria asumible.

Pero un 5% de las muestras tendrán diferencias mayores que esta variabilidad aleatoria

El contraste de hipótesis consiste en comparar la diferencia observada en la muestra con la variabilidad aleatoria asumible

Si la diferencia observada en la muestra está dentro de la variabilidad aleatoria asumible consideraremos que lo observado en la muestra es probable que pueda ser explicado por el azar del muestreo. Aceptaríamos H0.

Pero si fuera mayor (o menor) que la variabilidad aleatoria asumible, es muy poco probable que el azar del muestreo haya producido una diferencia tan grande si ésta no existe en la población. Y por tanto rechazaremos que H0. Alternativamente aceptaríamos H1.

Variabilidad aleatoria

Zona aceptación H

rechazo H0 rechazo H

En términos estadísticos, al comparar dos medias observadas en dos grupos, consideraremos habitualmente como variabilidad aleatoria el 95% de las diferencias comprendidas entre cero y ± 1,96 errores estándar de las diferencias (EE). Este ejemplo que acabamos de ver es la comparación de dos medias en grupos con muestras grandes. Pero en el contraste de hipótesis nos encontraremos con situaciones distintas. Por ejemplo, comparar dos medias en muestras pequeñas. En este caso, la distribución de probabilidad de las diferencias observadas en todas las posibles muestras no sigue una distribución normal, sino una distribución t de Student. O nos podemos encontrar el caso de la diferencia de dos porcentajes, cuando ambas variables sean categóricas. Entonces las posibles diferencias siguen una distribución de probabilidad denominada chi-cuadrado. O también la comparación de 3 o más medias, que sigue una distribución F de Snedecor. Pero en todos los casos el concepto de variabilidad aleatoria es similar y siempre basaremos en ella la decisión por aceptar H0 o rechazarla. En la Figura siguiente se muestran las principales curvas que se utilizan en los contrastes de hipótesis.

Probabilidad

2,5%^ 2,5%

95 %

Variabilidad aleatoria -6 -4 -2 0 2 4 6

Variabilidad aleatoria Variabilidad aleatoria

Variabilidad aleatoria

Curva normal Comparación de dos medias n > 30

Curva t Comparación de dos medias

Curva chi- cuadrado Comparación de dos porcentajes

Curva F Comparación de tres o más medias

Zona aceptación H

Zona aceptación H

Zona aceptación H

Zona aceptación H

rechazo H0 rechazo H0 rechazo H0^ rechazo H

rechazo H0 rechazo H

Riesgos de error en la decisión estadística

La incertidumbre debida al uso de muestras puede tener consecuencias sobre los resultados que observemos y se pueden producir cuatro situaciones que se ilustran en la Figura siguiente.

Población de Talavera de 45 a 80 años N = 31. Normopeso Sobrepeso/ obesidad

PAS = 126

PAS = 137

2) H0 es falsa

Acierto

Se rechazaría H siendo falsa

Error beta o de tipo 2 (falso negativo) Se aceptaría H0 cuando en realidad es falsa

Población de Talavera de 45 a 80 años N = 31.

1) H0 es cierta

Acierto

Se aceptaría H siendo cierta

Error alfa o de tipo 1 (falso positivo) Se rechazaría H0 cuando en realidad es cierta

Normopeso Sobrepeso/ obesidad

PAS = 137

PAS = 137 α

a) Muestra es similar

b) Muestra no es similar

Decido Aceptar H

Decido Rechazar H

d) Muestra no es similar

Decido Rechazar H

Decido Aceptar H

c) Muestra es similar

Errores de tipo 1 y tipo 2 en el Contraste de Hipótesis

Probabilidad

2,5%^ 2,5%

95 % Variabilidad aleatoria -6 -4 -2 0 2 4 6

Probabilidad

2,5%^ 2,5%

95 % Variabilidad aleatoria 5 7 9 11 13 17 19

Diferencia dentro de lavariabilidad aleatoria

Diferencia mayor o menorque la variabilidad aleatoria

Diferencia dentro de lavariabilidad aleatoria

Diferenciavariabilidad aleatoria menor que la

estadística. Este valor p es una probabilidad, y por tanto un número entre 0 y 1. Este valor p expresa la probabilidad de que, bajo la suposición de que H0 fuera cierta en la población, encontráramos en la muestra una diferencia tan extrema como la observada o aún más extrema. Si el valor de p es ≥ 0,05 se considera que la diferencia observada en la muestra no supera la variabilidad aleatoria asumible y procede tomar la decisión de aceptar H0 porque los datos son compatibles con H0. Por el contrario, si p <0,05 significa que la diferencia observada supera la variabilidad aleatoria, es muy poco probable que si H0 fuera cierta en la población, encontráramos en la muestra una diferencia tan grande como la observada. Si eso es muy poco probable pero a pesar de ello ha ocurrido, consideraremos que la explicación más razonable es que estábamos equivocados en la suposición y que H0 es falsa en la población. En consecuencia rechazaríamos H0 y alternativamente aceptaríamos H1. Por tanto, el valor de p <0,05 es el punto de corte arbitrario que aconseja al investigador rechazar H0 (y aceptar H1). En la Figura siguiente se explican estos conceptos.

Probabilidad

2,5%^ 2,5%

95 %

Variabilidad aleatoria

Valor “p” en el contraste de hipótesis

Partiendo de suponer que H0 es cierta en la población……

p ≥ 0,

La diferencia observada en la muestra es menor que la variabilidad aleatoria y puede ser explicada por el azar del muestreo.

Aceptación de H

p < 0,

La diferencia observada en la muestra es muy grande, mayor o menor que la variabilidad aleatoria y NO puede ser explicada razonablemente por el azar del muestreo. La explicación alternativa es que H0 no es cierta en la población, que los grupos difieren, y por eso hemos encontrado en la muestra esta diferencia tan grande.

Rechazo de H

Zona de aceptación de H

Zona de rechazo de H

Zona de rechazo de H

Significación estadística y relevancia clínica

Cuando se habla de "significativo" en términos generales, se suele implicar que algo es importante, mientras que en estadística el concepto se refiere a algo probablemente cierto (no por azar). Es posible que el hallazgo de una investigación sea cierto sin que sea importante. Cuando los estadísticos dicen que un resultado es "altamente significativo" (p = 0,0001 por ejemplo) quieren decir que es muy probable que sea cierto. No (necesariamente) quieren decir que es altamente importante. Desafortunadamente, los valores de significación estadística (valores p) no revelan directamente lo

que se desea saber. Indican las probabilidades de obtener diferencias entre los grupos de nuestra muestra, que son tan o más grandes que los que observamos, si no existieran diferencias entre los grupos correspondientes en la población representada por nuestra muestra. En otras palabras, estos valores nos indican las probabilidades de nuestros datos, bajo la presunción de que no existen diferencias en la población. El valor “p”, lo único que nos dice es si es probable que lo que estamos viendo se deba al azar o no. Además, el valor de p depende mucho del tamaño de la muestra. La misma diferencia puede ser significativa o no dependiendo del número de sujetos. Con muestras muy grandes, diferencias irrelevantes pueden ser significativas estadísticamente.

En la tabla se muestran algunos ejemplos.

Muestra Diferencia Grupo A Grupo B DE por grupo Valor p Decisión 80 78 12 1.000 0, 80 78 12 500 0, 80 78 12 300 0, 80 78 12 200 0, 80 78 12 100 0, 80 70 26 100 0,03 Poco probable esta diferencia importante por azar del muestreo Rechazo H 80 70 26 80 0, 80 70 26 70 0, 80 70 26 50 0, 80 60 26 20 0, 80 60 26 15 0, 80 60 26 13 0, 80 60 26 10 0, DE=Desviación estándar

Acepto H

Es poco probable que esta diferencia irrelevante se haya producido por azar del muestreo Es probable que esta diferencia irrelevante se haya producido por azar del muestreo

Rechazo H

Acepto H

Acepto H

20 puntos Rechazo H Diferencia Muy importante

Es probable que esta diferencia importante se haya producido por azar del muestreo

Índice de Barthel

2 puntos Diferencia Irrelevante

8 puntos Diferencia Importante Es poco probable que esta diferencia muy importante se haya producido por azar del muestreo Es probable que esta diferencia muy importante se haya producido por azar del muestreo

Si fuera cierta H0 (en la población de la que proceden las muestras no hay diferencia en el Barthel) es….

Una cosa es la importancia (magnitud) de la diferencia y otra es la significación estadística. Una p<0,05 nunca podrá convertir en importante una diferencia pequeña o irrelevante. Primero hay que valorar la importancia clínica. Si es importante, valorar después la significación estadística. En resumen….

Introducción a la metodología de la Investigación

1.- Se plantea la hipótesis nula H0 (y por tanto queda definida H1).

2.- Se define el estadístico de contraste : es una variable aleatoria con una distribución de probabilidad conocida y cuyo valor puede ser determinado a partir de los datos observados en la muestra aleatoria y que sirve para decidirse por H0 o por H1. Es distinto para cada tipo de prueba de contraste de hipótesis y su valor se calcula mediante una fórmula apropiada a partir de los datos de la(s) muestra(s) estudiada(s). Los estadísticos de contraste que utilizaremos en los siguientes capítulos son t de Student, chi cuadrado, F de Snedecor, r de Pearson.

3.- Definir el nivel de significación (α). Habitualmente α = 0,05.

4.- Se calcula el valor del estadístico de contraste con los datos observados en la muestra.

5.- Se busca en las tablas de probabilidad del estadístico si éste supera o no la variabilidad aleatoria, es decir, si cae en la zona de aceptación o de rechazo de H0. Para ello se busca en las tablas la “p” correspondiente a su valor. Si la p es < 0,05, supera la variabilidad aleatoria y cae en la zona de rechazo de H0. Entonces se tomará la decisión de rechazar H0, ya que consideramos que la diferencia observada no es explicable por el azar del muestreo. Se adoptará entonces H1, la hipótesis alternativa, que es que los grupos difieren significativamente. El valor de p nos dará la significación estadística. Este es el error α o error tipo 1 que asumimos, que es la probabilidad de equivocarnos al decidirnos por H1 y que en realidad fuera cierta H0. En todo caso, esta probabilidad de error será pequeña, menor del 5%. Si la p es ≥ 0,05, la discrepancia observada no supera la variabilidad aleatoria y cae en la zona de aceptación de H0. Entonces se tomará la decisión de aceptar H0, ya que consideramos que la diferencia observada es explicable por el azar del muestreo. Esta decisión lleva consigo la probabilidad de cometer un error β o de tipo 2. Este error habría que calcularlo ya que no lo dan las tablas. Significaría la probabilidad de que la decisión de aceptar H0 sea errónea y que en realidad fuera falsa.

Cuando estos cálculos se hacen con SPSS (u otro programa estadístico) nos darán directamente el valor de p sin necesidad de calcularlo, por lo que únicamente deberemos tomar la decisión de aceptar o rechazar H0.

En los siguientes capítulos resolveremos distintos tipos de situaciones y problemas y profundizaremos en la interpretación correcta de las decisiones estadísticas y valores p.