Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


bioestadistica, Apuntes de Administración de Empresas

Asignatura: Dirección Estratégica y Política de Empresa, Profesor: Amalia Mate Emp. II, Carrera: Administración y Dirección de Empresas, Universidad: UDC

Tipo: Apuntes

2012/2013

Subido el 09/05/2013

baldosa-2
baldosa-2 🇪🇸

5 documentos

1 / 36

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
A. MARTÍN ANDRÉS
J. de D. LUNA del CASTILLO
RESÚMENES de
BIOESTADÍSTICA
(6ª edición)
Medida Valores
posibles
(Asociación
)
Independencia
(Asociación
+
)
Caso Estimación
Estudios en
que es válida
General
(
)
(
)
11 2 12 1
ˆ
R = O C / O C
11 2
12 1
(O +0,5)(C +1)
ˆ
R = (O +0,5)(C +1)
Transversales
Prospectivos
R
0 R < 1
R = 1
1 < R < Si P(E)<0,1 ˆ
R>ˆˆ
O o O
Retrospectivos
Riesgo relativo (de FR para E): La probabilidad de enfermar es R veces mayor en los ...
EDICIONES NORMA-CAPITEL (2006)
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24

Vista previa parcial del texto

¡Descarga bioestadistica y más Apuntes en PDF de Administración de Empresas solo en Docsity!

A. MARTÍN ANDRÉS

J. de D. LUNA del CASTILLO

RESÚMENES de

BIOESTADÍSTICA

(6ª edición)

Medida Valores posibles

(Asociación) Independencia (Asociación + )

Caso Estimación Estudios en que es válida

General

R = O Cˆ ( 11 2 ) (/ O C 12 1 )

11 2 12 1

ˆ (O^ + 0,5)(C +1) R = (O + 0,5)(C +1)

Transversales R Prospectivos

0 ≤ R < 1

R = 1

1 < R < ∞ Si P(E)<0,1 Rˆ > O o Oˆ^ ˆ′ Retrospectivos Riesgo relativo (de FR para E) : La probabilidad de enfermar es R veces mayor en los ...

EDICIONES NORMA-CAPITEL (2006)

RESÚMENES de

BIOESTADÍSTICA

(6ª edición)

Estos Resúmenes han sido extraídos del libro publicado en esta misma Editorial

50 ± 10 horas de BIOESTADÍSTICA (1995)

A. Martín Andrés y J. D. Luna del Castillo.

3

RESUMEN DEL CAPÍTULO I

LA ESTADÍSTICA EN LAS CIENCIAS DE LA SALUD

1.1 NECESIDAD

Las Ciencias de la Salud son experimentales y se basan en el método induc- tivo (extensión, al todo, de las conclusiones obtenidas en una parte). El único modo de validar tales inducciones es por el Método Estadístico. Las demás ra- zones que siguen son reflejo de esta mayor razón: a) La variabilidad biológica de los individuos objeto de estudio en las Cien- cias de la Salud origina que sus datos sean impredecibles y que el modo de controlarlos sea a través del Método Estadístico. b) La naturaleza cada vez más cuantitativa de las Ciencias de la Salud re- quiere del Método Estadístico para analizar y poner orden en los datos. c) La investigación en el campo de las Ciencias de la Salud requiere de la Es- tadística en sus etapas de diseño, recopilación de datos y análisis de los resul- tados. d) El volumen de la información que recibe el profesional de la Salud re- quiere de conocimientos estadísticos que le permitan leer crítica y compren- sivamente los resultados científicos ajenos. e) La naturaleza del trabajo clínico es en esencia de tipo probabilístico o es- tadístico, disciplinas que dan rigor y objetividad a los clásicos procesos sub- jetivos de diagnóstico, pronóstico y tratamiento. f) La perspectiva comunitaria de las Ciencias de la Salud requiere del uso de la Estadística para poder extrapolar las conclusiones desde la parte estudiada de la población a su globalidad.

1.2 DEFINICIÓN DE ESTADÍSTICA No existe una definición internacionalmente aceptada, pero para nuestros propósitos basta con esta: “Es el conjunto de métodos necesarios para recoger, clasificar, representar y resumir datos, así como para hacer inferencias (extraer consecuencias) científicas a partir de ellos”. De ahí que conste de dos partes: a) Estadística Descriptiva , cuyo fin es la recogida, clasificación, representa- ción y resumen de los datos. b) Inferencia Estadística , cuyo fin es extender las conclusiones obtenidas en una parte de la población de interés (la muestra ) a toda ella.

1.3 CONSIDERACIONES FINALES a) Es importante estar familiarizado con el lenguaje estadístico. b) El Método Estadístico es un método riguroso para el análisis de datos. Su va- lidez está condicionada por la verificación de ciertas hipótesis que no pueden ser violadas. c) Es importante la planificación adecuada de la experiencia. Una planificación incorrecta puede hacer desaprovechable toda la experiencia o una gran parte de ella. d) La Estadística Descriptiva no tiene valor inferencial alguno. Ella sólo descri- be lo que hay, no permitiendo extraer conclusiones ciertas sobre nada.

5

RESUMEN DEL CAPÍTULO II

ESTADÍSTICA DESCRIPTIVA

2.1 TIPOS DE DATOS

a) Cuantitativos: Se expresan numéricamente. i) Discretos: Toman valores numéricos aislados. ii) Continuos: Toman cualquier valor (dentro de unos límites dados). b) Cualitativos: No se expresan numéricamente. i) Ordinales: Admiten una ordenación lógica y ascendente. ( Nominales en otro caso). ii) Dicotómicos : Solo aceptan dos posibilidades.

2.2 PRESENTACIÓN TABULAR DE LOS DATOS a) Se les agrupa en clases (si son discretos o cualitativos) o en intervalos de cla- se de igual longitud (si son continuos o discretos con muchos valores posi- bles). La primera y la última clase pueden ser excepción. b) A cada clase se le anota la frecuencia absoluta (fi ), o número de datos en la clase, y la frecuencia relativa (h (^) i = f (^) i /n, con n el número total de datos). Su- cederá que Σf (^) i = n y Σh (^) i = 1. Multiplicando h (^) i por 100, 1.000, etc se obtienen los %, 0 / 00 , etc. c) Los intervalos de clase vienen definidos por dos números, el límite inferior (L (^) I ) y el límite superior (L (^) S); la diferencia de ellos es la longitud de clase y la semisuma es la marca de clase.

2.3 PRESENTACIÓN GRÁFICA DE LOS DATOS a) Histograma: Sobre cada punto (o intervalo) de las abscisas, se levanta una barra (o rectángulo) de tanta altura como frecuencia haya. b) Polígono de frecuencias: Se unen por una poligonal los puntos del plano que tienen por abscisa la clase o marca de clase y por ordenada la frecuencia. c) Pictograma: Se define una figura-motivo y se la repite o se la amplía de mo- do proporcional a la frecuencia de la clase, obteniendo así un pictograma “de repetición” (o de “amplificación”). d) Diagrama de sectores: En un círculo, se asigna a cada clase un sector de área proporcional a la frecuencia de la clase. El ángulo que lo delimita es 360 ×h (^) i (en grados).

2.4 SÍNTESIS DE DATOS a) Medidas de posición: Describen cómo se encuentra el resto de la muestra con respecto a ellas. i) Moda : la clase con mas frecuencia absoluta (si nominal) o relativa (resto de los casos). ii) Mediana: divide a la muestra ordenada (de menor a mayor) en dos partes iguales. iii) Percentil : El percentil p (^) i deja a su izquierda un "i%” de la muestra orde- nada de menor a mayor (i=1, 2, ...., 99). iv) Cuartil : c 1 =p 25 , c 2 =p 50 , c 3 =p 75.

6 ESTADÍSTICA DESCRIPTIVA

v) Decil : d 1 =p 10 , d 2 =p 20 , ..., d 9 =p 90. vi) Media aritmética :

  • Datos no agrupados: x = i

x n

  • Datos agrupados: x = i^ i

f x

n

, con Σf (^) i = n

vii) Media ponderada : (^) p i^ i i

w x x = w

, con wi los pesos de ponderación.

b) Medidas de dispersión: Describen cómo de variables o dispersos son los da- tos. i) Recorrido, rango o amplitud: Es la diferencia entre los valores más gran- de y más pequeño de la muestra. ii) Desviación media : d (^) m = Σ⏐x (^) i− x ⏐/n iii) Varianza : En lo que sigue, la primera fórmula es la definición y la segun- da es la apropiada para el cálculo:

  • Datos no agrupados:

2 2 2 i 2 i i

(x x) 1 ( x ) s = x n 1 n 1 n

Σ ⎧^ Σ ⎫

  • Datos agrupados:

2 2 2 i i 2 i i i i

f (x x) 1 ( f x ) s = f x n 1 n 1 n

Σ ⎧^ Σ ⎫

con Σfi = n iv) Desviación típica : la raíz cuadrada (s) de la varianza. v) Rango intercuartílico : c 3 −c 1 vi) Coeficiente de variación : CV = (s/ x )×100%.

8

RESUMEN DEL CAPÍTULO IV

INTERVALOS DE CONFIANZA Y DE ACEPTACIÓN

4.1 MUESTREO ALEATORIO

Las muestras deben tomarse al azar, de modo que todo individuo de la po- blación tenga igual probabilidad de ser seleccionado y que la selección de uno de ellos no condicione la selección de otro. El azar puede imitarse mediante da- dos, bolas en urna, etc, pero lo mejor es hacerlo a través de una Tabla de Núme- ros Aleatorios como la Tabla 5.

4.2 ESTIMACIÓN Los parámetros poblacionales no suelen ser conocidos. Se les determina a través de muestras aleatorias. La Teoría de la Estimación es la parte de la Infe- rencia Estadística que sirve para determinar el valor de los parámetros pobla- cionales en base al de los parámetros muestrales. La estimación puede ser: a) Por punto : Si se asigna al parámetro desconocido (ω) un único valor ( ωˆ ) que será su valor aproximado y que depende de la muestra. Se dice que ωˆ es un estimador de ω. Cuando se haya obtenido la muestra y calculado ωˆ , se dice que ˆω es una estimación de ω. Usualmente ˆω es el parámetro muestral homónimo del parámetro poblacional ω a estimar (así, μ =ˆ x, σˆ^2 = s^2 y p=hˆ ). b) Por intervalo : Si se asigna al parámetro desconocido (ω) un intervalo de va- lores, (a; b), entre los cuales está ω con una cierta confianza 1−α. Así, si P(a≤ω≤b) = 1−α, (a; b) es el intervalo de confianza , α es el error del interva- lo y 1−α la confianza del intervalo.

4.3 INTERVALO DE CONFIANZA PARA UNA MEDIA μ a) Intervalo con v.a. Normales : Si x→ N (μ; σ) y x 1 , x 2 , ..., x (^) n es una muestra aleatoria de ella, con media x y desviación s:

i) Si σ^2 es conocida : μ ∈ x ±zα σ/ n , con zα en la Tabla 2.

ii) Si σ^2 es desconocida : μ ∈ x ±tαs/ n , con tα en la Tabla 6 con (n−1) g.l. y

s/ n el llamado error estándar. b) Intervalo con v.a. no Normales : Si, en las condiciones de antes, x es no Normal, lo que sigue vale aproximadamente:

i) Si σ^2 es conocida y n ≥ 30: μ ∈ x ±zα σ/ n , con zα en la Tabla 2.

ii) Si σ^2 es desconocida y n ≥ 60: μ ∈ x ±zαs/ n , con zα en la Tabla 2.

En ambos casos, si la v.a. x es discreta (y saltando de 1 en 1), a las expre- siones anteriores hay que añadirles el término ±1/(2n) como corrección por continuidad. c) Tamaño de muestra: Si x→ N (μ; σ) y se desea obtener un tamaño de mues- tra n tal que la media x de esa muestra verifique que ⏐ x −μ⏐≤d, entonces:

i) Si σ^2 es conocida : n = (zα σ/d)^2 , con zα en la Tabla 2.

ii) Si σ^2 es desconocida pero se conoce un valor máximo para ella: n =

{zα ×(Máx σ) / d} 2 , con zα en la Tabla 2.

iii) Si σ^2 es desconocida pero hay una muestra piloto : n = (tαs/d)^2 , con tα en

la Tabla 6 con ( n′ −l) g.l., n′ el tamaño de la muestra piloto y s^2 su va- rianza. iv) En otro caso: Hacer d=Kσ y n = (zα/K) 2 , con zα en la Tabla 2. Los casos ii) e iii) requieren comprobar que la muestra del tamaño n aconsejado verifica las especificaciones. Si el n resultante es grande (≥60),

INTERVALOS DE CONFIANZA Y DE ACEPTACIÓN 9

las fórmulas anteriores también valen, aproximadamente, si x es no Normal.

4.4 INTERVALO DE CONFIANZA PARA UNA PROPORCIÓN Si x→ B (n; p): a) Intervalo: Si x es una observación de ella, ˆp =x/n, qˆ =1− pˆ y son x, n−x>5: 2 2

2

z z x 0, (x 0,5) z (x 0,5) 1 2 4 n p n z

α α α

α

expresión que se puede simplificar en esta otra si, además, son x, n−x>20: x(n x) x z 0, pqˆ ˆ 1 n p pˆ z = n 2n n

α α

con zα siempre en la Tabla 2. La expresión primera es siempre más exacta que la segunda. b) Tamaño de muestra: Si se desea obtener un tamaño de muestra n tal que la proporción pˆ en ella verifique que ⏐ pˆ −p⏐≤d, entonces: i) Con información: Si en base a una información previa -bibliográfica o de muestra piloto- se conoce que p∈(p 1 ;p 2 ), n = (zα/d)^2 pq, con p el valor de dicho intervalo que esté más cercano a 0,5 y q=1−p. ii) Sin información : n = (zα/2d)^2. con zα siempre en la Tabla 2. En el primer caso hace falta comprobar que la muestra del tamaño n aconsejado verifica las especificaciones.

4.5 GENERALIDADES SOBRE LOS INTERVALOS DE CONFIANZA Las siguientes observaciones son válidas para todos los intervalos de con- fianza: a) Los intervalos de confianza construidos son de dos colas -es decir del tipo ω ∈ (ω 1 ; ω 2 )- y con una confianza de 1−α (o con un error de α). Cuando se desee un intervalo de confianza de una cola, obtener el extremo que interese (ω 1 o ω 2 ) al error 2α. El intervalo será ω≤ω 2 o ω≥ω 1. b) Las fórmulas de tamaño de muestra son válidas para un intervalo de confian- za de dos colas al error α. Cuando se le desee de una cola, cambiar α por 2α. c) En ciertos casos del tamaño de muestra se alude a que al final hay que comprobar que la muestra del tamaño aconsejado verifica las especificacio- nes. El modo de hacerlo pasa por determinar el intervalo de confianza ω ∈ (ω 1 ; ω 2 ) a partir de dicha muestra; deberá ocurrir que ⏐ ωˆ −ω 1 ⏐≤ d y ⏐ ωˆ −ω 2 ⏐≤ d, con ωˆ igual a x o pˆ según el caso.

4.6 INTERVALOS DE ACEPTACIÓN Si x 1 , x 2 , ..., x (^) n es una muestra aleatoria de una v.a. continua de parámetros desconocidos: a) Variables Normales : x ∈ x ± Ks, con x y s la media y desviación típica de la muestra y K en la Tabla 9. b) Variables cualesquiera : ordenar la muestra de menor a mayor y proceder como se indica en la Tabla 10. En ambos casos el intervalo obtenido contiene al menos al 100π% de la pobla- ción con una confianza de (1−α).

CONCEPTO GENERAL DE TEST DE HIPÓTESIS 11

c) El error α es un único número, pero el error β depende de la alternativa que se considere. d) El error β disminuye conforme aumenta α, conforme H 1 se aleja de H 0 y con- forme aumenta el tamaño de la muestra (si todo lo demás permanece fijo).

5.6 POTENCIA DE UN TEST Se llama potencia θ a la capacidad que tiene un test para detectar las hipó- tesis alternativas, es decir: θ = 1−β = P(decidir H 1 ⏐es cierta H 1 ) Como es función de la hipótesis alternativa, en el caso de tests acerca de pará- metros su representación gráfica da la curva de potencia. Un test es tanto mejor cuanto más potente sea.

5.7 VALOR P a) Al mínimo error α al cual un resultado es significativo se le llama valor P o nivel crítico P o nivel mínimo de significación. b) P es también la probabilidad de obtener un resultado tan extraño o más que el obtenido cuando H 0 es cierta, midiendo por tanto las evidencias que hay en contra de H 0 (pero no mide cuánto de falsa es H 0 ). c) En un test de una cola (en el sentido favorable) P suele ser la mitad de su va- lor en el test de dos colas. d) Fijado un valor de α: si P ≤ α se decide H 1 ; si P ≥ α se decide H 0. e) Las conclusiones de un test suelen expresarse así: H 0 (P>tal) o H 1 (P<cual).

5.8 TAMAÑO DE MUESTRA Determinando el tamaño de muestra n de antemano las conclusiones por H 0 también son fiables (las conclusiones por H 1 siempre lo son). Para determinar n hace falta especificar: a) El error α del test; b) La primera alternativa de interés, es decir la primera H 1 (digamos ω 1 ) que

se desea diferenciar de H 0 (digamos ω 0 ), o la mínima diferencia de interés δ

= ⏐ω 1 −ω 0 ⏐. Si el test es para H 0 ≡ ω=ω 0 , la primera alternativa de interés será ω 1 = ω 0 +δ para H 1 ≡ ω>ω 0 , ω 1 = ω 0 −δ para H 1 ≡ ω<ω 0 o ω 1 = ω 0 ±δ para H 1 ≡ ω≠ω 0. c) El error β (o la potencia θ ) para tal alternativa. El n obtenido garantiza que el test realizado con tal muestra (al error α) da- rá significativo el (1−β)×100% de las veces en que la verdadera hipótesis H 1 se diferencie de H 0 en la cantidad δ especificada (o más veces si la diferencia es mayor, o menos veces si es menor).

5.9 INTERVALOS DE CONFIANZA TRAS UN TEST DE HIPÓTESIS a) Tras realizar un test de hipótesis acerca de parámetros es conveniente dar un intervalo de confianza para el parámetro implicado , tanto si se concluye H 0 (para así matizar la posible magnitud del error de tal conclusión) como si se concluye H 1 (para así indicar cuánto de falsa es H 0 ). b) Cuando el test es de dos colas , el intervalo será de dos colas (al error α si se concluyó H 1 ; al error 2β si se concluyó H 0 ). c) Cuando el test es de una cola , el intervalo será de una cola (al error α y con la desigualdad en el sentido que indica H 1 si se concluyó H 1 ; al error β y con la desigualdad en el sentido contrario al que indica H 1 si se concluyó H 0 ).

12 CONCEPTO GENERAL DE TEST DE HIPÓTESIS

5.10 REGLAS PARA TOMAR LA DECISIÓN a) Si n fue determinado de antemano : i) Si P≤α se concluye H 1 (la decisión es fiable); ii) Si P>α se concluye H 0 (la decisión es fiable). b) Si n no se determinó de antemano, pero se conocen los errores α y β y la mínima diferencia de interés δ (o la primera alternativa de interés ω 1 a la hipótesis nula ω 0 ) : i) Si P≤α se concluye H 1 (la decisión es fiable). ii) Si P>α se concluye H 0 ≡ ω=ω 0 provisionalmente. El intervalo de confian- za ω ∈ (ωI ; ωS) construido en base a lo indicado en el Resumen 5.9b) y c) permite tomar la decisión final: si la primera alternativa de interés ω 1 = ω 0 −δ (para H 1 ≡ ω<ω 0 ), ω 1 = ω 0 +δ (para H 1 ≡ ω>ω 0 ) o alguna de las ω 1 = ω 0 ±δ (para H 1 ≡ ω≠ω 0 ) pertenece al intervalo, la conclusión por H 0 no es fiable (y debe ampliarse la muestra y repetir el test); en otro caso la con- clusión por H 0 es fiable (y el problema finaliza). c) En otro caso (Regla Automática de Decisión para el caso de α =5%) :

i) Si P ≤ 5% : Se concluye H 1 ;

ii) Si P>15% o 20% (depende de n): Se concluye H 0 ; iii) En otro caso : Se concluye H 0 , indicando que hay indicios de significa- ción y que conviene ampliar la muestra y repetir el test.

14 TESTS CON UNA MUESTRA

iii) Si σ^2 es desconocida, pero hay una muestra piloto de tamaño n ′ y va-

rianza s^2 : n = {(tα+t 2 β)s/δ}^2 con las t en la Tabla 6 con ( n′ −1) g.l.

iv) Si σ^2 es desconocida y no hay muestra piloto : Haciendo δ = Kσ, n =

{(zα+z 2 β)/K} 2 , con las z de la Tabla 2.

6.4 TEST DE HIPÓTESIS PARA LA MEDIA DE UNA VARIABLE CUALQUIERA (H 0 ≡ μ=μ 0 ) Si x es una variable cualquiera de media μ desconocida y varianza σ^2 , el Resumen 6.3 es válido aproximadamente, con las siguientes matizaciones: a) Cuando σ^2 es conocida : Si n≥30. b) Cuando σ^2 es desconocida : Si n≥60 (pero las cantidades t se miran también en la Tabla 2). c) Si la variable es discreta y saltando de 1 en 1 : Al numerador de las canti- dades experimentales hay que restarles 1/(2n), con lo que quedan así: ⏐ x −μ 0 ⏐−1/(2n).

6.5 MÉTODOS DE MEDIDA a) Un método de medida se dice que es insesgado si en promedio mide lo que realmente hay. Será sesgado en otro caso. b) Un método de medida se dice que es preciso si tiene poca variabilidad (va- rianza). Será impreciso en otro caso. c) Un método de medida se dice que es exacto si es insesgado y preciso.

6.6 TEST DE NORMALIDAD DE D’AGOSTINO (H 0 ≡ “La muestra provie- ne de una v.a. Normal”) Si x 1 , x 2 , ..., x (^) n es una muestra aleatoria ordenada de menor a mayor, com- parar con una Dα de la Tabla 11 (por el modo allí indicado) la cantidad:

Dexp = {Σixi−(n+1)(Σx (^) i )/2)} / {n n ⎡⎣^ Σx (^2) i - ( Σx ) / ni^2 ⎤⎦}

Si el test da significativo, la comprobación de la causa de la no-Normalidad se hace calculando Fn (x (^) i ) = {nº de observaciones menores o iguales que xi }/n, representando en le plano las parejas (xi ; F (^) n (x (^) i )) y comparando la curva obtenida con las curvas más usuales.

6.7 RECHAZO DE OBSERVACIONES EXTREMAS (H 0 ≡ “La observa- ción x (^) S debe aceptarse”) Si x 1 , x 2 , ..., x (^) n es una muestra aleatoria de una v.a. x Normal y x es su media, la observación sospechosa xS será aquella que más diste de x , es decir x (^) S = Máx (^) i ⏐xi− x ⏐. Comparar t (^) exp = ⏐x (^) S− x ⏐ / Σx (^2) i - ( Σx ) / ni^2 con una tα de la Tabla 13 por el modo allí se indicado. Si el test da significativo (con valor P=P 1 ) rechazar la observación. Con las n−1 observaciones restantes puede intentarse rechazar otra observación (valor P 2 ), pero ahora el valor P para la segunda es P = P 1 +P 2.

15

RESUMEN DEL CAPÍTULO VII

TESTS DE HOMOGENEIDAD CON DOS MUESTRAS

7.1 TESTS PARAMÉTRICOS PARA COMPARAR DOS MEDIAS DE

VARIABLES NORMALES (H 0 ≡μ 1 =μ 2 ) a) Test para muestras independientes : Si las muestras -de tamaños n 1 y n 2 , medias x 1 y x y varianzas 2 s 1 2 y s^22 - provienen de variables de medias μ 1 y μ 2 y varianzas σ^21 y σ^22 desconocidas, obtener Fexp = s / 12 s , con^22 s 1 2 ≥ s^22 y compararla con F0,10 [n 1 −1; n 2 −1] de la Tabla 8; entonces:

i) Si F exp <F 0,10 (Varianzas iguales: σ 1 = σ 2 = σ ) (Test de Student) : Comparar

con una tα(n 1 +n 2 −2) de la Tabla 6 la cantidad:

1 2 exp (^2 1 ) 1 2

x x t = n n s n n

, con

2 2 2 1 1 2 2 1 2

(n 1)s (n 1)s s = n n 2

ii) Si F exp ≥ F 0,10 (Varianzas distintas: σ 1 ≠σ 2 ) (Test de Welch) : Comparar con

una tα(f) de la Tabla 6 la cantidad:

1 2 exp

x x t = A B

, con A=

2 1 1

s n

, B=

2 2 2

s n

y

2 2 2

1 2

(A B)

f = A B n 1 n 1

b) Test para muestras apareadas (Test de Student) : Dadas dos v.a. (x 1 ; x 2 ) y n parejas de datos (x (^) 1i ; x (^) 2i ) de las mismas, con i=1, 2, …, n, obtener sus dife- rencias d (^) i = x (^) 1i−x2i y la media ( d ) y desviación (sd ) de las mismas. Si d → N (μd =μ 1 −μ 2 ; σd ), con μi la media de x (^) i , comparar con una tα(n−1) de la Tabla 6 la cantidad t (^) exp = ⏐ d ⏐/ s / n.^2 d c) Intervalo de confianza para la diferencia de medias : La siguiente expre- sión es válida para los tres casos citados en a) y b) , con la misma notación, condiciones y alusiones de entonces: μ 1 −μ 2 ∈(numerador de la texp sin valor absoluto) ± tα ×(denominador de la texp )

d) Tamaño de muestra : Con igual notación que en a) y b) , para detectar una diferencia ⏐μ 1 −μ 2 ⏐= δ (en lo que sigue, zx en la Tabla 2; tx en la Tabla 6 con f ′ g.l.): i) Muestras independientes (Varianzas iguales) : n 1 =n 2 =n, con: 2 n = ⎛^ z^ α^ +z^2 β⎞^2 σ^2 ⎜ ⎟ ⎝ δ ⎠

2 n = ⎛^ t^ α^ +t^2 β⎞ 2s^2 ⎜ ⎟ ⎝ δ ⎠

2 n = 2 z^ z^2 K

× ⎜⎛^ α^ + β⎞ ⎟ ⎝ ⎠ la primera expresión cuando σ (o su máximo) es conocida, la segunda cuando hay una muestra piloto de tamaños ni′^ y varianza común s^2 (con f ′^ = n 1 ′ + n 2 ′− 2 ), y la tercera cuando δ = Kσ. ii) Muestras independientes (Varianzas distintas) : Si r = σ 2 /σ 1 (o s 2 /s 1 ):

TESTS CON DOS MUESTRAS 17

el rango promedio que tendrían si fueran distintos; por ejemplo, si xr = x (^) r+1 = ... = x (^) s, a cada elemento se le asigna el rango promedio (r+s)/2. b) Muestras independientes (Test de Wilcoxon) : Dadas dos muestras inde- pendientes de tamaños n 1 y n 2 (n 1 ≤n 2 por convenio), unir las dos muestras en una sola, ordenarla de menor a mayor, asignarle rangos a sus elementos y calcular las sumas de rangos (R 1 y R 2 ) de los elementos de cada una de las muestras. Deberá suceder que R 1 +R 2 = (n 1 +n 2 )×(n 1 +n 2 +1)/2. Llamar por Rexp a la suma de rangos (R 1 ) de la muestra de menor tamaño y entonces:

i) Si n 1 +n 2 ≤ 30 : Comparar Rexp con una Rα de la Tabla 14 por el modo allí

indicado. ii) Si n 1 +n 2 >30 : Comparar zexp = {⏐Rexp−E(R)⏐−0,5} / V(R) con una zα de la Tabla 2, en donde E(R) = (n 1 +n 2 +1)n 1 /2 y V(R) = (n 1 +n 2 +1)n 1 n 2 /12 si no hay empates, en tanto que cuando haya r grupos de t 1 , t 2 , ..., tr empates cada uno:

{ }

2 1 2 1 2 i 1 2 1 2 1 2

(n n ) (n n ) 1 V(R)= n n 12(n n )(n n 1)

×

- - T

, con Ti =(ti−1)ti (ti +1)= t (^3) i - ti

c) Muestras apareadas (Test de Wilcoxon) : Dadas n' parejas de datos, obtener las n' diferencias entre ellas, rechazar las que sean cero, ordenar el resto (n) de menor a mayor valor de sus valores absolutos, asignarles rangos y calcular las sumas de rangos -R(+) y R(−)- de las diferencias positivas y negativas. Deberá suceder que R(+)+R(−) = n(n+1)/2. Entonces:

i) Si n ≤ 25 : Comparar R(+) -o R(−), es lo mismo- con una Rα de la Tabla 15

por el modo allí indicado. ii) Si n>25 : Comparar la cantidad zexp = {⏐R(+)−E(R)⏐−0,5} / V(R) con una zα de la Tabla 2, en donde E(R) = n(n+1)/4 y V(R) = n(n+1)(2n+1) / 24 cuando no hay empates, en tanto que cuando haya r grupos de t 1 , t 2 , ..., tr empates cada uno, V(R) = {2n(n+1)(2n+1)−ΣTi }/48 con Ti = (ti−1)ti (ti +

  1. = t^3 i - ti.

7.4 TESTS DE COMPARACIÓN DE DOS PROPORCIONES (MUES- TRAS INDEPENDIENTES) (H 0 ≡ p 1 =p 2 ) Si x (^) i→ B (ni ; pi ), con i=1, 2, son independientes, y si de cada una de ellas se obtiene una muestra en el formato de la Tabla R.7.1, entonces, llamando por p =xˆi (^) i /ni , ˆp =a 1 /N, q =1ˆi − pˆi y ˆq = 1 - pˆ (en lo que sigue las cantidades zx siem- pre en la Tabla 2, pues se utiliza la aproximación de la Binomial a la Normal): a) Test : Si E = Mín (a 1 ; a 2 )×Mín (n 1 ; n 2 )/N > 5, comparar

1 2 1 2 exp 1 2 1 2

pˆ pˆ áx (n ; n ) z = n +n pq ˆ ˆ n n

×

×

2 M

vs. zα

b) Intervalo de confianza para la diferencia de proporciones : Si x 1 , x 2 , y 1 , y (^2) son todos mayores que 5:

p 1 - p 2 ∈ ( pˆ 1 - pˆ 2 ) ± 1 1 2 2 1 2 1 2

p qˆ ˆ^ p qˆ ˆ z n n áx (n ; n )

α

⎨ +^ + ⎬

⎪⎩ × ⎪⎭

2 M

c) Tamaño de muestra : Para detectar una diferencia δ = ⏐p 1 −p 2 ⏐:

18 TESTS CON DOS MUESTRAS

i) Con información : 2 z 2pq z 2 p q 1 1 p q 2 2 n=

⎛ (^) α + (^) β + ⎞ ⎜ ⎟ ⎜ (^) δ ⎟ ⎝ ⎠

con p = (p 1 +p 2 )/2, q = 1−p, qi = 1−p (^) i y las p 1 y p 2 lo más cercanas posibles a 0,5±δ/2, compatibles con la información que se posea sobre ellas y tales que ⏐p 1 − p 2 ⏐ = δ. ii) Sin información : Cuando no hay información previa sobre las pi , la fórmula anterior se convierte en n = {zα+z 2 β 1 - δ^2 }^2 / 2δ^2. Tabla R.7.1 Tabla R.7. Presentación de datos cuando se comparan dos proporciones independientes.

Presentación de datos cuando se comparan dos proporciones apareadas.

Característica

Muestras

SÍ NO Totales

B

A

SÍ NO Total

1 x 1 y 1 n 1 n 11 n (^12) 2 x 2 y 2 n 2 NO n 21 n (^22) Totales a 1 a 2 N Total n

7.5 TEST DE COMPARACIÓN DE DOS PROPORCIONES (MUES-

TRAS APAREADAS) (H 0 ≡ p 1 =p 2 ) Si los n individuos de una muestra son clasificados según que presenten (SÍ) o no (NO) una determinada característica tras la aplicación de un tratamien- to A (entendido de modo genérico: no tiene porqué ser un tratamiento médico) y lo mismo tras la aplicación de otro tratamiento B, los datos pueden presentarse como en la Tabla R.7.2. Si p 1 y p 2 son las proporciones de respuestas SÍ a cada tratamiento (en lo que sigue zx siempre en la Tabla 2): a) Test de McNemar : Si n 12 +n 21 > 10, comparar

zexp = {⏐n 12 −n 21 ⏐−1} / n 12 + n 21 vs. zα.

b) Intervalo de confianza para la diferencia de proporciones : Si n 12 , n 21 > 5:

2 12 21 1 2 12 21 12 21

(n n ) p p (n n ) z (n n ) 0,5 / n α n

− ∈ ⎢^ − ± ⎨ + − + ⎬⎥

c) Tamaño de muestra : Para detectar una diferencia ⏐p 1 −p 2 ⏐= δ:

i) Con información : n = {(zα p 12 + p 21 +z 2 β p 12 + p 21 − δ^2 ) / δ}^2 , en donde p 12 (o p 21 ) es la proporción de individuos que responden SÍ y NO (o NO y SÍ) a los tratamientos A y B respectivamente, y con p 12 +p 21 sustituido por lo máximo que pueda valer (sus sumandos lo más próximos posibles a 0,5 ± δ/2) compatible con la información y con que ⏐p 1 −p 2 ⏐= δ. ii) Sin información : Cuando no hay información previa sobre las pij, la fór- mula anterior se convierte n = {(zα+z 2 β 1 - δ^2 ) / δ}^2.

7.6 GENERALIDADES VÁLIDAS PARA TODO EL RESUMEN AC- TUAL a) Muestras : Dos muestras son independientes cuando cada individuo de las mismas proporciona una única observación. Son apareadas , relacionadas o