Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


tema 5 estadistica, Apuntes de Estadística

Asignatura: Estadistica II, Profesor: Eugenia Cruces, Carrera: Marketing e Investigación de Mercados, Universidad: UMA

Tipo: Apuntes

2016/2017

Subido el 02/03/2017

pablo_tinoco
pablo_tinoco 🇪🇸

5

(3)

2 documentos

1 / 39

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
DEPARTAMENTO DE ESTADÍSTICA Y ECONOMETRÍA
Estadística II
Grado en Administración y Dirección de Empresas
Grado en Marketing e Investigación de Mercados
Doble Grado en Administración y Dirección de Empresas y Derecho
TEMA 5: CONTRASTES DE HIPÓTESIS PARA LA LOCALIZACIÓN
DE DOS POBLACIONES
A. Morillas; M. Aguilar; E. Cruces; B. Díaz
5.1. Introducción
5.2. Contrastes para muestras independientes
5.2.1. Contrastes paramétricos
5.2.1.1. Contraste de la diferencia de medias en poblaciones normales
5.2.1.2. Contraste de la diferencia de proporciones
5.2.2. Contrastes no paramétricos: Wilcoxon-Mann-Whitney
5.3. Contrastes para muestras relacionadas (datos pareados)
5.3.1. Contraste de la diferencia de medias en poblaciones normales
5.3.2. Contrastes no paramétricos de localización para datos relacionados
5.3.2.1. Test del signo para datos relacionados
5.3.2.2. Test del rango signado para datos relacionados
5.4. Resolución de casos prácticos con ordenador
5.1. Introducción
Una vez estudiados en el tema anterior los contrastes de hipótesis para la localización de una
población, ahora se verán los correspondientes test para comparar dos poblaciones, tanto en el
caso de normalidad, como en poblaciones de distribución desconocida.
En la presentación de los contrastes distinguiremos dos casos. En primer lugar, supondremos
que se extraen muestras independientes de cada una de las poblaciones implicadas. En segundo
lugar, consideraremos que los datos se toman por parejas, estando las dos características
observadas en cada población asociadas en alguna forma. Así, por ejemplo, podríamos estar
interesados en contrastar si hay diferencia significativa entre las calificaciones obtenidas por
los alumnos de un determinado Grado en las asignaturas de Estadística y Teoría Económica. Es
evidente que si observamos las dos calificaciones de n alumnos seleccionados aleatoriamente,
los datos de cada individuo no van a ser independientes, por lo que necesitamos aplicar
contrastes específicos que tengan en cuenta esta circunstancia.
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23
pf24
pf25
pf26
pf27

Vista previa parcial del texto

¡Descarga tema 5 estadistica y más Apuntes en PDF de Estadística solo en Docsity!

DEPARTAMENTO DE ESTADÍSTICA Y ECONOMETRÍA

Estadística II

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho

TEMA 5: CONTRASTES DE HIPÓTESIS PARA LA LOCALIZACIÓN

DE DOS POBLACIONES

A. Morillas; M. Aguilar; E. Cruces; B. Díaz

5.1. Introducción 5.2. Contrastes para muestras independientes 5.2.1. Contrastes paramétricos 5.2.1.1. Contraste de la diferencia de medias en poblaciones normales 5.2.1.2. Contraste de la diferencia de proporciones 5.2.2. Contrastes no paramétricos: Wilcoxon-Mann-Whitney 5.3. Contrastes para muestras relacionadas (datos pareados) 5.3.1. Contraste de la diferencia de medias en poblaciones normales 5.3.2. Contrastes no paramétricos de localización para datos relacionados 5.3.2.1. Test del signo para datos relacionados 5.3.2.2. Test del rango signado para datos relacionados 5.4. Resolución de casos prácticos con ordenador

5.1. Introducción

Una vez estudiados en el tema anterior los contrastes de hipótesis para la localización de una población, ahora se verán los correspondientes test para comparar dos poblaciones, tanto en el caso de normalidad, como en poblaciones de distribución desconocida.

En la presentación de los contrastes distinguiremos dos casos. En primer lugar, supondremos que se extraen muestras independientes de cada una de las poblaciones implicadas. En segundo lugar, consideraremos que los datos se toman por parejas, estando las dos características observadas en cada población asociadas en alguna forma. Así, por ejemplo, podríamos estar interesados en contrastar si hay diferencia significativa entre las calificaciones obtenidas por los alumnos de un determinado Grado en las asignaturas de Estadística y Teoría Económica. Es evidente que si observamos las dos calificaciones de n alumnos seleccionados aleatoriamente, los datos de cada individuo no van a ser independientes, por lo que necesitamos aplicar contrastes específicos que tengan en cuenta esta circunstancia.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

5.2. Contrastes para muestras independientes

5.2.1. Contrastes paramétricos

5.2.1.1. Contraste de la diferencia de medias en poblaciones normales

Se consideran dos poblaciones normales X e Y independientes, de las cuales seleccionamos dos muestras aleatorias simples independientes de tamaño nx y ny, X 1 , X 2 ,...,Xnxe Y 1 , Y 2 ,...,Yny,

respectivamente.

A partir de un nivel de significación  dado queremos realizar uno de los siguientes contrastes:

Tabla 5.1. Contrastes sobre la diferencia de medias poblacionales Contraste bilateral

Contraste unilateral a la derecha

Contraste unilateral a la izquierda

1 x y 0

0 x y 0 H

H   

 

  :

: 1 0

0 0 :

:   

    

  x y

x y H

H 1 0

0 0 :

:   

    

  x y

x y H

H

Para llevar a cabo estos contrastes, se debe tener en cuenta si las varianzas poblacionales son o no conocidas, ya que de ello depende el estadístico de prueba a partir del cual se van a definir las correspondientes regiones críticas.

a) Verificación de la diferencia de medias, con varianzas poblacionales ࢞࣌ ૛^ y ࢟࣌ ૛ conocidas.

Dado que X ~N(  x , x) e Y~N(^ ^ y,^ y), siendo ambas poblaciones independientes, si

seleccionamos dos muestras aleatorias independientes de cada una de las poblaciones, la distribución de la diferencia de medias muestrales será también normal con los siguientes parámetros:

y

2 y x

2 x x y n n

X Y~N

^ 

Por tanto, bajo H 0 :^ x^ ^ y^  0 , el estadístico de prueba es:

( ,) ( ) ~N 01

n n

X Y

y

2 y x

2 x

0 ^ 

 

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Ejemplo 5.

Los ingresos del primer empleo de los licenciados en Economía en cualquier Universidad siguen una distribución normal con desviación típica de 3,8 miles de euros. Se toma una muestra aleatoria de 15 licenciados procedentes de la Universidad A, resultando que en su primer empleo los ingresos medios anuales fueron 12 mil euros. Otra muestra independiente de 12 licenciados de la Universidad B dio como resultado unos ingresos medios en el primer empleo de 13.200 euros. Se pide, con un nivel de confianza del 98%, contrastar la hipótesis de que las medias son iguales frente a la alternativa de que la media de la Universidad A es menor que la de la Universidad B.

Datos

X: Ingresos en el 1 er^ empleo para los titulados de la Universidad A (miles de €) Y: Ingresos en el 1 er^ empleo para los titulados de la Universidad B (miles de €)

X ~ N( μ x , σ x = 3,8) n (^) x = 15 x = 12 Y ~ N( μ y , σ y = 3,8) n (^) y = 12 y = 13,2 α = 0,

Solución:

Planteamos las hipótesis: : 0

1

0  

x y

x y H

H

Bajo H0 , el estadístico de prueba es: ( ,) ( ) ~N 01

n n

X Y 0

y

2 y x

2  (^) x ^ 

 

Y el valor observado en las muestras seleccionadas: -0,

12

38 15

38

12 - 13,2- 0 z obs (^22)  

 , ,

Región crítica: z obs  z 

z 0,02 = -2,

Dado que en este caso el valor observado pertenece a la región de aceptación (ya que -0,82>-2,05), con un nivel de significación del 2% se acepta H0, es decir, no se detectan diferencias significativas entre los salarios medios de los licenciados en Economía de ambas Universidades.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Ejemplo 5.1 (resuelto con Statgraphics)

Paso 1: Se selecciona Comparar/Dos muestras/Pruebas de Hipótesis en el menú principal:

Paso 2: Se cumplimentan los datos que solicita la ventana Pruebas de Hipótesis (Comparación), de acuerdo a la información suministrada por el ejemplo. En las casillas Sigma Muestra 1 y Sigma Muestra 2 se introducen las correspondientes varianzas (conocidas) de ambas poblaciones. Al aceptar esta información, aparece la ventana Opciones Prueba de Hipótesis, en la que se suministrará el resto de las condiciones del ejercicio: hipótesis alternativa y alfa, seleccionando la casilla Usar Prueba Z, puesto que se trabaja con varianzas conocidas. A su vez, dejaremos en blanco la casilla Asumir Sigmas Iguales.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

En la tabla 5.3 se recogen las regiones críticas para cada uno de los contrastes:

Tabla 5.3 Regiones críticas para la verificación de la diferencia de medias poblacionales (poblaciones normales e independientes y varianzas desconocidas e iguales) H 1 R. C. O. Rechazar H 0 si Representación gráfica x  y  0 Dos colas ࢚ ࢙࢈࢕ ࢚൒ (^) ૚ିࢻ/૛

o

x  y  0 Cola derecha

࢙࢈࢕ ࢚൒^ ૚ିࢻ

x  y  0 Cola izquierda

࢙࢈࢕ ࢚൑^ ࢻ

Ejemplo 5.

Un psicólogo industrial desea estudiar los efectos de la motivación en las ventas de una empresa en particular. De 24 nuevos vendedores a 12 se les va a pagar por hora de trabajo y a los otros 12 por comisión. Los 24 individuos fueron asignados de manera aleatoria a los dos grupos. Los datos siguientes presentan el volumen de ventas (en miles de €) logrado durante el primer mes de trabajo por cada uno de ellos.

Salario / hora 256 239 222 207 228 241 212 216 236 219 225 230 Comisión 224 254 273 285 237 277 261 228 234 225 232 245

Suponiendo normalidad y varianzas iguales en ambos grupos, ¿existe evidencia de que los incentivos a través de las comisiones producen un mayor volumen de ventas promedio a un nivel de significación del 5%?

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Datos

X: Volumen de ventas de los vendedores que cobran por hora (miles de €) Y: Volumen de ventas de los vendedores que cobran por comisión (miles de €)

X ~ N( μ x , σ ) Y ~ N( μ y , σ )

n x = n y = 12 x = 227,58 y = 247,92 ݏ௫= 13,31 ݏ௬= 20,63 α = 0,

Solución:

Planteamos : 0

: 0 1

0  

  x y

x y H

H  

 

Bajo H 0 definimos el siguiente estadístico de prueba: 0 ~ 2 1 1

  

nx n y

x y

P

t

n n

S

X Y 

tobs 

(^2222) 2 , , , n n

n s n s s x y

x x y y p   

 sp 328 , 77  18 , 13

Región crítica: t obs  t 

t (^) 0,05 = -1,

El valor observado pertenece a la región crítica (ya que -2,75<-1,717), de manera que con un nivel de significación del 5% se rechaza H0, es decir, podemos afirmar que el incentivo de las comisiones incrementa el volumen de ventas de los trabajadores.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Paso 4: Al aceptar la selección realizada en la ventana anterior, aparece una nueva titulada Tablas y Gráficos. Se procede a anular todas las selecciones por defecto y resaltamos, sin embargo, la llamada Comparación de Medias:

Paso 5: Al aceptar, aparecerán las soluciones con el diseño del contraste que viene por defecto, en cuanto a la formulación de la hipótesis alternativa y el nivel de significación del test. Estas son: hipótesis nula igual a 0, alternativa de dos colas y alfa del 5%. En este ejemplo no son válidas todas ellas, pues la alternativa es unilateral izquierda. Por tanto, se procede a cambiarlas activando la ventana Opciones de Comparación, con la tecla derecha del ratón y cambiando la selección de la hipótesis alternativa a Menor que. Se deja seleccionada la opción, por defecto, de Asumir Sigmas Iguales (supuesto de varianzas poblacionales desconocidas, pero iguales).

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Paso 6: Aceptando esta información, aparecerá el resultado del ejemplo:

Como puede comprobarse, este procedimiento también conduce al cálculo de intervalos de confianza (tanto para el caso de una como de dos variables) cuando se dan las observaciones obtenidas en la muestra. Recuérdese que, la opción Describir/Datos numéricos/Pruebas de Hipótesis suministra, también, dichos intervalos para el caso en que la información venga agregada, con los correspondientes estadísticos muestrales ya conocidos, y se plantee un contraste sobre el parámetro desconocido.

Por último, obsérvese que es posible contrastar si la hipótesis de igualdad de varianzas poblacionales, que se ha propuesto es aceptable, seleccionando en la ventana Tablas y Gráficos la opción Comparación de Desviaciones Estándar:

Como puede comprobarse, la prueba F para la igualdad de varianzas poblacionales, no puede rechazarse para el nivel de significación establecido.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Si tipificamos y estimamos la desviación estándar a partir de los valores muestrales, bajo H 0 definimos el siguiente estadístico de prueba:

  N 0 1 

n

p q n

p q

p -p Z (^) nx ny

y

y y x

x x

x y (^0) , ˆ ˆ ˆ ˆ

ˆ ˆ ,  

  (^) 

En el caso particular de que la hipótesis nula a contrastar sea la igualdad de las proporciones poblacionales (H 0 : px - py= 0), bajo H 0 se cumple que px=py=p, de manera que la expresión del estadístico a utilizar quedaría:

  N 0 1 

n

n

pq

p -p

n

pq n

pq

p -p 0 Z (^) nx ny

x y

x y

x y

ˆx ˆy ˆ ˆ , , 

Tampoco en este caso se conoce la proporción poblacional p, de manera que se va a estimar mediante el siguiente estimador combinado:

x y

x x y y n n

n p n p p 

En la tabla 5.5 se recogen las regiones críticas para cada uno de los contrastes:

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Tabla 5.5. Regiones críticas para la verificación de la diferencia de proporciones H 1 R. C. O. Rechazar H 0 si Representación gráfica px  py  0 Dos colas ࢠ࢙࢈࢕ ࢠ ൒૚ିࢻ/૛

o

ࢠ࢙࢈࢕ ࢠ ൑ࢻ/૛

px  py  0 Cola derecha

px  py  0 Cola izquierda

Ejemplo 5.

En la presentación de un nuevo modelo de iPhone, un dirigente de Apple afirma que la proporción de clientes satisfechos con el uso de este teléfono está muy por encima de la de los usuarios de terminales con sistema operativo Android, de Google. Para validar empíricamente esta afirmación, una revista especializada realiza dos encuestas independientes, mediante muestreo aleatorio simple. En la primera, sobre 400 usuarios de iPhone, resultó que 300 estaban satisfechos; en la segunda, sobre 600 de Android, eran 390 los usuarios satisfechos. Diga si el porcentaje de clientes de iPhone satisfechos es 5 puntos superior a los del sistema Android o si podría afirmarse, incluso, que la diferencia es mayor ( ߙൌ 0,05ሻ.

Datos

n (^) x  400 x 300 n (^) y  600 y 390 α = 0,

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Ejemplo 5.3 (resuelto con Statgraphics)

Paso 1: Se selecciona Comparar/Dos muestras/Pruebas de Hipótesis en el menú principal y, tras introducir los datos del ejemplo en la ventana Pruebas de Hipótesis (Comparación), se seleccionan las opciones del test en la ventana Opciones Prueba de Hipótesis. Aquí se especificarán la hipótesis alternativa, el alfa del contraste y activaremos la casilla Usar Prueba- Z:

Paso 2: Una vez especificadas las opciones, se pulsa el botón Aceptar y se obtiene el resultado del ejemplo:

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Ejemplo 5.

La proporción de unidades defectuosas en un lote de 100 unidades procedente del proveedor A es 0,04 y en un lote de 150 procedente del proveedor B es de 0,07. ¿Hay evidencia suficiente de que existen diferencias entre los dos proveedores a un nivel de significación del 2%?

Datos

n (^) x  100 pˆx 0 , 04 n^ y ^150 pˆy^0 ,^07 α = 0,

Solución:

Planteamos las hipótesis: H p p 0

H p p 0

1 x y

0 x y  

Bajo H 0 : N 0 1 

n

n

pq

p -p Z (^) nx ny

x y

x y ,

ˆˆ

0 , 058 100 150

ˆ ˆ ˆ^100 ·^0 ,^04150 ·^0 ,^07  

  

  x y

x x y y n n

n p n p p

0 , 994

150

1 100

1 0 , 058 · 0 , 942

0 , 04 0 , 07 

 

  

 

 zobs

Región crítica bilateral:

zobs ≤ z/2 Ó z obs ≥ z1-/

z α /2 = -2, Z (^) crítica z 1- α /2 = 2,

Dado que -2,33  -0,994  2,33, el valor observado pertenece a la región de aceptación y

con un nivel de significación del 2% podemos admitir que no existe diferencia entre la proporción de artículos defectuosos de ambos proveedores.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

5.2.2. Contrastes no paramétricos para muestras independientes: Wilcoxon-

Mann-Whitney.

El test de la suma de rangos, desarrollado por Wilcoxon en 1945, es una de las pruebas no paramétricas más potentes para verificar la hipótesis de que las distribuciones de probabilidad de dos poblaciones son iguales, formulada en contraposición a la hipótesis alternativa de que las dos poblaciones difieren sólo respecto a su localización. Los únicos supuestos son que ambas distribuciones son continuas e independientes. Por tanto, este contraste resulta de gran interés cuando queremos comparar dos poblaciones que no son normales. Además, puede ser aplicado tanto a variables cuantitativas como a datos ordinales.

Supongamos que disponemos de dos muestras aleatorias independientes de tamaños n 1 , (x 1 , x (^) 2,…, x n 1 ), y n 2 , (y (^) 1, y 2 ,…, y n 2 ), seleccionadas de dos poblaciones con funciones de probabilidad continuas f(x) y f(y), que tienen la misma forma pero pueden diferir en su localización.

Planteamos las siguientes hipótesis sobre las medianas^1 :

Tabla 5.6 Contrastes sobre la igualdad de medianas (muestras independientes) Contraste bilateral

Contraste unilateral a la derecha

Contraste unilateral a la izquierda 0 1 2 1 1 2

: :

H Me Me H Me Me

 

0 1 2 1 1 2

: :

H Me Me H Me Me

 

0 1 2 1 1 2

: :

H Me Me H Me Me

 

Si H 0 es cierta, entonces ambas muestras proceden de la misma población y pueden considerarse como una única muestra de tamaño n 1 +n 2. De esta forma, la aplicación del test se inicia combinando ambas muestras en una sola y ordenando los datos de la muestra resultante de menor a mayor, asignándoles el correspondiente rango, desde 1 hasta n 1 +n 2. Los empates se solucionan en la forma ya conocida, asignándole a cada uno de ellos el valor medio de los rangos correspondientes al grupo con valores iguales.

Se supone que n 1 n 2 y se denominan T 1 y T 2 a las sumas de los rangos en la muestra más pequeña y más grande, respectivamente. Si la hipótesis nula fuese cierta, los rangos medios de ambas muestras deberían estar equilibrados. En caso contrario, no sería razonable aceptar H 0 como válida.

El test utiliza T 1 (suma de rangos de la muestra más pequeña) como estadístico de prueba. La tabla elaborada por Wilcoxon recoge los valores críticos inferior (TL) y superior (TU) de este estadístico bajo H 0 , en función de los tamaños de las muestras y del nivel de significación del test.

De esta forma, la región crítica vendría dada por:

C: Tobs  TL ó Tobs ≥ TU

(^1) Puede decirse que el test de la suma de rangos es el equivalente no paramétrico del test t de Student sobre la diferencia de medias en poblaciones normales. Kruskal y Wallis generalizaron este test para comparar más de dos medianas, dando lugar a un análisis de la varianza no paramétrico de gran utilidad práctica.

Grado en Administración y Dirección de Empresas Grado en Marketing e Investigación de Mercados Doble Grado en Administración y Dirección de Empresas y Derecho A. Morillas; M. Aguilar; E. Cruces; B. Díaz

Dos años más tarde, en 1947, Mann y Whitney propusieron otro contraste equivalente al de la suma de rangos de Wilcoxon, de manera que también se conoce como contraste de Wilcoxon- Mann- Whitney. A pesar de que el cálculo manual de este test resulta algo más complicado que el de Wilcoxon, es el que ha prevalecido en la práctica y se incorpora en la mayoría de los paquetes estadísticos de ordenador. Por eso, aunque no entraremos en detalle en su formalización, sí lo utilizaremos e interpretaremos haciendo uso de las salidas del ordenador.

El test de Mann-Whitney se basa en la comparación, uno a uno, de los valores observados en ambas muestras. Si la hipótesis nula es cierta, el número de veces que las observaciones de la muestra 1 son de rango inferior a las de la muestra 2 (estadístico U 1 ) debería ser similar al número de veces que las observaciones de la muestra 2 son de rango inferior a las de la muestra 1 (estadístico U 2 ). Si hay mucho desequilibrio entre ambos estadísticos, no es plausible que la hipótesis nula sea cierta.

La relación exacta de estos estadísticos con los del test de Wilcoxon es la siguiente:

1 1 1 1 2 1 1 1 2

2 2 2 1 2 2 2 1 2

ሺ 1ሻ 0 2

ሺ 1ሻ 0 2

n n U n n T U n n

n n U n n T U n n

      

      

Es inmediato comprobar que U 1  U 2 n 1 ·n 2 , por lo que también se tiene que:

2 2 1 2 1 1 2

1 1 2 1 2 1 2

ሺ 1ሻ 0 2

ሺ 1ሻ 0 2

n n U T U n n

n n U T U n n

     

     

Se usa el más pequeño de los dos (Umenor) como estadístico de prueba, al que denominaremos U de Mann-Whitney.

Para cualquier tipo de hipótesis alternativa (bilateral o unilateral) la región crítica viene definida por la cola izquierda de este estadístico. A partir de las tablas elaboradas por Mann y Whitney para la función de distribución del estadístico U para distintos tamaños muestrales, se

calcula la probabilidad acumulada  0 :

 0 = P(U  Uobs )