
































Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: analisis de datos I, Profesor: jone datos, Carrera: Psicología, Universidad: UPV-EHU
Tipo: Apuntes
1 / 40
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!

































En los capítulos 13 al 18 hemos estudiado una serie de procedimientos estadísticos diseñados para analizar variables cuantitativas: la prueba T para contrastar hipótesis sobre medias o coe- ficientes de regresión, el estadístico F del análisis de varianza y de la prueba de Levene, etc. Todos ellos coinciden en una serie de características:
Estas tres características combinadas permiten agrupar estos procedimientos estadísticos en una gran familia de técnicas de análisis denominada contrastes paramétricos (o pruebas paramétri- cas , en terminología afín a la del SPSS). Son, sin duda, las técnicas estadísticas más frecuente- mente utilizadas por analistas e investigadores en todo tipo áreas científicas, pero su utilidad se ve reducida, fundamentalmente, por dos razones: por un lado, exigen el cumplimiento de al- gunos supuestos que en ocasiones pueden resultar demasiado exigentes; por otro, obligan a tra- bajar con unos niveles de medida que, especialmente en las ciencias sociales y de la salud, no siempre resulta fácil alcanzar. Afortunadamente, los contrastes paramétricos no son los únicos disponibles. Existen con- trastes que permiten poner a prueba hipótesis no referidas a parámetros poblacionales; existen también contrastes que no necesitan establecer supuestos exigentes sobre las poblaciones de donde se extraen las muestras; y existen, por último, contrastes que no necesitan trabajar con datos obtenidos con una escala de medida de intervalo o razón. Esta otra familia de contrastes se conoce con el nombre de contrastes no paramétricos (o pruebas no paramétricas ). Algunos autores utilizan el término no paramétricos para referirse únicamente a los con- trastes que no plantean hipótesis sobre parámetros y que se limitan a analizar las propiedades nominales u ordinales de los datos, y añaden el término de distribución libre para referirse a los contrastes que no necesitan establecer supuestos (o establecen supuestos poco exigentes, como simetría o continuidad) sobre las poblaciones originales de las que se extraen las mues- tras. Pero lo cierto es que el incumplimiento de cualquiera de las tres características señaladas al principio puede ser considerada suficiente para caracterizar a un contraste como no paramé- trico. De esta forma, podemos 1) utilizar la denominación genérica de no paramétricos para todos aquellos contrastes que no se ajustan a una cualquiera de las tres características de los contrastes paramétricos y, por tanto, 2) englobar en ese término genérico a los contrastes de distribución libre. Más allá del acuerdo que pueda existir sobre esta cuestión, poner el énfasis en el nivel de medida de los datos contribuye a simplificar notablemente la clasificación e identificación de
380 Capítulo 19
las distintas técnicas de análisis de datos. Por tanto, podemos 1) clasificar los contrastes de acuerdo con el tipo de datos que permiten analizar (independientemente del tipo de hipótesis que permitan contrastar e independientemente de los supuestos que sea necesario establecer) y 2) llamarlos, a todos ellos, no paramétricos siempre que no se ajusten a una cualquiera de las tres características de los contrastes paramétricos. Este capítulo ofrece una descripción de las técnicas de análisis que el SPSS clasifica como pruebas no paramétricas. Todas ellas pueden considerarse no paramétricas utilizando el cri- terio de que no plantean hipótesis sobre parámetros, o el de que analizan datos obtenidos con una escala de medida débil (o mejor, datos que, aun estando medidos con una escala de inter- valo o razón, se analizan aprovechando sólo sus propiedades nominales u ordinales); y muchas de ellas pueden considerarse de distribución libre utilizando el criterio de que no establecen supuestos demasiado exigentes sobre las poblaciones originales de donde se muestrea. Todas estas pruebas se encuentran en la opción Pruebas no paramétricas del menú Ana- lizar. Y aparecen ordenadas por el número de muestras que permiten analizar (el módulo Pruebas exactas incluye dos pruebas adicionales no incluidas en el módulo Base : la prueba de Jonckheere-Terpstra y la prueba de homogeneidad marginal ):
Prueba Chi-cuadrado para una muestra
La prueba chi-cuadrado para una muestra permite averiguar si la distribución empírica de una variable categórica se ajusta o no (se parece o no) a una determinada distribución teórica (uni- forme, binomial, multinomial, etc.). Esta hipótesis de ajuste, o mejor, de bondad de ajuste, se pone a prueba utilizando un estadístico originalmente propuesto por Pearson (1900; ver tam- bién Cochran, 1952) para comparar las frecuencias observadas o empíricas con las esperadas o teóricas de cada categoría, es decir, un estadístico diseñado para comparar las frecuencias de hecho obtenidas en una muestra concreta (frecuencias observadas: n (^) i ) con las frecuencias que deberíamos encontrar si la variable realmente siguiera la distribución teórica propuesta en la hipótesis nula (frecuencias esperadas: m (^) i ):
382 Capítulo 19
tener en cuenta que los valores que se introducen se interpretan como proporciones, no como frecuencias absolutas. Deben introducirse tantos valores como categorías: el SPSS divide cada valor por la suma de todos los valores. Así, por ejemplo, si una variable tiene dos categorías y se introducen los enteros 6 y 4, el SPSS interpreta que la frecuencia esperada de la primera categoría es 6/10 del número de casos válidos y que la frecuencia esperada de la segunda categoría es 4/10 del número de casos váli- dos. De esta forma, resulta fácil definir, por ejemplo, las frecuencias esperadas corres- pondientes a una distribución binomial o multinomial. El orden en el que se introducen los valores es muy importante, pues la secuencia introducida se hace corresponder con las categorías de la variable cuando éstas se en- cuentran ordenadas de forma ascendente.
El botón Opciones... permite obtener algunos estadísticos descriptivos y decidir qué trata- miento se desea dar a los valores perdidos:
do: Opciones que muestra la figura 19.2.
Figura 19.2. Subcuadro de diálogo Prueba Chi-cuadrado: Opciones.
Estadísticos. Las opciones de este recuadro permiten obtener algunos estadísticos descrip- tivos:
el valor mínimo y el valor máximo.
Conviene señalar que estos estadísticos no siempre tendrán sentido, pues la prueba chi-cuadrado se utiliza generalmente con variables categóricas. Para contrastar la hi- pótesis de bondad de ajuste con variables cuantitativas es preferible utilizar la prueba de Kolmogorov-Smirnov.
Valores perdidos. Este recuadro permite decidir qué tratamiento se desea dar a los valores perdidos en el caso de que se haya seleccionado más de una variable:
perdido en la variable que se está contrastando. Es la opción por defecto.
casos con algún valor perdido en cualquiera de las variables seleccionadas.
Pruebas no paramétricas 383
Nivel educativo 474 13,49 2,88 8 21 12,00 12,00 15,
N Media
Desviación típica Mínimo Máximo 25
50 (Mediana) 75
Percentiles
53 47,4 5, 190 47,4 142, 6 47,4 -41, 116 47,4 68, 59 47,4 11, 11 47,4 -36, 9 47,4 -38, 27 47,4 -20, 2 47,4 -45, 1 47,4 -46, 474
8 12 14 15 16 17 18 19 20 21 Total
N observado
N esperado Residual
Este ejemplo muestra cómo utilizar la prueba chi-cuadrado para contrastar la hipótesis de bon- dad de ajuste con una muestra (una variable). Para ello, vamos a utilizar la variable educ (nivel educativo) con intención de averiguar si las frecuencias de las categorías de esa variable se ajustan a una distribución uniforme:
riable educ (nivel educativo) y trasladarla, mediante el botón flecha, a la lista Con- trastar variables.
Aceptando estas elecciones, el Visor ofrece los resultados que muestran las tablas 19.1, 19. y 19.3. La tabla 19.1 recoge la información descriptiva solicitada al marcar las opciones Descrip- tivos y Cuartiles : tenemos una muestra de 474 casos, con un promedio de años de formación académica de 13,49 y una desviación típica de 2,88, y con un rango de valores (años) que osci- la entre 8 y 21. Los cuartiles indican, por ejemplo, que la mitad de los sujetos tiene al menos 12 años de estudios y que el 25 % de los sujetos tiene más de 15 años de estudios.
Tabla 19.1. Estadísticos descriptivos.
La segunda tabla de resultados (tabla 19.2) contiene las frecuencias observadas y las esperadas, así como las diferencias entre ambas ( residual ).
Tabla 19.2. Frecuencias observadas y esperadas.
La tabla 19.3, por último, ofrece la información necesaria para tomar una decisión sobre la hipótesis de bondad de ajuste: el valor del estadístico chi-cuadrado (724,692), sus grados de libertad ( gl = número de categorías menos uno) y su nivel crítico ( Sig. = 0,000). Puesto que el
Pruebas no paramétricas 385
Para obtener la prueba binomial :
acceder al cuadro de diálogo Prueba binomial que muestra la figura 19.3.
Figura 19.3. Cuadro de diálogo Prueba binomial.
La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para obtener la prueba binomial :
de una variable, el SPSS ofrece un contraste por cada variable seleccionada.
Definir dicotomía. Las opciones de este recuadro permiten definir qué valores de la variable seleccionada van a utilizarse como categorías:
cosas como están, es decir, deja que sean los propios valores de la variable los que de- finan la dicotomía. En ese caso, la hipótesis que permite contrastar la prueba binomial es si la proporción observada en la primera categoría se ajusta (se parece) a la propor- ción teórica propuesta en Contrastar proporción.
zarla. Para ello, debe indicarse el valor concreto que se utilizará para efectuar el corte: los valores menores o iguales que el punto de corte constituyen el primer grupo y los valores mayores el segundo. Esta opción es extremadamente útil cuando lo que interesa es contrastar hipótesis sobre la mediana o sobre algún otro cuantil. Es decir, esta opción permite obtener los contrastes conocidos en la literatura estadística como prueba de los signos y prueba de los cuantiles (Ver San Martín y Pardo, 1989, págs 91-97). Si queremos contrastar, por ejemplo, la hipótesis de que la mediana del salario inicial es 25.000 dólares ( prue- ba de los signos ), podemos utilizar el valor 25.000 como Punto de corte y 0,5 (la pro- porción de casos acumulados hasta la mediana) como valor del contraste en Contras- tar proporción. O si queremos contrastar la hipótesis de que el centil 80 del salario inicial vale 40.000 dólares ( prueba de los cuantiles ), podemos utilizar 40.000 como Punto de corte y 0,80 (la proporción de casos acumulados hasta el centil 80) como valor del contraste en la caja Contrastar proporción.
386 Capítulo 19
Así pues, las opciones del recuadro Definir dicotomía permiten decidir, entre otras cosas, qué tipo de contraste se desea llevar a cabo: sobre una proporción (si la variable es dicotó- mica) o sobre la mediana o cualquier otro cuantil (si la variable es al menos ordinal).
Contrastar proporción. Esta caja permite especificar el valor poblacional propuesto en la hipótesis nula. Por defecto, se asume que la variable dicotómica seleccionada sigue el modelo de distribución de probabilidad binomial con π = 0,5. Pero este valor de prueba puede cam- biarse introduciendo un valor entre 0,001 y 0,999.
De las dos categorías de la variable dicotómica, la primera (aquella a la que corresponde el có- digo menor) es la que se toma como categoría de referencia. Teniendo esto en cuenta:
El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos
Este ejemplo muestra cómo utilizar la prueba binomial para contrastar la hipótesis de bondad de ajuste referida a una variable dicotómica. Para ello, vamos a utilizar la variable minoría (clasificación étnica). Si suponemos que el 70 % de los habitantes de EEUU es de raza blanca, puede resultar interesante averiguar si ese porcentaje se mantiene en la entidad bancaria a la que se refiere el archivo Datos de empleados. Para ello:
noría (clasificación étnica) y trasladarla, mediante el botón flecha, a la lista Contras- tar variables.
prueba.
del recuadro Definir dicotomía.
388 Capítulo 19
queño como para poder rechazar la hipótesis de independencia (o aleatoriedad) entre las obser- vaciones. Para obtener el número de rachas es necesario que las observaciones estén clasificadas en dos grupos exhaustivos y mutuamente exclusivos (variable dicotómica). Si no lo están, debe- remos utilizar algún criterio (mediana, media, moda, etc.) para hacer que lo estén. Una vez clasificadas las n observaciones en dos grupos (de tamaños n 1 y n 2 ), el SPSS utiliza una tipificación*^ del número de rachas ( R ) para contrastar la hipótesis de aleatoriedad o independencia:
donde: y. El estadístico Z se dis- tribuye según el modelo de probabilidad normal N (0, 1). El SPSS ofrece el nivel crítico bilate- ral resultante de multiplicar por 2 la probabilidad de encontrar un número de rachas igual o menor que el encontrado (si R < E ( R )), o un número de rachas igual o mayor que el encontrado (si R > E ( R )).
Para obtener la prueba de las rachas :
ceder al cuadro de diálogo Prueba de las rachas que muestra la figura 19.4.
Figura 19.4. Cuadro de diálogo Prueba de las rachas.
Pruebas no paramétricas 389
$15,000. 212 262 474 150 -7, ,
Valor de prueba a Casos < Valor de prueba Casos >= Valor de prueba Casos en total Número de rachas Z Sig. asintót. (bilateral)
Salario inicial
a.Mediana
La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para contrastar la hipótesis de aleatoriedad o independencia referida a una variable:
riable, el SPSS ofrece un contraste por cada variable seleccionada.
Punto de corte. Recordemos que para obtener el número de rachas es necesario que las obser- vaciones estén clasificadas en dos grupos. Si no lo están, debemos utilizar algún criterio para hacer que lo estén. Si se desea contrastar la hipótesis de independencia referida a una variable cuantitativa , podemos utilizar como criterio de dicotomización (como punto de corte) la Me- diana , la Moda o la Media. En ese caso, los valores más pequeños que el punto de corte pasan a formar parte del primer grupo y los valores iguales o mayores que el punto de corte pasan a formar parte del segundo grupo. Si se desea contrastar la hipótesis de independencia referida a una variable categórica puede utilizarse como punto de corte la opción Personalizado. Si la variable es, por ejemplo, dicotómica, con códigos 0 y 1, podemos utilizar como punto de corte el valor 0,5 (o cualquier otro comprendido entre 0 y 1, incluido el 1), de modo que los casos con código 0 pasen a formar parte del primer grupo y los casos con valor 1 pasen a for- mar parte del segundo grupo.
El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos.
Este ejemplo muestra cómo utilizar la prueba de las rachas para contrastar la hipótesis de inde- pendencia referida a la variable salario inicial.
salario inicial y trasladarla, mediante el botón flecha, a la lista Contrastar variables.
variable utilizando como criterio la mediana.
Aceptando estas elecciones, el Visor ofrece los resultados que muestra la tabla 19.5. La tabla comienza indicando el punto de corte utilizado para la dicotomización: Valor de prueba = 15.000. Una llamada de nota a pie de tabla nos recuerda que ese punto de corte es la mediana.
Tabla 19.5. Prueba de las rachas.
Pruebas no paramétricas 391
Figura 19.5. Cuadro de diálogo Prueba de Kolmogorov-Smirnov para una muestra.
La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para contrastar la hipótesis de bondad de ajuste referida a una variable:
riable, el SPSS ofrece un contraste por cada variable seleccionada.
Distribución de contraste. Las opciones de este apartado permiten elegir la distribución teóri- ca a la cual se desea ajustar la distribución empírica de la variable seleccionada: Normal , Uni- forme , Poisson y Exponencial (puede seleccionarse más de una). Los parámetros de las dife- rentes distribuciones se estiman a partir de los datos. No es posible obtener el ajuste a una dis- tribución normal si la varianza de la variable vale cero. Ni a una distribución de Poisson si la media de la variable vale cero o los valores no son, todos ellos, enteros no negativos.
El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos.
Este ejemplo muestra cómo utilizar la prueba de Kolmogorov-Smirnov para contrastar la hipó- tesis de normalidad (ajuste a la distribución normal) referida a la variable salario inicial :
la variable salario inicial y trasladarla a la lista Contrastar variables.
tuar el ajuste a la distribución normal.
Aceptando estas elecciones, el Visor ofrece los resultados que muestran la tabla 19.5. La tabla ofrece, en primer lugar, el número de casos válidos y los parámetros de la distribución selec- cionada, es decir, de la distribución normal ( Media y Desviación típica ). A continuación ofrece las diferencias más extremas entre las frecuencias acumuladas empíricas y teóricas (la más grande de las positivas, la más pequeña de las negativas y la más grande de las dos en valor absoluto). Por último, ofrece el estadístico de K-S ( Z = 5,484) y su nivel crítico ( Significación
392 Capítulo 19
474 $17,016. $7,870. , , -, 5,
,
N Media Desviación típica
Parámetros normales a,b
Absoluta Positiva Negativa
Diferencias más extremas
Z de Kolmogorov-Smirnov
Sig. asintót. (bilateral)
Salario inicial
a.La distribución de contraste es la Normal. b.Se han calculado a partir de los datos.
asintótica bilateral = 0,000). Puesto que el valor del nivel crítico es muy pequeño (menor que 0,05), rechazanos la hipótesis de normalidad y concluimos que las puntuaciones de la variable salario inicial no se ajustan a una distribución normal.
Tabla 19.6. Prueba de Kolmogorov-Smirnov para una muestra.
Este procedimiento contiene varias pruebas no paramétricas, todas ellas diseñadas para analizar datos provenientes de diseños con una variable independiente categórica (con dos niveles que definen dos grupos o muestras) y una variable dependiente cuantitativa al menos ordinal (en la cual interesa comparar los dos grupos o muestras). El procedimiento incluye cuatro pruebas: la prueba U de Mann-Whitney, la prueba de Kol- mogorov-Smirnov para dos muestras, la prueba de reacciones extremas de Moses y la prueba de las rachas de Wald-Wolfowitz. Para obtener cualquiera de ellas:
Analizar para acceder al cuadro de diálogo Pruebas para dos muestras independientes que muestra la figura 19.6.
Figura 19.6. Cuadro de diálogo Pruebas para dos muestras independientes.
394 Capítulo 19
ciones y, como si se tratara de una sola muestra, asignamos rangos R (^) i a las n puntuaciones (un 1 a la más pequeña, un 2 a la más pequeña de las restantes, ..., un n a la más grande; resol- viendo los empates asignando el rango promedio), tendremos n 1 rangos R (^) i 1 (los n 1 rangos co- rrespondientes a las observaciones de la muestra Y 1 ) y n 2 rangos R (^) i 2 (los n 2 rangos correspon- dientes a las observaciones de la muestra Y 2 ). Consideremos ahora, entre los múltiples estadísticos que podríamos definir en una situa- ción como ésta, los estadísticos S 1 = “suma de los rangos asignados a la muestra 1” y S 2 = “su- ma de los rangos asignados a la muestra 2”. El estadístico U adopta la siguiente forma en cada grupo:
Puesto que suponemos que las dos muestras se han extraído de dos poblaciones idénticas, cabe esperar que U 1 y U 2 sean aproximadamente iguales (excepto en la cantidad atribuible a las fluc- tuaciones propias del azar muestral). Si U 1 y U 2 son muy distintos, existirá cierta evidencia de que las muestras proceden de poblaciones distintas. Por tanto, la hipótesis nula de que ambos promedios poblacionales son iguales podría rechazarse si U 1 (o U 2 ) es demasiado grande o demasiado pequeño. Para determinar esto último, podemos basar nuestra decisión en la probabilidad concreta asociada al estadístico U : U = U 1 si U 1 < n 1 n 2 / U = U 2 si U 1 > n 1 n 2 /
Con muestras pequeñas ( n <_ 30) el SPSS ofrece el nivel crítico bilateral exacto asociado al esta- dístico U , el cual se obtiene multiplicando por 2 la probabilidad de obtener valores menores o iguales que U (esta probabilidad se calcula utilizando el algoritmo de Dineen y Blakesley, 1973). Con muestras grandes ( n > 30), el SPSS ofrece una tipificación*^ del estadístico U (inclu- yendo corrección por empates) que se distribuye aproximadamente N (0, 1):
( k se refiere al número de rangos distintos en los que existen empates y ti al número de puntua- ciones empatadas en el rango i ). El nivel crítico bilateral se obtiene multiplicando por 2 la pro- babilidad de obtener valores menores o iguales que Z.
Pruebas no paramétricas 395
Prueba de reacciones extremas de Moses
Esta prueba sirve para estudiar si existe diferencia en el grado de dispersión o variabilidad de dos distribuciones. Aunque hasta ahora hemos hablado de la heterogeneidad de varianzas como de algo rela- cionado con la prueba T sobre diferencia de medias y, por tanto, como algo poco deseable, lo cierto es que la heterogeneidad de varianzas puede constituir, ella misma, un resultado expe- rimental relevante. Esto significa que, en ocasiones, el estudio de la variabilidad puede ser un fin en sí misma y no sólo un paso previo para la comparación de medias (ver, por ejemplo, Bryk y Raudenbush, 1988). Supongamos que deseamos evaluar el nivel de desarrollo cognitivo alcanzado por dos gru- pos de niños que han seguido programas educativos distintos. Si estamos interesados simple- mente en constatar cuál de los dos grupos ha alcanzado, en promedio, mayor nivel de desarro- llo, podemos limitarnos a comparar los promedios de ambos grupos con alguno de los procedi- mientos (paramétricos o no paramétricos) ya estudiados. Pero esta forma de proceder pasaría por alto una cuestión de gran importancia: podría ocurrir que uno de los métodos educativos consiguiera incrementar el nivel de desarrollo de los niños de forma generalizada (todos los niños mejoran su nivel de desarrollo) y que el otro método educativo consiguiera el mismo ob- jetivo con sólo unos pocos niños, aunque de forma más marcada, o podría ocurrir que consi- guiera incrementar mucho el nivel de desarrollo de unos niños y muy poco el de otros (reac- ciones extremas). Estas diferencias entre métodos no quedarían reflejadas en las medias, pero sí en la variabilidad, por lo que sólo acompañando el contraste de medias con un contraste de varianzas podríamos obtener información real sobre lo que está ocurriendo. Existen diferentes procedimientos para contrastar la hipótesis de que dos varianzas pobla- cionales son iguales. Ya hemos estudiado (ver capítulo 11 sobre Análisis exploratorio ) uno de los más utilizados, debido a Levene (1960); pero es un procedimiento paramétrico. Moses (1952) ha diseñado un método no paramétrico que puede utilizarse con variables ordinales. Consideremos dos muestras ( c = control y e = experimental ) extraídas aleatoriamente de la misma población o de dos poblaciones idénticas. Para obtener el estadístico de Moses se co- mienza ordenando las n = n (^) c + n (^) e observaciones de forma ascendente y asignándoles, como si se tratara de una única muestra, rangos de 1 a n : un 1 a la más pequeña, un 2 a la más pequeña de las restantes, etc. (los empates se resuelven asignando el rango medio). A continuación se calcula la amplitud del grupo control ( A (^) c ) restando los rangos correspondientes al valor más grande y más pequeño de ese grupo y sumando 1 a esa diferencia; el resultado se redondea al entero más próximo (el SPSS considera que el grupo control es el grupo con el código menor). Dado que la amplitud es una medida de dispersión muy inestable, Moses sugiere utilizar al amplitud recortada ( A (^) r ). Para ello, se fija un valor pequeño ( r ) y se calcula la amplitud tras descartar r valores del grupo control por arriba y por abajo (2 r valores en total). La amplitud recortada se obtiene restando los rangos correspondientes al valor más grande y al más pequeño del grupo control tras eliminar del cómputo los r valores más grandes y los r valores más pe- queños de ese grupo; y, por supuesto, sumando 1 a esa diferencia y redondeando al entero más próximo. Es evidente que A (^) r no puede ser menor que n (^) c –2 r (ni mayor que n –2 r ). Además, si en el grupo experimental se han producido reacciones extremas, la amplitud del grupo control ten- derá a su valor mínimo, pues habrá pocas observaciones del grupo experimental entremez-
Pruebas no paramétricas 397
Prueba de las rachas de Wald-Wolfowitz
La prueba de las rachas para dos muestras independientes (Wald y Wolfowitz, 1940) es similar a la prueba de las rachas para una muestra ya estudiada en este mismo capítulo. Referida a dos muestras independientes, permite contrastar la hipótesis de que ambas muestras proceden de la misma población. Al igual que la prueba de Kolmogorov-Smirnov, es sensible no sólo a dife- rencias entre los promedios poblaciones, sino a diferencias en variabilidad, simetría, etc. Para obtener el número de rachas, se ordenan de menor a mayor las n = n 1 + n 2 observacio- nes de ambas muestras como si se tratara de una sola muestra. Ordenadas las puntuaciones, el número de rachas ( R ) se obtiene contando el número de secuencias de observaciones pertene- cientes al mismo grupo. Si existen empates entre observaciones de muestras distintas, el SPSS calcula tanto el número mínimo de rachas como el máximo. Si las dos muestras proceden de la misma población, las observaciones de ambas muestras estarán entremezcladas y el número de rachas será alto. Por el contrario, si las muestras pro- ceden de poblaciones distintas, una de ellas tendrá valores más altos que la otra y, al ordenar las observaciones, no estarán tan entremezcladas. Así pues, un número alto de rachas indica que las muestras proceden de la misma población y un número bajo de rachas indica que las muestras proceden de poblaciones distintas. Para decidir cuándo el número de rachas encontrado es lo bastante pequeño como para re- chazar la hipótesis de que las muestras proceden de la misma población, el SPSS utiliza dos estrategias distintas dependiendo del tamaño de las muestras. Si n > 30, utiliza la aproximación normal (ver, en este mismo capítulo, el estadístico Z descrito en el apartado Prueba de las ra- chas ); pero a diferencia de lo que ocurre con el estadístico Z para una muestra, aquí se utiliza un nivel crítico unilateral: la probabilidad de obtener un número de rachas igual o menor que el obtenido. Si n <_ 30, el SPSS ofrece el nivel crítico unilateral exacto. Para ello, si el número de rachas R es par, utiliza la siguiente ecuación:
Y si el número de rachas R es impar ( k = 2 r –1):
En ambos casos se está haciendo referencia a la probabilidad de obtener un número de rachas igual o menor que el encontrado. Se rechaza la hipótesis nula de que las muestras proceden de la misma población cuando la probabilidad obtenida es menor que, generalmente, 0,05.
398 Capítulo 19
Salario inicial
370 249,14 92180, 104 196,10 20394, 474
Clasificación étnica No Sí Total
N
Rango promedio
Suma de rangos
14934, 20394, -3, ,
U de Mann-Whitney W de Wilcoxon Z Sig. asintót. (bilateral)
Salario inicial
Este ejemplo muestra cómo obtener e interpretar todas las pruebas incluidas en el procedimien- to Pruebas no paramétricas > Dos muestras independientes :
seleccionar la variable salini (salario inicial) y trasladarla a la lista Contrastar varia- bles.
de agrupación.
independientes: Definir grupos que muestra la figura 19.7, e introducir los códigos 0 y 1 (que son los códigos que definen los dos grupos de la variable minoría ).
Aceptando estas elecciones, el Visor ofrece los resultados que muestran las tablas 19.7 a la 19.11. La primera de ellas (tabla 19.7) ofrece el tamaño de cada grupo, el rango promedio que resulta de la asignación de rangos a cada grupo y la suma de esos rangos.
Tabla 19.7. Rangos.
La tabla 19.8 ofrece el estadístico U de Mann-Whitney (también ofrece el estadístico W de Wil- coxon , que es una versión equivalente del estadístico U ; ver Pardo y San Martín, 1994, págs. 424-427). La tipificación de ambos vale Z = –3,495. Y el nivel crítico bilateral ( Significación asintótica bilateral ) vale 0,000. Por tanto, podemos rechazar la hipótesis de igualdad de prome- dios y concluir que los grupos definidos por la variable minoría proceden de poblaciones con distinto promedio.
Tabla 19.8. Prueba de Mann-Whitney.
La tabla 19.9. contiene la prueba de reacciones extremas de Moses. Por supuesto, la variable minoría no parece del todo apropiada para utilizar la prueba de Moses, pero, puesto que se trata de un ejemplo, nos sirve para poder interpretar la información que ofrece el Visor. La tabla re- coge, en primer lugar, la amplitud del grupo control ( N = 467) y la probabilidad de obtener una amplitud como esa o menor ( Significación unilateral = 0,000). A continuación muestra la am- plitud recortada ( N = 434) y la probabilidad de obtener una amplitud como esa o menor ( Signi-