Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

Por cada documento subido

Responde a las preguntas

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

analisis no parametricos, Apuntes de Psicología

Universidad del País Vasco / Euskal Herriko Unibertsitatea Psicología

Prof. Jone Datos

Asignatura: analisis de datos I, Profesor: jone datos, Carrera: Psicología, Universidad: UPV-EHU

Tipo: Apuntes

2014/2015

Subido el 18/10/2015

trinidad.gigena 🇪🇸

3.7

(111)

62 documentos

1 / 40

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1

Capítulo 19

Análisis no paramétrico

El procedimiento Pruebas no paramétricas

En los capítulos 13 al 18 hemos estudiado una serie de procedimientos estadísticos diseñados

para analizar variables cuantitativas: la prueba T para contrastar hipótesis sobre medias o coe-

ficientes de regresión, el estadístico F del análisis de varianza y de la prueba de Levene, etc.

Todos ellos coinciden en una serie de características:

1. Permiten contrastar hipótesis referidas a algún parámetro (µ, σ2, ρ, β, etc.).

2. Exigen el cumplimiento de determinados supuestos sobre las poblaciones originales

de las que se extraen los datos (generalmente normalidad y homocedasticidad).

3. Analizan datos obtenidos con una escala de medida de intervalo o razón.

Estas tres características combinadas permiten agrupar estos procedimientos estadísticos en una

gran familia de técnicas de análisis denominada contrastes paramétricos (o pruebas paramétri-

cas, en terminología afín a la del SPSS). Son, sin duda, las técnicas estadísticas más frecuente-

mente utilizadas por analistas e investigadores en todo tipo áreas científicas, pero su utilidad

se ve reducida, fundamentalmente, por dos razones: por un lado, exigen el cumplimiento de al-

gunos supuestos que en ocasio nes pueden resultar demasiado exigentes; por otro, obligan a tra-

bajar con unos niveles de medida que, especialmente en las ciencias sociales y de la salud, no

siempre resulta fácil alcanzar.

Afortunadamente, los cont rastes paramétricos no son los únicos di sponibles. Existen con-

trastes que permiten poner a prueba hipótesis no referidas a parámetros poblacionales; existen

también contrastes que no necesitan establecer supuestos exigentes sobre las poblaciones de

donde se extraen las muestras; y existen, por último, contrastes que no necesitan trabajar con

datos obtenidos con una escala de medida de intervalo o razón. Esta otra familia de contrastes

se conoce con el nombre de contrastes no paramétricos (o pruebas no paramétricas).

Algunos autores utilizan el término no paramétricos para referirse únicamente a los con-

trastes que no plantean hipótesis sobre parámetros y que se limitan a analizar las propiedades

nominales u ordinales de los datos, y añaden el término de distribución libre para referirse a

los contrastes que no necesitan establecer supuestos (o establecen supuestos poco exigentes,

como simetría o continuidad) sobre las poblaciones originales de las que se extraen las mues-

tras. Pero lo cierto es que el incumplimiento de cualquiera de las tres características señaladas

al principio puede ser considerada suficiente para caracterizar a un contraste como no paramé-

trico. De esta forma, podemos 1) utilizar la denominación genérica de no paramétricos para

todos aquellos contrastes que no se ajustan a una cualquiera de las tres características de los

contrastes paramétricos y, por tanto, 2) englobar en ese término genérico a los contrastes de

distribución libre.

Más allá del acuerdo que pueda existir sobre esta cuestión, poner el énfasis en el nivel de

medida de los datos contribuye a simplificar notablemente la clasificación e identificación de

pf3

pf4

pf5

pf8

pf9

pfa

pfd

pfe

pff

pf12

pf13

pf14

pf15

pf16

pf17

pf18

pf19

pf1a

pf1b

pf1c

pf1d

pf1e

pf1f

pf20

pf21

pf22

pf23

pf24

pf25

pf26

pf27

pf28

Descubre Apuntes de Psicología Universidad del País Vasco / Euskal Herriko Unibertsitatea

Documentos relacionados

pruebas de significaion

(3)

4.4 Parte básica 4.4.1 Introducción a los contrastes de hipótesis 4.4.2 Conceptos básicos

(2)

introduccion al spss

distribucion normal

(1)

Varianza, media y otros parámetros estadísticos

(3)

(8)

(1)

Análisis de datos para diseños de dos grupos

(9)

Validez de la investigacion. Conclucion estadistica, interna, constructo y externa

(2)

Análisis de regresión lineal: conceptos y procedimiento - Prof. Datos

(2)

Diseños de investigación y análisis de datos

(4)

Vista previa parcial del texto

¡Descarga analisis no parametricos y más Apuntes en PDF de Psicología solo en Docsity!

Capítulo 19

Análisis no paramétrico

El procedimiento Pruebas no paramétricas

En los capítulos 13 al 18 hemos estudiado una serie de procedimientos estadísticos diseñados para analizar variables cuantitativas: la prueba T para contrastar hipótesis sobre medias o coe- ficientes de regresión, el estadístico F del análisis de varianza y de la prueba de Levene, etc. Todos ellos coinciden en una serie de características:

Permiten contrastar hipótesis referidas a algún parámetro (μ, σ^2 , ρ, β, etc.).
Exigen el cumplimiento de determinados supuestos sobre las poblaciones originales de las que se extraen los datos (generalmente normalidad y homocedasticidad).
Analizan datos obtenidos con una escala de medida de intervalo o razón.

Estas tres características combinadas permiten agrupar estos procedimientos estadísticos en una gran familia de técnicas de análisis denominada contrastes paramétricos (o pruebas paramétri- cas , en terminología afín a la del SPSS). Son, sin duda, las técnicas estadísticas más frecuente- mente utilizadas por analistas e investigadores en todo tipo áreas científicas, pero su utilidad se ve reducida, fundamentalmente, por dos razones: por un lado, exigen el cumplimiento de al- gunos supuestos que en ocasiones pueden resultar demasiado exigentes; por otro, obligan a tra- bajar con unos niveles de medida que, especialmente en las ciencias sociales y de la salud, no siempre resulta fácil alcanzar. Afortunadamente, los contrastes paramétricos no son los únicos disponibles. Existen con- trastes que permiten poner a prueba hipótesis no referidas a parámetros poblacionales; existen también contrastes que no necesitan establecer supuestos exigentes sobre las poblaciones de donde se extraen las muestras; y existen, por último, contrastes que no necesitan trabajar con datos obtenidos con una escala de medida de intervalo o razón. Esta otra familia de contrastes se conoce con el nombre de contrastes no paramétricos (o pruebas no paramétricas ). Algunos autores utilizan el término no paramétricos para referirse únicamente a los con- trastes que no plantean hipótesis sobre parámetros y que se limitan a analizar las propiedades nominales u ordinales de los datos, y añaden el término de distribución libre para referirse a los contrastes que no necesitan establecer supuestos (o establecen supuestos poco exigentes, como simetría o continuidad) sobre las poblaciones originales de las que se extraen las mues- tras. Pero lo cierto es que el incumplimiento de cualquiera de las tres características señaladas al principio puede ser considerada suficiente para caracterizar a un contraste como no paramé- trico. De esta forma, podemos 1) utilizar la denominación genérica de no paramétricos para todos aquellos contrastes que no se ajustan a una cualquiera de las tres características de los contrastes paramétricos y, por tanto, 2) englobar en ese término genérico a los contrastes de distribución libre. Más allá del acuerdo que pueda existir sobre esta cuestión, poner el énfasis en el nivel de medida de los datos contribuye a simplificar notablemente la clasificación e identificación de

380 Capítulo 19

las distintas técnicas de análisis de datos. Por tanto, podemos 1) clasificar los contrastes de acuerdo con el tipo de datos que permiten analizar (independientemente del tipo de hipótesis que permitan contrastar e independientemente de los supuestos que sea necesario establecer) y 2) llamarlos, a todos ellos, no paramétricos siempre que no se ajusten a una cualquiera de las tres características de los contrastes paramétricos. Este capítulo ofrece una descripción de las técnicas de análisis que el SPSS clasifica como pruebas no paramétricas. Todas ellas pueden considerarse no paramétricas utilizando el cri- terio de que no plantean hipótesis sobre parámetros, o el de que analizan datos obtenidos con una escala de medida débil (o mejor, datos que, aun estando medidos con una escala de inter- valo o razón, se analizan aprovechando sólo sus propiedades nominales u ordinales); y muchas de ellas pueden considerarse de distribución libre utilizando el criterio de que no establecen supuestos demasiado exigentes sobre las poblaciones originales de donde se muestrea. Todas estas pruebas se encuentran en la opción Pruebas no paramétricas del menú Ana- lizar. Y aparecen ordenadas por el número de muestras que permiten analizar (el módulo Pruebas exactas incluye dos pruebas adicionales no incluidas en el módulo Base : la prueba de Jonckheere-Terpstra y la prueba de homogeneidad marginal ):

Pruebas para una muestra : Chi-cuadrado (bondad de ajuste con variables categóricas), Binomial (proporciones y cuantiles), Rachas (aleatoriedad) y Kolmogorov-Smirnov (bondad de ajuste con variables cuantitativas).
Pruebas para dos muestras independientes : U de Mann-Whitney , Kolmogorov-Smirnov , Reacciones extremas de Moses y Rachas de Wald-Wolfowitz.
Pruebas para varias muestras independientes : H de Kruskal-Wallis y Mediana.
Pruebas para dos muestras relacionadas : Wilcoxon , Signos y McNemar.
Pruebas para varias muestras relacionadas : Friedman , W de Kendall y Q de Cochran.

Pruebas para una muestra

Prueba Chi-cuadrado para una muestra

La prueba chi-cuadrado para una muestra permite averiguar si la distribución empírica de una variable categórica se ajusta o no (se parece o no) a una determinada distribución teórica (uni- forme, binomial, multinomial, etc.). Esta hipótesis de ajuste, o mejor, de bondad de ajuste, se pone a prueba utilizando un estadístico originalmente propuesto por Pearson (1900; ver tam- bién Cochran, 1952) para comparar las frecuencias observadas o empíricas con las esperadas o teóricas de cada categoría, es decir, un estadístico diseñado para comparar las frecuencias de hecho obtenidas en una muestra concreta (frecuencias observadas: n (^) i ) con las frecuencias que deberíamos encontrar si la variable realmente siguiera la distribución teórica propuesta en la hipótesis nula (frecuencias esperadas: m (^) i ):

382 Capítulo 19

F Valores. Esta opción permite definir frecuencias esperadas concretas. Es importante

tener en cuenta que los valores que se introducen se interpretan como proporciones, no como frecuencias absolutas. Deben introducirse tantos valores como categorías: el SPSS divide cada valor por la suma de todos los valores. Así, por ejemplo, si una variable tiene dos categorías y se introducen los enteros 6 y 4, el SPSS interpreta que la frecuencia esperada de la primera categoría es 6/10 del número de casos válidos y que la frecuencia esperada de la segunda categoría es 4/10 del número de casos váli- dos. De esta forma, resulta fácil definir, por ejemplo, las frecuencias esperadas corres- pondientes a una distribución binomial o multinomial. El orden en el que se introducen los valores es muy importante, pues la secuencia introducida se hace corresponder con las categorías de la variable cuando éstas se en- cuentran ordenadas de forma ascendente.

El botón Opciones... permite obtener algunos estadísticos descriptivos y decidir qué trata- miento se desea dar a los valores perdidos:

| Pulsar el botón Opciones... para acceder al cuadro de diálogo Prueba de chi-cuadra-

do: Opciones que muestra la figura 19.2.

Figura 19.2. Subcuadro de diálogo Prueba Chi-cuadrado: Opciones.

Estadísticos. Las opciones de este recuadro permiten obtener algunos estadísticos descrip- tivos:

| Descriptivos. Ofrece el número de casos válidos, la media, la desviación típica,

el valor mínimo y el valor máximo.

| Cuartiles. Ofrece los centiles 25, 50 y 75.

Conviene señalar que estos estadísticos no siempre tendrán sentido, pues la prueba chi-cuadrado se utiliza generalmente con variables categóricas. Para contrastar la hi- pótesis de bondad de ajuste con variables cuantitativas es preferible utilizar la prueba de Kolmogorov-Smirnov.

Valores perdidos. Este recuadro permite decidir qué tratamiento se desea dar a los valores perdidos en el caso de que se haya seleccionado más de una variable:

F Excluir casos según prueba. Se excluyen de cada contraste los casos con valor

perdido en la variable que se está contrastando. Es la opción por defecto.

F Excluir casos según pareja. Se excluyen de todos los contrastes solicitados los

casos con algún valor perdido en cualquiera de las variables seleccionadas.

Pruebas no paramétricas 383

Nivel educativo 474 13,49 2,88 8 21 12,00 12,00 15,

N Media

Desviación típica Mínimo Máximo 25

50 (Mediana) 75

Percentiles

53 47,4 5, 190 47,4 142, 6 47,4 -41, 116 47,4 68, 59 47,4 11, 11 47,4 -36, 9 47,4 -38, 27 47,4 -20, 2 47,4 -45, 1 47,4 -46, 474

8 12 14 15 16 17 18 19 20 21 Total

N observado

N esperado Residual

Ejemplo (pruebas no paramétricas > Chi-cuadrado)

Este ejemplo muestra cómo utilizar la prueba chi-cuadrado para contrastar la hipótesis de bon- dad de ajuste con una muestra (una variable). Para ello, vamos a utilizar la variable educ (nivel educativo) con intención de averiguar si las frecuencias de las categorías de esa variable se ajustan a una distribución uniforme:

| En el cuadro de diálogo Prueba de chi-cuadrado (ver figura 19.1), seleccionar la va-

riable educ (nivel educativo) y trasladarla, mediante el botón flecha, a la lista Con- trastar variables.

| Pulsar el botón Opciones... y marcar las opciones Descriptivos y Cuartiles.

Aceptando estas elecciones, el Visor ofrece los resultados que muestran las tablas 19.1, 19. y 19.3. La tabla 19.1 recoge la información descriptiva solicitada al marcar las opciones Descrip- tivos y Cuartiles : tenemos una muestra de 474 casos, con un promedio de años de formación académica de 13,49 y una desviación típica de 2,88, y con un rango de valores (años) que osci- la entre 8 y 21. Los cuartiles indican, por ejemplo, que la mitad de los sujetos tiene al menos 12 años de estudios y que el 25 % de los sujetos tiene más de 15 años de estudios.

Tabla 19.1. Estadísticos descriptivos.

La segunda tabla de resultados (tabla 19.2) contiene las frecuencias observadas y las esperadas, así como las diferencias entre ambas ( residual ).

Tabla 19.2. Frecuencias observadas y esperadas.

La tabla 19.3, por último, ofrece la información necesaria para tomar una decisión sobre la hipótesis de bondad de ajuste: el valor del estadístico chi-cuadrado (724,692), sus grados de libertad ( gl = número de categorías menos uno) y su nivel crítico ( Sig. = 0,000). Puesto que el

Pruebas no paramétricas 385

Para obtener la prueba binomial :

| Seleccionar la opción Pruebas no paramétricas > Binomial... del menú Analizar para

acceder al cuadro de diálogo Prueba binomial que muestra la figura 19.3.

Figura 19.3. Cuadro de diálogo Prueba binomial.

La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para obtener la prueba binomial :

| Trasladar una o más variables a la lista Contrastar variables. Si se selecciona más

de una variable, el SPSS ofrece un contraste por cada variable seleccionada.

Definir dicotomía. Las opciones de este recuadro permiten definir qué valores de la variable seleccionada van a utilizarse como categorías:

F Obtener de los datos. Si la variable seleccionada es dicotómica, esta opción deja las

cosas como están, es decir, deja que sean los propios valores de la variable los que de- finan la dicotomía. En ese caso, la hipótesis que permite contrastar la prueba binomial es si la proporción observada en la primera categoría se ajusta (se parece) a la propor- ción teórica propuesta en Contrastar proporción.

F Punto de corte. Si la variable seleccionada no es dicotómica es necesario dicotomi-

zarla. Para ello, debe indicarse el valor concreto que se utilizará para efectuar el corte: los valores menores o iguales que el punto de corte constituyen el primer grupo y los valores mayores el segundo. Esta opción es extremadamente útil cuando lo que interesa es contrastar hipótesis sobre la mediana o sobre algún otro cuantil. Es decir, esta opción permite obtener los contrastes conocidos en la literatura estadística como prueba de los signos y prueba de los cuantiles (Ver San Martín y Pardo, 1989, págs 91-97). Si queremos contrastar, por ejemplo, la hipótesis de que la mediana del salario inicial es 25.000 dólares ( prue- ba de los signos ), podemos utilizar el valor 25.000 como Punto de corte y 0,5 (la pro- porción de casos acumulados hasta la mediana) como valor del contraste en Contras- tar proporción. O si queremos contrastar la hipótesis de que el centil 80 del salario inicial vale 40.000 dólares ( prueba de los cuantiles ), podemos utilizar 40.000 como Punto de corte y 0,80 (la proporción de casos acumulados hasta el centil 80) como valor del contraste en la caja Contrastar proporción.

386 Capítulo 19

Así pues, las opciones del recuadro Definir dicotomía permiten decidir, entre otras cosas, qué tipo de contraste se desea llevar a cabo: sobre una proporción (si la variable es dicotó- mica) o sobre la mediana o cualquier otro cuantil (si la variable es al menos ordinal).

Contrastar proporción. Esta caja permite especificar el valor poblacional propuesto en la hipótesis nula. Por defecto, se asume que la variable dicotómica seleccionada sigue el modelo de distribución de probabilidad binomial con π = 0,5. Pero este valor de prueba puede cam- biarse introduciendo un valor entre 0,001 y 0,999.

De las dos categorías de la variable dicotómica, la primera (aquella a la que corresponde el có- digo menor) es la que se toma como categoría de referencia. Teniendo esto en cuenta:

Si el valor de prueba es 0,5 , el SPSS interpreta que el contraste es bilateral y obtiene el nivel crítico multiplicando por dos la probabilidad de encontrar un número de casos igual o mayor que el de la categoría de referencia (si la proporción de casos de la cate- goría de referencia es mayor que 0,5) o multiplicando por dos la probabilidad de en- contrar un número de casos igual o menor que el de la categoría de referencia (si la proporción de casos de la categoría de referencia es menor que 0,5).
Si el valor de prueba es distinto de 0,5 , el SPSS interpreta que el contraste es unilate- ral y ofrece el nivel crítico resultante de calcular la probabilidad de encontrar un nú- mero de casos igual o mayor que el de la categoría de referencia (si la proporción de casos de la categoría de referencia es mayor que el valor de prueba; contraste unilate- ral derecho) o la probabilidad de encontrar un número de casos igual o menor que el de la categoría de referencia (si la proporción de casos de la categoría de referencia es menor que el valor de prueba; contraste unilateral izquierdo).

El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos

Ejemplo (Pruebas no paramétricas > Binomial)

Este ejemplo muestra cómo utilizar la prueba binomial para contrastar la hipótesis de bondad de ajuste referida a una variable dicotómica. Para ello, vamos a utilizar la variable minoría (clasificación étnica). Si suponemos que el 70 % de los habitantes de EEUU es de raza blanca, puede resultar interesante averiguar si ese porcentaje se mantiene en la entidad bancaria a la que se refiere el archivo Datos de empleados. Para ello:

| En el cuadro de diálogo Prueba binomial (ver figura 19.3), seleccionar la variable mi-

noría (clasificación étnica) y trasladarla, mediante el botón flecha, a la lista Contras- tar variables.

| Introducir el valor 0,70 en la caja Contrastar proporción para especificar el valor de

prueba.

| Puesto que la variable es dicotómica, dejar marcada la opción Obtener de los datos

del recuadro Definir dicotomía.

388 Capítulo 19

(^) Conviene no confundir la hipótesis de aleatoriedad con la hipótesis de bondad de ajuste estudiada a propósito de la prueba binomial. Obtener 5 caras y 5 cruces al lanzar una moneda 10 veces es un resultado que se ajusta perfec- tamente a la hipótesis de equiprobabilidad (πcara = πcruz = 0,5), pero si las 5 caras salen al principio y las cinco cruces al final, esto haría dudar de la hipótesis de independencia o aleatoriedad. ** (^) Si el tamaño muestral es menor que 50, el estadístico Z se obtiene utilizando la corrección por continuidad de la siguiente manera:

Si R – E(R) < –0,5, se suma 0,5 a R. Es decir: Z = [ R +0,5– E(R) ]/σ R.
Si R – E(R) > 0,5, se resta 0,5 a R. Es decir: Z = [ R –0,5– E(R) ]/σ R.
Si | R – E(R) | <_ 0,5, Z = 0.

queño como para poder rechazar la hipótesis de independencia (o aleatoriedad) entre las obser- vaciones. Para obtener el número de rachas es necesario que las observaciones estén clasificadas en dos grupos exhaustivos y mutuamente exclusivos (variable dicotómica). Si no lo están, debe- remos utilizar algún criterio (mediana, media, moda, etc.) para hacer que lo estén. Una vez clasificadas las n observaciones en dos grupos (de tamaños n 1 y n 2 ), el SPSS utiliza una tipificación*^ del número de rachas ( R ) para contrastar la hipótesis de aleatoriedad o independencia:

donde: y. El estadístico Z se dis- tribuye según el modelo de probabilidad normal N (0, 1). El SPSS ofrece el nivel crítico bilate- ral resultante de multiplicar por 2 la probabilidad de encontrar un número de rachas igual o menor que el encontrado (si R < E ( R )), o un número de rachas igual o mayor que el encontrado (si R > E ( R )).

Para obtener la prueba de las rachas :

| Seleccionar la opción Pruebas no paramétricas > Rachas... del menú Analizar para ac-

ceder al cuadro de diálogo Prueba de las rachas que muestra la figura 19.4.

Figura 19.4. Cuadro de diálogo Prueba de las rachas.

Pruebas no paramétricas 389

$15,000. 212 262 474 150 -7, ,

Valor de prueba a Casos < Valor de prueba Casos >= Valor de prueba Casos en total Número de rachas Z Sig. asintót. (bilateral)

Salario inicial

a.Mediana

La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para contrastar la hipótesis de aleatoriedad o independencia referida a una variable:

| Trasladar esa variable a la lista Contrastar variables. Si se selecciona más de una va-

riable, el SPSS ofrece un contraste por cada variable seleccionada.

Punto de corte. Recordemos que para obtener el número de rachas es necesario que las obser- vaciones estén clasificadas en dos grupos. Si no lo están, debemos utilizar algún criterio para hacer que lo estén. Si se desea contrastar la hipótesis de independencia referida a una variable cuantitativa , podemos utilizar como criterio de dicotomización (como punto de corte) la Me- diana , la Moda o la Media. En ese caso, los valores más pequeños que el punto de corte pasan a formar parte del primer grupo y los valores iguales o mayores que el punto de corte pasan a formar parte del segundo grupo. Si se desea contrastar la hipótesis de independencia referida a una variable categórica puede utilizarse como punto de corte la opción Personalizado. Si la variable es, por ejemplo, dicotómica, con códigos 0 y 1, podemos utilizar como punto de corte el valor 0,5 (o cualquier otro comprendido entre 0 y 1, incluido el 1), de modo que los casos con código 0 pasen a formar parte del primer grupo y los casos con valor 1 pasen a for- mar parte del segundo grupo.

El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos.

Ejemplo (Pruebas no paramétricas > Rachas)

Este ejemplo muestra cómo utilizar la prueba de las rachas para contrastar la hipótesis de inde- pendencia referida a la variable salario inicial.

| En el cuadro de diálogo Prueba de las rachas (ver figura 19.4), seleccionar la variable

salario inicial y trasladarla, mediante el botón flecha, a la lista Contrastar variables.

| Dejar marcada la opción Mediana del recuadro Punto de corte para categorizar la

variable utilizando como criterio la mediana.

Aceptando estas elecciones, el Visor ofrece los resultados que muestra la tabla 19.5. La tabla comienza indicando el punto de corte utilizado para la dicotomización: Valor de prueba = 15.000. Una llamada de nota a pie de tabla nos recuerda que ese punto de corte es la mediana.

Tabla 19.5. Prueba de las rachas.

Pruebas no paramétricas 391

Figura 19.5. Cuadro de diálogo Prueba de Kolmogorov-Smirnov para una muestra.

La lista de variables del archivo de datos ofrece un listado de todas las variables con formato numérico. Para contrastar la hipótesis de bondad de ajuste referida a una variable:

| Trasladar esa variable a la lista Contrastar variables. Si se selecciona más de una va-

riable, el SPSS ofrece un contraste por cada variable seleccionada.

Distribución de contraste. Las opciones de este apartado permiten elegir la distribución teóri- ca a la cual se desea ajustar la distribución empírica de la variable seleccionada: Normal , Uni- forme , Poisson y Exponencial (puede seleccionarse más de una). Los parámetros de las dife- rentes distribuciones se estiman a partir de los datos. No es posible obtener el ajuste a una dis- tribución normal si la varianza de la variable vale cero. Ni a una distribución de Poisson si la media de la variable vale cero o los valores no son, todos ellos, enteros no negativos.

El botón Opciones... conduce a un subcuadro de diálogo idéntico al de la figura 19.2 que per- mite obtener algunos estadísticos descriptivos y decidir qué tratamiento se desea dar a los valo- res perdidos.

Ejemplo (Pruebas no paramétricas > Kolmogorov-Smirnov)

Este ejemplo muestra cómo utilizar la prueba de Kolmogorov-Smirnov para contrastar la hipó- tesis de normalidad (ajuste a la distribución normal) referida a la variable salario inicial :

| En el cuadro de diálogo Prueba de Kolmogorov-Smirnov (ver figura 19.5), seleccionar

la variable salario inicial y trasladarla a la lista Contrastar variables.

| Dejar marcada la opción Normal del recuadro Distribución de contraste para efec-

tuar el ajuste a la distribución normal.

Aceptando estas elecciones, el Visor ofrece los resultados que muestran la tabla 19.5. La tabla ofrece, en primer lugar, el número de casos válidos y los parámetros de la distribución selec- cionada, es decir, de la distribución normal ( Media y Desviación típica ). A continuación ofrece las diferencias más extremas entre las frecuencias acumuladas empíricas y teóricas (la más grande de las positivas, la más pequeña de las negativas y la más grande de las dos en valor absoluto). Por último, ofrece el estadístico de K-S ( Z = 5,484) y su nivel crítico ( Significación

392 Capítulo 19

474 $17,016. $7,870. , , -, 5,

,

N Media Desviación típica

Parámetros normales a,b

Absoluta Positiva Negativa

Diferencias más extremas

Z de Kolmogorov-Smirnov

Sig. asintót. (bilateral)

Salario inicial

a.La distribución de contraste es la Normal. b.Se han calculado a partir de los datos.

asintótica bilateral = 0,000). Puesto que el valor del nivel crítico es muy pequeño (menor que 0,05), rechazanos la hipótesis de normalidad y concluimos que las puntuaciones de la variable salario inicial no se ajustan a una distribución normal.

Tabla 19.6. Prueba de Kolmogorov-Smirnov para una muestra.

Pruebas para dos muestras independientes

Este procedimiento contiene varias pruebas no paramétricas, todas ellas diseñadas para analizar datos provenientes de diseños con una variable independiente categórica (con dos niveles que definen dos grupos o muestras) y una variable dependiente cuantitativa al menos ordinal (en la cual interesa comparar los dos grupos o muestras). El procedimiento incluye cuatro pruebas: la prueba U de Mann-Whitney, la prueba de Kol- mogorov-Smirnov para dos muestras, la prueba de reacciones extremas de Moses y la prueba de las rachas de Wald-Wolfowitz. Para obtener cualquiera de ellas:

| Seleccionar la opción Pruebas no paramétricas > 2 muestras independientes del menú

Analizar para acceder al cuadro de diálogo Pruebas para dos muestras independientes que muestra la figura 19.6.

Figura 19.6. Cuadro de diálogo Pruebas para dos muestras independientes.

394 Capítulo 19

(^) Existen diferentes versiones de los estadísticos U y Z (ver, por ejemplo, San Martín y Pardo, 1989, pág. 126; o Marascuilo y McSweeney, 1977, págs. 267-278), pero todas ellas conducen al mismo resultado.

ciones y, como si se tratara de una sola muestra, asignamos rangos R (^) i a las n puntuaciones (un 1 a la más pequeña, un 2 a la más pequeña de las restantes, ..., un n a la más grande; resol- viendo los empates asignando el rango promedio), tendremos n 1 rangos R (^) i 1 (los n 1 rangos co- rrespondientes a las observaciones de la muestra Y 1 ) y n 2 rangos R (^) i 2 (los n 2 rangos correspon- dientes a las observaciones de la muestra Y 2 ). Consideremos ahora, entre los múltiples estadísticos que podríamos definir en una situa- ción como ésta, los estadísticos S 1 = “suma de los rangos asignados a la muestra 1” y S 2 = “su- ma de los rangos asignados a la muestra 2”. El estadístico U adopta la siguiente forma en cada grupo:

Puesto que suponemos que las dos muestras se han extraído de dos poblaciones idénticas, cabe esperar que U 1 y U 2 sean aproximadamente iguales (excepto en la cantidad atribuible a las fluc- tuaciones propias del azar muestral). Si U 1 y U 2 son muy distintos, existirá cierta evidencia de que las muestras proceden de poblaciones distintas. Por tanto, la hipótesis nula de que ambos promedios poblacionales son iguales podría rechazarse si U 1 (o U 2 ) es demasiado grande o demasiado pequeño. Para determinar esto último, podemos basar nuestra decisión en la probabilidad concreta asociada al estadístico U : U = U 1 si U 1 < n 1 n 2 / U = U 2 si U 1 > n 1 n 2 /

Con muestras pequeñas ( n <_ 30) el SPSS ofrece el nivel crítico bilateral exacto asociado al esta- dístico U , el cual se obtiene multiplicando por 2 la probabilidad de obtener valores menores o iguales que U (esta probabilidad se calcula utilizando el algoritmo de Dineen y Blakesley, 1973). Con muestras grandes ( n > 30), el SPSS ofrece una tipificación*^ del estadístico U (inclu- yendo corrección por empates) que se distribuye aproximadamente N (0, 1):

( k se refiere al número de rangos distintos en los que existen empates y ti al número de puntua- ciones empatadas en el rango i ). El nivel crítico bilateral se obtiene multiplicando por 2 la pro- babilidad de obtener valores menores o iguales que Z.

Pruebas no paramétricas 395

Prueba de reacciones extremas de Moses

Esta prueba sirve para estudiar si existe diferencia en el grado de dispersión o variabilidad de dos distribuciones. Aunque hasta ahora hemos hablado de la heterogeneidad de varianzas como de algo rela- cionado con la prueba T sobre diferencia de medias y, por tanto, como algo poco deseable, lo cierto es que la heterogeneidad de varianzas puede constituir, ella misma, un resultado expe- rimental relevante. Esto significa que, en ocasiones, el estudio de la variabilidad puede ser un fin en sí misma y no sólo un paso previo para la comparación de medias (ver, por ejemplo, Bryk y Raudenbush, 1988). Supongamos que deseamos evaluar el nivel de desarrollo cognitivo alcanzado por dos gru- pos de niños que han seguido programas educativos distintos. Si estamos interesados simple- mente en constatar cuál de los dos grupos ha alcanzado, en promedio, mayor nivel de desarro- llo, podemos limitarnos a comparar los promedios de ambos grupos con alguno de los procedi- mientos (paramétricos o no paramétricos) ya estudiados. Pero esta forma de proceder pasaría por alto una cuestión de gran importancia: podría ocurrir que uno de los métodos educativos consiguiera incrementar el nivel de desarrollo de los niños de forma generalizada (todos los niños mejoran su nivel de desarrollo) y que el otro método educativo consiguiera el mismo ob- jetivo con sólo unos pocos niños, aunque de forma más marcada, o podría ocurrir que consi- guiera incrementar mucho el nivel de desarrollo de unos niños y muy poco el de otros (reac- ciones extremas). Estas diferencias entre métodos no quedarían reflejadas en las medias, pero sí en la variabilidad, por lo que sólo acompañando el contraste de medias con un contraste de varianzas podríamos obtener información real sobre lo que está ocurriendo. Existen diferentes procedimientos para contrastar la hipótesis de que dos varianzas pobla- cionales son iguales. Ya hemos estudiado (ver capítulo 11 sobre Análisis exploratorio ) uno de los más utilizados, debido a Levene (1960); pero es un procedimiento paramétrico. Moses (1952) ha diseñado un método no paramétrico que puede utilizarse con variables ordinales. Consideremos dos muestras ( c = control y e = experimental ) extraídas aleatoriamente de la misma población o de dos poblaciones idénticas. Para obtener el estadístico de Moses se co- mienza ordenando las n = n (^) c + n (^) e observaciones de forma ascendente y asignándoles, como si se tratara de una única muestra, rangos de 1 a n : un 1 a la más pequeña, un 2 a la más pequeña de las restantes, etc. (los empates se resuelven asignando el rango medio). A continuación se calcula la amplitud del grupo control ( A (^) c ) restando los rangos correspondientes al valor más grande y más pequeño de ese grupo y sumando 1 a esa diferencia; el resultado se redondea al entero más próximo (el SPSS considera que el grupo control es el grupo con el código menor). Dado que la amplitud es una medida de dispersión muy inestable, Moses sugiere utilizar al amplitud recortada ( A (^) r ). Para ello, se fija un valor pequeño ( r ) y se calcula la amplitud tras descartar r valores del grupo control por arriba y por abajo (2 r valores en total). La amplitud recortada se obtiene restando los rangos correspondientes al valor más grande y al más pequeño del grupo control tras eliminar del cómputo los r valores más grandes y los r valores más pe- queños de ese grupo; y, por supuesto, sumando 1 a esa diferencia y redondeando al entero más próximo. Es evidente que A (^) r no puede ser menor que n (^) c –2 r (ni mayor que n –2 r ). Además, si en el grupo experimental se han producido reacciones extremas, la amplitud del grupo control ten- derá a su valor mínimo, pues habrá pocas observaciones del grupo experimental entremez-

Pruebas no paramétricas 397

Prueba de las rachas de Wald-Wolfowitz

La prueba de las rachas para dos muestras independientes (Wald y Wolfowitz, 1940) es similar a la prueba de las rachas para una muestra ya estudiada en este mismo capítulo. Referida a dos muestras independientes, permite contrastar la hipótesis de que ambas muestras proceden de la misma población. Al igual que la prueba de Kolmogorov-Smirnov, es sensible no sólo a dife- rencias entre los promedios poblaciones, sino a diferencias en variabilidad, simetría, etc. Para obtener el número de rachas, se ordenan de menor a mayor las n = n 1 + n 2 observacio- nes de ambas muestras como si se tratara de una sola muestra. Ordenadas las puntuaciones, el número de rachas ( R ) se obtiene contando el número de secuencias de observaciones pertene- cientes al mismo grupo. Si existen empates entre observaciones de muestras distintas, el SPSS calcula tanto el número mínimo de rachas como el máximo. Si las dos muestras proceden de la misma población, las observaciones de ambas muestras estarán entremezcladas y el número de rachas será alto. Por el contrario, si las muestras pro- ceden de poblaciones distintas, una de ellas tendrá valores más altos que la otra y, al ordenar las observaciones, no estarán tan entremezcladas. Así pues, un número alto de rachas indica que las muestras proceden de la misma población y un número bajo de rachas indica que las muestras proceden de poblaciones distintas. Para decidir cuándo el número de rachas encontrado es lo bastante pequeño como para re- chazar la hipótesis de que las muestras proceden de la misma población, el SPSS utiliza dos estrategias distintas dependiendo del tamaño de las muestras. Si n > 30, utiliza la aproximación normal (ver, en este mismo capítulo, el estadístico Z descrito en el apartado Prueba de las ra- chas ); pero a diferencia de lo que ocurre con el estadístico Z para una muestra, aquí se utiliza un nivel crítico unilateral: la probabilidad de obtener un número de rachas igual o menor que el obtenido. Si n <_ 30, el SPSS ofrece el nivel crítico unilateral exacto. Para ello, si el número de rachas R es par, utiliza la siguiente ecuación:

Y si el número de rachas R es impar ( k = 2 r –1):

En ambos casos se está haciendo referencia a la probabilidad de obtener un número de rachas igual o menor que el encontrado. Se rechaza la hipótesis nula de que las muestras proceden de la misma población cuando la probabilidad obtenida es menor que, generalmente, 0,05.

398 Capítulo 19

Salario inicial

370 249,14 92180, 104 196,10 20394, 474

Clasificación étnica No Sí Total

N

Rango promedio

Suma de rangos

14934, 20394, -3, ,

U de Mann-Whitney W de Wilcoxon Z Sig. asintót. (bilateral)

Salario inicial

Ejemplo (Pruebas no paramétricas > Dos muestras independientes)

Este ejemplo muestra cómo obtener e interpretar todas las pruebas incluidas en el procedimien- to Pruebas no paramétricas > Dos muestras independientes :

| En el cuadro de diálogo Pruebas para dos muestras independientes (ver tabla 19.6),

seleccionar la variable salini (salario inicial) y trasladarla a la lista Contrastar varia- bles.

| Seleccionar la variable minoría (clasificación étnica) y trasladarla al cuadro Variable

de agrupación.

| Pinchar el botón Definir grupos... para acceder al subcuadro de diálogo Dos muestras

independientes: Definir grupos que muestra la figura 19.7, e introducir los códigos 0 y 1 (que son los códigos que definen los dos grupos de la variable minoría ).

| En el recuadro Tipo de prueba , marcar las cuatro opciones disponibles.

Aceptando estas elecciones, el Visor ofrece los resultados que muestran las tablas 19.7 a la 19.11. La primera de ellas (tabla 19.7) ofrece el tamaño de cada grupo, el rango promedio que resulta de la asignación de rangos a cada grupo y la suma de esos rangos.

Tabla 19.7. Rangos.

La tabla 19.8 ofrece el estadístico U de Mann-Whitney (también ofrece el estadístico W de Wil- coxon , que es una versión equivalente del estadístico U ; ver Pardo y San Martín, 1994, págs. 424-427). La tipificación de ambos vale Z = –3,495. Y el nivel crítico bilateral ( Significación asintótica bilateral ) vale 0,000. Por tanto, podemos rechazar la hipótesis de igualdad de prome- dios y concluir que los grupos definidos por la variable minoría proceden de poblaciones con distinto promedio.

Tabla 19.8. Prueba de Mann-Whitney.

La tabla 19.9. contiene la prueba de reacciones extremas de Moses. Por supuesto, la variable minoría no parece del todo apropiada para utilizar la prueba de Moses, pero, puesto que se trata de un ejemplo, nos sirve para poder interpretar la información que ofrece el Visor. La tabla re- coge, en primer lugar, la amplitud del grupo control ( N = 467) y la probabilidad de obtener una amplitud como esa o menor ( Significación unilateral = 0,000). A continuación muestra la am- plitud recortada ( N = 434) y la probabilidad de obtener una amplitud como esa o menor ( Signi-