Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


pruebas de significaion, Apuntes de Psicología

Asignatura: analisis de datos, Profesor: jone datos, Carrera: Psicología, Universidad: UPV-EHU

Tipo: Apuntes

2014/2015

Subido el 18/10/2015

trinidad.gigena
trinidad.gigena 🇪🇸

3.7

(111)

62 documentos

1 / 22

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pf12
pf13
pf14
pf15
pf16

Vista previa parcial del texto

¡Descarga pruebas de significaion y más Apuntes en PDF de Psicología solo en Docsity!

276 Segunda parte. Los datos empíricos Para un tipo de H, dada, manteniendo constante «, se puede incre- mentar la potencia de la prueba aumentando el número de casos u observaciones de la muestra. El número de casos, en nuestro ejemplo, era 100, Aumentando dicha cantidad se reduce el valor del denominador y se consigue que el valor z aumente, con lo que se incrementa la po- * sibilidad de obtener un valor z significativo, De ahí se infiere que, si mediante el establecimiento de determinado nivel de significación nos protegemos ante la posibilidad de cometer un error de tipo 1, aumen- tando el número de casos nos protegemos contra la posibilidad de come-: ter un error de tipo II (para un mismo nivel de significación y para una 3 misma hipótesis alternativa). De esta forma se consigue un experimento mucho más fiable, aumentando, en definitiva, la potencia de la prueba estadística, 16 Pruebas de significación RESUMEN ] PRINCIPIO BÁSICO DE LAS PRUE] Se ha presentado el razonamiento lógico fundamental en toda prueba 'UEBAS DE SIGNIFICACIÓN de inferencia estadística, la cual implica, en última instancia, el con- traste de los resultados obtenidos por la intervención de los tratamientos con lo que se hubiese producido en el caso de que sólo hubiera actuado el azar. Como señaló Fisher, el azar constituye la base física para la; prueba de la hipótesis. A continuación se ha analizado el proceso básico de la prueba de la? hipótesis, que ha sido considerado como un proceso de toma de deci siones, Este proceso implicaba, básicamente, la reformulación del pi blema en términos estadísticos, A continuación se han mostrado los principales pasos que intervienen en la elaboración de un modelo de decisión, proponiéndose un ejemplo práctico. Por último se ha señalado que en todo proceso de prueba de la hipótesis pueden producirse dos clases de error: error tipo 1 y HL, Se ha estudiado la mutua relación que mantienen entre sí estos dos tipos de error, señalándose que, fundamentalmente, la potencia de una prueba radica en la magnitud potencial de cometer un error de tipo TH. El Principio básico que rige la utilización de las pruebas de signifi- cación es la comparación del resultado empírico obtenido en la inves- tigación con lo que cabría esperar si sólo hubiese actuado al azar. “Tomemos de nuevo el ejemplo del lanzamiento del dado; según las kycs del azar, sabemos que la cara 5 tiene 1/6 de probabilidad de que salga en una sola tirada. Si lanzando 48 veces el dado se obtiene 11 veces dicha cara, podemos preguntamos hasta qué punto dicho resultado dificre significativamente de lo que cabe esperarse según las leyes del azar. En nuestro caso el resultado esperado sería ocho veces dicha cara (48 X 1/6 = 8). Entonces, la pregunta que podemos formularnos es h siguiente: ¿Qué probabilidad tenemos, según el azar, de que ocurra dicho resultado? Esta pregunta resume sintéticamente el principio básico que regula bs pruebas de significación. El experimentador deberá ser, pues, escép- tico y no dará crédito a los resultados hasta que tenga de ellos una prueba fidedigna. Para esto puede utilizar una serie de pruebas (o tests) estadísticos, que «suelen conocerse con el nombre de pruebas de signifi cación. El principio fundamental que se cumple en cada una de estas pruebas es, como ya hemos indicado, el mismo. Dicho principio podría enunciarse de la siguiente forma: Todos los resultados son debidos al azar hasta que no se demuestre lo contrario. La estrategia fundamental adoptada por el investigador, en el mo- mento de analizar sus datos, consiste en establecer como hipótesis básica la expectación del azar y en intentar acomodar sus resultados empírk eos al modelo del azar, Si sus datos no se ajustan al modelo del azar, eonciuirá que son significativos o pertinentes a su hipótesis experimental. 217 7 j 4 278 Segunda parte. Los datos empíricos La utilización de la estadística en la investigación experimental queda, de este modo, totalmente justificada, ya que constituye una ayuda eficaz para la obtención de conclusiones e inferencias válidas. El científico pretende alcanzar conclusiones válidas a partir de los resultados de su experimento, recurriendo para ello a la estadística. La estadística, por su parte, ofrece la posibilidad de reducir los datos en formas cuantifi- cables para estudiar y analizar varianzas; proporciona medios adecuados para la estimación probabilística de las inferencias que obtiene a partir de sus observaciones. En estadística se afirma: la inferencia que se ha hecho a partir de los datos es correcta a tal o cual nivel de significación. Se puede proceder como si la hipótesis fuera verdadera, pero teniendo siempre en cuenta tal o cual riesgo de que no sea, . Por todo lo expuesto es razonable que, desde el punto de vista mo- dernista, algunos autores consideren la estadística como la disciplina que trata sobre la toma de decisiones bajo incertidumbre, PRUEBAS PARA EXPERIMENTOS DE UN SOLO GRUPO Cuando el experimento consta de un solo grupo o conjunto de datos (muestras simples), puede ocurrir; a) Que el estadístico implicado en la muestra sea una Proporción. b) Que el estadístico sea una media. El estadístico como una proporción Se dan algunas situaciones experimentales en las que la variable observada sólo puede tomar uno entre dos posibles valores; otras veces puede ser categorizada de acuerdo con su pertenencia a dos o más va- lores. En todos estos casos, la cantidad de observaciones para cada una de estas categorías puede ser dividida entre el número total de observa- ciones (frecuencia total), calculándose así la proporción Telativa a dicha categoría. Así, si x es una variable dicotómica, y se considera una mues- tra de n observaciones, tendremos un número fi de observaciones para x= 1, y un número de fo observaciones para x=0, de tal forma que el número total de observaciones será; n=f + fo De ahí que la proporción relativa a la frecuencia de observaciones en una de estas dos categorías será: f[/n o po (proporción observada). Y puesto que la suma de las dos proporciones debe ser igual a 1, la propor ción correspondiente a la segunda categoría quedará establecida en: qu = 1— po. De donde: Port go=1. Cap. 16. Pruebas de significación 279 Los valores f y q, son valores fijos para cierta población, Ahora bien, cuando seleccionamos una muestra al azar de dicha población, es posible (por las leyes del azar) que la proporción de la muestra selec- cionada no coincida exactamente con el parámetro de la población. En este caso nuestra pregunta será la siguiente: ¿Hasta qué punto la proporción obtenida en la muestra difiere significativamente o no, de h verdadera proporción de la población? En otras palabras, ¿puede conocerse, sobre una base probabilística, si esa diferencia se debe al azar? Una adecuada prueba estadística nos servirá, en este caso, para com- probar en qué medida podemos esperar que nuestro resultado pueda xr considerado como un efecto del azar. Para ello basaremos la prueba en la curva normal de Probabilidad. Sabemos que la frecuencia de ocurrencias de un hecho, si es suficiente- E mente grande, se distribuye de acuerdo con dicha curva, considerándose dicha distribución como normal. La razón última y más importante para d uso de dicha curva, para nuestro razonamiento, es que con ella podemos interpretar las probabilidades de los estadísticos que obtenemos de las muestras. El criterio básico para este tipo de prueba consistirá en calcular la probabilidad de ocurrencia que correspondería a determinada proporción (la obtenida en el experimento) si sólo hubiese actuado el azar. Consideremos el siguiente ejemplo. Supóngase que enthe los compo- bentes de un grupo, la mayoría de sus miembros son conservadores en materia política. Sin embargo, esto es sólo una sospecha y nuestro propósito ¡s verificarla, Dado que no se posee ninguna información previa sobre las preferencias políticas de este grupo, se puede esperar, con base en un sriterio aleatorio, que la mitad de sus elementos son conservadores Y la otra mitad liberales. Se puede establecer, por tanto, como Ho h no existencia de diferencia alguna entre conservadores y liberales (Ho : p= q =050). La hipótesis alternativa establecería la existencia de un mayor mú- ero de conservadores que liberales (H, : p > 0.50). Escojamos, por ejemplo, un nivel de significación de 0.05. Verifi- quemos, a continuación, la hipótesis; para ello, elegimos al azar, una ¡muestra de 16 miembros pertenecientes a dicha población y les pregun- [mos si su actitud en materia política es liberal o conservadora. Los tados nos indican que 11 miembros del grupo encuestado son conser- lores. Para conocer si este resultado (bo = 11/16 es significativo, o bien, se debe simplemente al azar, podemos aplicar el razonamiento tico propuesto en el capítulo anterior, es decir, se calcula la bilidad de ocurrencia de dicho resultado, en caso de que sólo lese actuado el azar: 282 Segunda parte. Los datos empíricos este asunto cabe afirmar que existen dos factores (sin tener en cuenta los que se manipulan experimentalmente) susceptibles de determinar el grado en que las medias.de dos grupos difieren entre sí: 2) el tamaño de la muestra, y b) la variabilidad que tienen las medias en la población a la que pertenecen. Con respecto al primer factor, se puede afirmar que las medidas de muestras pequeñas suelen diferir más unas de otras que las medidas de muestras grandes. La razón es básica, ya que cuanto mayor es la - muestra (teorema del límite central), más cerca se halla la media mues- tral de la media verdadera. Esto nos lleva a otro principio básico en la utilización de las pruebas estadísticas: el tamaño de las muestras debe ser semejante, En cuanto al grado de variabilidad que presentan las medias de la población, hemos de partir del supuesto de que si en la hipótesis nula se supone que las dos muestras proceden de la misma población, ambas deberán presentar la misma varianza. De ahí que la homogeneidad de la varianza constituye otro requisito fundamental para la aplicación de pruebas estadísticas con experimentos de dos grupos. PRUEBA DE LA HIPÓTESIS NULA PARA EXPERIMENTOS CON DOS GRUPOS A partir de las consideraciones anteriores y mediante la utilización de un modelo de decisión al azar, la hipótesis nula supondrá que no existe diferencia significativa alguna, entre las medias de dos grupos con la suposición de que proceden de la misma población, Consecuentemente, el hecho de que se obtengan medias diferentes dependerá básicamente de la distribución teórica muestral. La asignación de los sujetos al azar a los grupos experimentales, así como la aplicación, también al azar, de los tra- tamientos, nos ofrecen una base para el establecimiento de la hipótesis nula, al considerarse las medidas de los dos grupos como medias de muestras aleatorias procedentes de una misma población, Al mismo tiempo, puesto que se supone (por hipótesis) que son muestras aleatorias de una misma población, la varianza de la población puede ser estimada a partir de la variación que presentan los datos en cada grupo (o muestra). La varianza en cada muestra constituye, por tanto, una buena estimación de la verdadera variación existente en la población, y puesto que, como hemos afirmado, los sujetos fueron asig- nados al azar a los diferentes grupos, las medias de éstos sólo deberán diferenciarse en proporción a la variabilidad que presentan los datos en la población. Si se considera, por tanto, la varianza intragrupo (varianza dentro de cada grupo) como una buena estimación de la varianza de la población Cap. 18. Pruebas de significación 288 (conocida también como término de error), se consigue una base idónea de contrastación. En efecto, en toda prueba estadística se compara una estimación de la varianza de la población medida por la diferencia entre las medias, con una segunda estimación de la misma, calculada por la variabilidad intragrupo. De esta forma se tiene un criterio para comocer si la variabilidad de las medias corresponde o no a la variación de la población estimada a partir de la varianza dentro de los grupos, . La estadística matemática establece que la varianza de una distri- bución de medias muestrales (procedentes de una misma población) es igual a la varianza de la población dividida entre el tamaño n de la mues- tra, Con este concepto, la mayoría de las pruebas de significación de diferencia de medias puede ser comprendida. Ahora bien, hay que hacer constar que ninguna de estas pruebas podría ser adecuadamente aplicada sí no se cumpliera el principio del azar. PRUEBAS DE SIGNIFICACIÓN PARA EXPERIMENTOS CON DOS GRUPOS La prueba de significación z El índice o razón z puede ser utilizado como prueba de significación estadística de la diferencia entre dos medias, Tiene su fundamento en la distribución teórica muestral de las medias de los grupos que comparamos. Sabemos ya que la puntuación z se calcula al dividir la diferencia entre determinado valor de X (variable experimental) y su media, multiplicándose por la desviación típica de X. Con ello se consigue un sistema de transformación de los valores de X' en puntajes típicos, los cuales representan la desviación relativa de un puntaje de X' en relación con su media, De ahí la utilidad que tiene la comparación de valores si éstos están expresados en puntajes típicos. Si x es una variable cuya distribución es aproximadamente normal, sus unidades típicas (x — %/0) también se distribuirán normalmente, ya que z constituye, simplemente, una transformación lineal de x. La dis- tribución normal de z.tiene como media O y como desviación típica l. De esta forma, si determinado puntaje ha sido seleccionado al azar de una distribución normal con una media conocida y una desviación típica conocida, puede ser transformado en una puntuación z y por consiguiente, calcularse la probabilidad de su ocurrencia a partir de las tablas de valores probables de la distribución normal. La lógica de este procedimiento se puede aplicar tanto a las medias como a los puntajes individuales, con la única diferencia de que, en caso de las medias, la desviación típica es la desviación típica de las medias, es decir, el error típico. a a 284 Segunda parte. Los datos empíricos El error típico Si queremos obtener una puntuación típica de una media dividire- mos la diferencia entre ésta y la media real de la población, y el resultado se multiplica por la desviación típica de esta última [(Y — 1)/04]. De esta forma podremos calcular la probabilidad de ocurrencia de una determinada media (bajo el supuesto de que la distribución es normal). De este modo, cuando un experimento implica dos grupos diferentes de sujetos, se puede considerar, razonablemente, que cada grupo consti- tuye una muestra tomada al azar de la misma población; y, por tanto, 3 bajo Ho, se supone que la diferencia entre las medias de las dos muestras no se apartará significativamente de cero. Supóngase que hemos obtenido cinco muestras al azar de una misma población y calculado sus correspondientes medias: Xx (X Xi) (-Xy 5 2 4 4 1 1 3 0 0 2 -1 1 1 —2 4 Totales 15 0 10 La media de la distribución muestral (4 = media de la población) es 3. La varianza de la distribución muestral X(X — X:)*/n es 2. La E raíz cuadrada de la varianza constituye el error típico y será, en nuestro ejemplo: Y2= 14. Tenemos, pues, que la desviación típica de una distribución muestral es el error típico de dicha distribución, y consecuen» temente, el error típico de la media de las medias muestrales, Cuando el experimentador trabaja con dos muestras, se parte del supuesto de que ambas proceden de una población cuya distribución -; muestral es normal. Si después de la aplicación de los tratamientos se obtienen dos medias cuya diferencia sospecha es superior al error típico de la distribución muestral, podrá atribuir dicha diferencia a la presen- cia de los tratamientos. Con objeto de tomar una decisión acerca de la significación de dicha diferencia, deberá comparar dicha diferencia con la varianza hipotética existente entre las medias muestrales de la pobla- ción. La medida y el cálculo de la variación de las medias muestrales extraídas al azar de la población, constituyen, pues, el error típico de la media de la población. Una buena estimación del error típico se puede Cap. 16. Pruebas de significación 285 E obtener al dividir la desviación típica de la muestra entre la raíz cua- E drada de su tamaño: Por otra parte, el experimentador se encuentra con una media y con ¿ una desviación típica para cada grupo. En este caso, una buena esti- mación de la desviación típica de la diferencia entre dos medias se obtiene de la combinación de las desviaciones típicas de cada grupo, con lo cual se consigue una estimación de la desviación típica de una distribución de diferencia de medias; mi= VI FE =p ”, T Ma o sea, la varianza intragrupo puede ser utilizada conjuntamente como una buena estimación de la varianza de la población. Aunque los di- Terentes tratamientos pueden afectar de diferente forma a un grupo y a otro, sin embargo, la variabilidad dentro del grupo será la misma variabilidad que presenta la población, puesto que los tratamientos afectan por igual a todos los elementos del grupo. La acción de los tratamientos, si es efectiva, tiende a acusar las diferencias entre las me- dias de los grupos, no afectando la variabilidad intragrupo (siempre, claro está, que los tratamientos no interactúen con los sujetos del grupo). Este supuesto, come ya hemos indicado, recibe el nombre de homoge- neidad de la varianza. Cada una de las varianzas intragrupo es, por tanto, estimación de una misma varianza y sólo puede diferir por el azar. Es importante tener en cuenta este aspecto, ya que en las pruebas de significación combinamos las variaciones de las diferentes muestras para obtener una única estimación de la varianza de la población. Utilización de la prueba £ La prueba t de significación suele utilizarse cuando necesitamos co- nocer, como en el caso anterior, hasta qué punto una diferencia entre dos medias es mayor. de los que cabe esperarse se deba al azar, para ; muestras cuyo númeró de elementos sea inferior a treinta (1 < 30). Cuando tratamos de probar la significación entre las medidas de dos grupos experimentales, tanto si se emplea la distribución z como la 2, E pueden darse dos situaciones básicas: 2) que los dos grupos sean inde- pendientes (como ocurre en el caso de asignación de los sujetos al azar), y b) que los grupos se hallen relacionados (como cuando se utiliza “alguna técnica de apareamiento, o bien, los mismos sujetos son sornetidos E a dos condiciones experimentales sucesivas como en los diseños antes y después). 288 Segunda parte, Los datos empíricos donde day (5D)? n siendo 34* =3(D— D)*= 3D" — . Supongamos, por ejemplo, que nos interesa conocer si la coordina- ción muscular de los adultos comprendidos entre los 21 a 30 años, puede ser afectada o no por la administración de dos tipos de drogas, Á y B, Para ello se selecciona una muestra de 14 sujetos, y se les aplica a cada uno, la droga A en primer lugar, y al cabo de una semana, la droga B. Inmediatamente después de la administración de cada droga se pide a los sujetos que ejecuten un tipo concreto de tarea, y se registra el tiempo que ha invertido en realizarla, . En la tabla 16.2 se presentan los tiempos, en minutos, que han empleado los sujetos en la ejecución de una tarea metódica, después de la administración de las respectivas drogas. Tabla 16,2. Puntajes de destreza motora (en minutos) Sujetos DrogaA Droga B Diferencia (D) Dp' 1 32 35 —3 9 2 28 26 2 4 3 37 40 -=3 9 4 30 33 —3 9 5 29 24 5 25 6 23 22 1 1 7 31 31 o 0 B 34 30 4 16 2 27 27 0 0 10 30 30 0 o 1 29 28 1 1 12 34 33 1 1 13 33 34 -1 1 14 32 31 1 1 Totales 5 Tn Primeramente se calculará la medida de las diferencias: Cap. 16. Pruebas de algnificación 289 Por último, calcularemos el índice ¿: 0.357 _ ss. As, para 14 — 1 gl, y para un nivel de significación de 0.05, el valor £ en las tablas es, 2,16. Puesto que nuestro cociente es inferior al dado por las tablas, nada se opone a aceptar Ho y, por tanto, de- beremos rechazar la significación de la diferencia en función de la acción de las drogas, La prueba t: condiciones para su aplicabilidad La prueba £ es una de las más utilizadas dentro del campo de inves- tigación experimental, para la comparación de medias grupales, siempre que los datos sean cuantificados, al menos, en una escala de intervalos. Ahora bien, la prueba +, sólo es eficiente cuando se comparan dos grupos, Para más de dos grupos es preferible otro tipo de pruebas como el onálisis de la varianza, la prueba de Duncan, etc. En caso de que sc utilice la f para grupos independientes deberá cumplirse una serie de condiciones previas: 4) que los grupos no estén relacionados; b) que los sujetos de los grupos sean seleccionados al azar, y asignados aleatoriamente a cada uno de ellos; £) que la distri- bución de los datos, en la población de origen, sea normal, y d) que el tamaño de las muestras sea aproximadamente el mismo, pero menor E que 30 (a pesar de que cuando n > 30, la distribución £ tiende a la normal). La importancia de los dos últimos puntos se refiere, básicamente, a la estimación del error típico. Para que la estimación del error típico xa buena, la distribución de la población deberá ajustarse a la normal, Por otra parte, puesto que para el uso de la t, la estimación del error úpico se obtiene mediante la combinación de las desviaciones típicas de las medias muestrales, es necesario, para que se cumpla Ho, que las varianzas de las muestras sean homogéneas; de lo contrario no se partiría del supuesto de que ambas muestras proceden de la misma población. Las suposiciones reférentes a la normalidad de la distribución y ho- mogeneidad de la varianza deberán también cumplirse para los experi- mentos de grupos dependientes, En caso de que no ocurra la homoge- aidad de la varianza, puede aplicarse una serie de pruebas de medias, como la del signo, la de Mann-Whitney, etc., muy apropiadas para aquellos experimentos en los que el tamaño de la muestra es muy pequeño, ho pudiendo, por tanto, asumirse la homogeneidad de la varianza de ambos grupos. if 290 Segunda parte, Los datos empíricos EL ANALISIS DE LA VARIANZA En la sección anterior hemos analizado el empleo de la prueba ¿ ] para conocer la significación de la diferencia de medias de dos grupos. Por otra parte, hay que señalar que existe otro procedimiento que fre- cuentemente se utiliza cuando nos interesa conocer la significación general de la diferencia entre tres o más medias. Este procedimiento recibe el nombre de análisis de la varianza y, al igual que las restantes pruebas de significación, participa del mismo razonamiento lógico, es decir, se comparan dos estimaciones de la varianza de la misma pobla- ción: la varianza de las medias muestrales y la varianza de las medidas dentro de cada muestra o grupo experimental (la cual constituye tam- bién otra buena estimación de la varianza de la población). Tenemos, pues, des estimaciones de la variación de la población: por un lado la variación existente entre las medias de varios grupos (sabemos por hipó- tesis nula que todas las muestras proceden de la misma población); y 3 por otro Jado, la variabilidad de los datos dentro de cada grupo no ofrece una estimación de la variación de la población que no quede * afectada por la acción de los tratamientos, El índice F se considera, como la razón de dos variaciones: s F= o (donde s* es la varianza entre los grupos, y s; la varianza dentro del grupo, o varianza del error). Se parte del supuesto básico de que estas dos estimaciones de la varianza de la población son independientes entre sí, lo cual quiere decir que han sido obtenidas al azar y que, por tanto, no existe ninguna relación entre ambas, Bajo Ho, según la cual los grupos proceden de la misma población, el cociente fluctuará en torno al valor 1, Bajo la hipó» tesis alternativa, en la que se: establece que las muestras proceden de poblaciones diferentes, el índice deberá ser suprior a l, ya que en el numerador se halla la mayor de las estimaciones. La prueba consistirá en el cálculo del cociente de variación y después compararlo con el valor correspondiente dado por la distribución de F (ley de Snedecor) según los grados de libertad que se han utilizado para hacer comparables las varianzas. Partición de la suma de cuadrados En un experimento con dos, tres o más grupos experimentales, el índice F se refiere al total de las diferencias existentes entre los grupos. Cap. 16. Pruebas de significación 291 : Este índice no nos dice si la diferencia existente entre dos grupos es significativa o no; sólo indica la significación global de las medias. En otras palabras si son tomadas en conjunto difieren entre más allá : de lo que cabría esperarse al azar. , Para llegar a esta conclusión es de capital importancia la introduc- ción del concepto de doble variación, En efecto, si se considera la am- plitud de variación de uno de nuestros datos u observaciones experimen- tales, comprobaremos que la variación de esta medida con respecto a la media total del experimento (X+) es igual a la suma del valor de la desviación de este dato con respecto a la media de su grupo (5 y la desviación de esta media con respecto a la media total. De ahí que el propósito básico del análisis de la varianza consista en separar estos dos componentes de la variación total para llegar a una más exacta estima- ción de sus posibles fuentes o causas. Si consideramos, por ejemplo, un datos hipotético X1, donde ¡ representa una observación dada dentro de un grupo experimental k, tendremos que la variabilidad de cada medida con respecto a la media total podrá descomponerse de la si- .. guiente forma: Xm— X= (Xu — Xy) + (Xx — X4). La suma total de cuadrados se obtendrá al elevar al cuadrado dicha ecuación para cada una de las kn observaciones experimentales (sien- do k la cantidad de grupos experimentales y n el número de elementos por grupo). De este modo, llegamos a la siguiente expresión: E > ko S .- = A SS 1 SCtotar == SCerror (sutra» “E SCtratamienton (Lntor) El cuadrado de la variación de todas las observaciones kn en torno de la media total (X+) recibe el nombre de suma de cuadrados total (SC+). Por esta razón, la suma de cuadrados total se dividirá también en dos partes: 2) la suma de cuadrados de las variaciones de cada ma de las » observaciones con respecto a la media £ de su grupo (suma de cuadrados intragrupo o del error $C+), y b) la suma de cuadrados de ls variaciones de las medias de los grupos en torno de la media total (suma de cuadrado intergrupos o de tratamientos), SC+. Ahora bien, las varianzas suelen dividirse entre sus respectivos grados de libertad; a fin de obtener unidades mutuamente comparables. De esta forma, las sumas de cuadrados se transforman en cuadrados medios. 4 Como acabamos de señalar, el cuadrado medio es la proporción de 294 Segunda parte. Los datos empíricos Cap. 16. Pruebas de significación — 285 Aplicando esta fórmula a los datos de nuestro experimento, ten- á E el valor F, o razón de la varianza (F = 3,25), Si entramos en la tabla F remos: por los valores 4 gl y 35 gl, hallaremos que un valor F = 2.65, es sig- nificativo a un nivel del 59%; puesto que en nuestro experimento, F tiene un valor superior al requerido, podemos rechazar la hipótesis nula y concluir que los tratamientos fueron efectivos, (16) + (18) +... + (249 — 422 1 1604, b) Suma de cuadrados de tratamientos: IS (E Zy =3 a - En. ANALISIS FACTORIAL DE LA VARIANZA : En muchos experimentos el investigador se halla interesado por el estudio del efecto de dos o más condiciones experimentales sobre la con- ducta de los individuos. Así, puede interesarle, por ejemplo, hasta qué punto el rendimiento en una tarea de aprendizaje puede quedar afectado por el tipo de tarea a ejecutar y por la cantidad de incentivo ofrecido. En este caso el investigador ha identificado dos factores —tipo de tarea € incentivo— en cada uno de los cuales puede establecer diferentes niveles. Nos encontramos ante un experimento factorial en el cual, si es f completo, deben darse todas las posibles combinaciones de niveles de E ambos factores, Así, un experimento factorial 2 X 2 (dos por dos) indica la combinación de dos factores a dos niveles cada uno, Si en un factor se ; presentaran tres niveles y en el otro dos, tendríamos un experimento factorial 3 X 2, es decir, pueden darse experimentos factoriales con todas las posibles combinaciones de factores y niveles, A partir de los datos de la tabla obtendremos el siguiente resultado: (116) , (92) (u2)= _ (45232 _ A E NS c) Suma de cuadrados del error: hos . Co AY" XX E? A, n Me De los datos del experimento se obtiene: (116)= 1904 E : +19 EEG... +1 701 CEL 56 Este valor puede comprobarse si a la suma de cuadrados total le restamos la suma de cuadrados de tratamientos: 1 160.4 — 314,4 = 864, Ejemplo de análisis de la varianza con un experimento factorial 2 X 2 Supóngase que un experimentador está interesado en conocer el efecto de dos tipos de tarea (fácil y difícil) y dos niveles de incentivo (alto y bajo) sobre el rendimiento en su aprendizaje. Para ello selecciona una muestra aleatoria de 40 sujetos (N= 40), y asigna ocho sujetos, al azar, a cada una de las cuatro posibles combinaciones (n = 8). En Tabla 16.4 Resumen del análisis de la varianza de los cinco grupos de tratamiento Suma d s - e . z Fuente de variación cuadrados E Cuadrado medio F Se experimento factorial se utiliza un Larra haci a 4= So A , de tarea), con dos niveles (as y as = tarca fácil y difícil), y un segundo Intertratamientos sr + 78.60 3% factor (factor B= cantidad de incentivo, también, con dos niveles Intragrupo (error) 846.0 35 24.17 ú po Ñ (b1 y bx = incentivos alto y bajo). Total 1 160.4 39 Es posible evaluar la diferencia entre los niveles 41 y az del factor A, sin que para ello sea necesario considerar el factor B, La media para el nivel a, está dada por Ja suma de todos los puntajes en a, dividido entre 2n; 130/16 = 8.125. La media para el nivel as es de 79/16 = 4.937. Al dividir las sumas de cuadrados de tratamientos y del error entre sus respectivos grados de libertad, hemos obtenido las correspondientes estimaciones de la varianza, en términos de cuadrados medios, es decir, la proporción de varianza por grado de libertad. La división del cua- drado medio intertratamientos entre el cuadrado medio del error nos da» diferencias existentes entre los niveles br y ba del factor B, sin tener en cuenta el factor A. La media para el nivel 51 es de 122/16 = 7.625, E mientras que para el nivel ba es de 87/16 = 5.437. De igual modo podemos efectuar comprobaciones para determinar las * 298 Segunda parte. Los datos empíricos Tabla 16.5. Resultados de un experimento factorial 2 X 2 ES ee EN 7 E 10 8 10 9 10 7 xx 70 A. 62% NoronsoS 52 386 209 1569 lb ds soso wo. AAA ES La partición de la suma de cuadrados es similar al procedimiento empleado para el análisis de la varianza de cinco grupos. Tenemos la suma total de cuadrados, es decir, la de las desviaciones cuadráticas del puntaje de cada sujeto con respecto a la media total: (209)+ 4x8 La de los cuadrados entre tratamientos, la suma de las desviaciones cuadráticas de cada media de grupo con respecto a la medida total: > (27) (209)? Curs == LOL 4 0 +2 + 2) 2 = 126.595, Por último, la de los cuadrados dentro de los grupos, la de las desvia- SCuaa = (DEA (7H (A = 203,97, ciones cuadráticas del puntaje de cada grupo con respecto a su propia ; media y los resultados sumados: = (70)> (60)* 42) PR SCorror = 624 — ¿+ 460-¿— + 386 ES 5 á = 77.375, Tabla 16.6. Análisis de la varianza Fuente de variación se E CM F Entre tratamientos 126.595 Intragrupo (error) 77.375 Totales 203.97 k(n— 1) =28 2.763 kn—1 =31 k-1=3 41.198 14.91 | Cap. 16. Pruebas de significación 297. Un valor F= 14.91 es altamente significado. Ahora bien, podemos considerar en particular la suma de cuadrados de tratamientos, que la vamos a dividir en tres componentes de variación, a cada uno de los cuales Je corresponderá un grado de libertad, Para ello podemos llevar la suma de puntajes para los diferentes grupos en una tabla de doble entrada: ba ba a 70 60 130 La 52 2 79 122 87 209 Calculemos la suma de las desviaciones cuadráticas de los dos niveles de factor A: = (130)? | (79)? _ (20992 _ == 812025, A continuación calcularemos la suma de las desviaciones cuadráticas de los niveles del factor B: = (122)? , (87)* _ (209)1 TS 32 = 38.2825, Para la suma de cuadrados de la interacción presentaremos, en primer lugar, la fórmula que nos permitirá su cálculo, Para ello, denominaremos cada casillero del esquema anterior con una letra: Matriz de interacción 2 X 2 dá E a > a b B bx c b La fórmula que permite calcular la suma de cuadrados de la inter- acción para el esquema anterior, es la siguiente; [(a+d)— (b+ep hn ! 300 Segunda parte, Los datos empíricos En la tabla 16.8 observamos que en el grupo de tarea fácil, la diferen- cia entre incentivos es de 2.25; en cambio, en el grupo de tarea difícil la diferencia es de 4.0, La diferencia entre tarea para el grupo de incentivo alto es de 1.25; en tanto que para el grupo de incentivo bajo es de 3.0, Estos datos revelan la presencia de una interace ón (aunque ello no haya sido demostrado estadísticamente) (fig. 16.1). 3 Medio de rendimientos 2-1N 06200300 a 2 Fig. 16.1. Representación gráfica de la interacción a X b, La interacción puede apreciarse en la figura 16.2, en la que los pun- tajes medios se hallan indicados sobre la ordenada. Los dos niveles de trata- miento, 41 y az, se han señalado sobre la abscisa, Observamos que para el incentivo alto (51), la línea que une ambas medias es casi horizontal, en tanto que, en el caso del incentivo bajo (ba), la línea es más alta en la tarea fácil que en la difícil. Esto quiere decir que para un tipo de incentivo (incentivo bajo), se produce una mayor diferencia entre las medias rela- tivas a las dos clases de tareas, que para un incentivo alto. Supóngase que las lineas que unen cada par de medias fuesen para- Iclas, En la figura 16.2 las líneas de a, b y c son paralelas, pero el sentido de las diferencias varía. En la figura 16.2a las dos líneas paralelas indican la no existencia de interacción, y ascienden ambas de una media más baja a otra más alta; en b se muestran dos líneas paralelas horizontales, y por último, en a, las líneas paralelas descienden de una media más alta a otra más baja. La existencia de líneas paralelas en los tres gráficos denota que la acción de una variable a través de los valores que toma la segunda se mantiene constante, Ello significa, pues, que no existe interacción alguna entre ” ambas. Cap. 16. Eruebas de algniflcación — 801 Hemos analizado un experimento factorial 2 X 2, es decir, con dos variables independientes. Existen, no obstante, experimentos en los que puede aumentar el número de factores independientes y variar la cantidad de niveles correspondientes a cada uno de ellos, Supóngase que diseña- 'mos un experimento teniendo en cuenta cuatro tipos de tarea (4), tres Puntajes medios Mi M My Mi Mm Ma la) to) ter Fig. 16.2. Gráfica que muestra diversas formas de interacción. niveles de incentivo (B), y el sexo de los sujetos (C). En este caso ten- dríamos un experimento factorial 4 X 3 X 2, compuesto por 24 grupos experimentales, Si asignamos ocho sujetos por grupo y tratamiento, po- demos establecer los datos como se muestra en la tabla 16.9. Además de poder conocer la significación de los posibles efectos de A, B y C, dicho análisis nos permitirá calcular la significación estadís- tica de las tres interacciones de primer orden (A X B; AXC,yBXC) Tabla 16.9. Análisis de la varianza para un experimento factorial 4 X 3 X 2 Fuentes de variación Grados de libertad (entre tratamientos) (23) Tratamiento A 3 Tratamiento B 2 Tratamiento C 1 Interacción A X B 6 Interacción A X € 3 Interacción BX C 2 Interacción AX BXC 6 Intragrupos (error) 168 Totales 191 y ; , 302 Segunda parte, Los datos empíricos y la interacción de segundo orden (A X BX C). La interacción de segundo orden representa los efectos del total de las tres variables sobre la variable de medida, Análisis de la varianza en experimentos de medidas repetidas En muchos casos el experimentador se halla interesado en el estudio del efecto repetitivo de una serie de condiciones sobre el mismo sujeto. Esto ocurre, frecuentemente, en los estudios sobre el efecto de la práctica en el aprendizaje, o bien, el efecto de las drogas en la percepción; recien- temente, se están llevando a cabo estudios en los que se intenta analizar la posible acción de la ansiedad en la retención de palabras (o pares asociados) a corto y a largo plazos. Esta es una de las razones por las que dichos experimentos van adquiriendo cada vez más importancia, Consideramos tan solo dos casos: a) primero estudiaremos un experi mento de medidas repetidas simples, es decir, con una sola variable inde- Pendiente; b) en segundo lugar analizaremos un experimento factorial de medidas repetidas. Ejemplos de experimento simple de medidas repetidas Supóngase que un investigador se halla interesado en conocer el efecto de la cantidad de ensayos en el aprendizaje de una tarea motora. Para ello selecciona un grupo de sujetos (n = 5), y los somete a tres condi- ciones de aprendizaje (a, = 5 repeticiones de la tarea; ae = 10 repeti- ciones, y as = 15 repeticiones). De tal manera que tenemos de cada sujeto tres medidas y un total de 15 (tabla 16.10). Tabla 16.10. Resultados de un experimento simple de medidas repetidas Ensayos Sujetos a se a la 1 2 4 5 1 2 1 3 6 10 3 3 2 4 9 4 1 3 6 10 5 3 3 4 10 Xx 10 15 25 50 zx" 2 4 129 502 Xx 2 3 5 Cap. 16. Pruebas de significación 308 El total por columnas representa la suma de los puntajes obtenidos por los sujetos en cada una de las condiciones experimentales. Podemos ob- servar, a partir de las medias, que el rendimiento medio de los sujetos aumenta a medida que aumentamos el número de repeticiones, Los totales por filas indican la suma de puntajes obtenidos por cada sujeto a lo largo del experimento. Nuestro propósito consiste en probar, a nivel esta- dístico, hasta qué punto el incremento que hemos observado en las medias por columnas, es un pure efecto del azar, o se debe más bien, a las diferentes condiciones experimentales, Para ello deberemos calcular las co- rrespondientes sumas de cuadrados según se muestra en la tabla 16,11. Tabla 16.11. Análisis de la varianza para un experimento simple de medidas repetidas Puentes de variación Estado de libertad Ensayos k-1=2 Sujetos n- 4 Ensayos X sujetos k-DA-0=3 Total in—1=4 a) Suma de cuadrados de tratamientos, En nuestro caso, los tres niveles de ensayo. (00)? 4 (05)! , (25) _ 650)" SCiratamientos = 5 == z 15 =23,3, b) Suma de cuadrados de sujetos. Para ello consideraremos las sumas de puntajes obtenidos por los sujetos a través del experimento, con el fin de calcular hasta qué punto parte de la varianza total se debe a la varia- bilidad existente entre los sujetos. Sa = LI q LO y 19)" y LIO)? (00)? (50) En este ejemplo, la varianza debida a las diferencias individuales es 06, c) Suma total de cuadrados, , Cora = (+ e a E 38, d) Suma de cuadrados de la interacción. Si sumamos la SC: y la SC, (23.3 + 0.6= 23.9) comprobamos que no alcanza la variación total que es de 33.3. La diferencia, 9.4, recibe el nombre de interacción $06 Segunda parte. Los datos empíricos Arousal Arousal S 4 a y So a ae » 1 3 3 6 1 0 0 0 2. 2 0 2 2 2 1 3 3 0. 0.0 3 1 1 2 4 0 o o 4 o 0 0 abr 5 3 2 5 abs 5 2 2 4 6 0 0 0 6 0 0 0 7 00.041 1 7.0.0.0 8 0 1 1 8 1 0 1 ES 8 “715 2 6 1701 Este experimento factorial requiere la comparación de valores corres- pondientes a dos variables independientes (neuroticismo y tiempos de prucbas), con respecto a una tercera variable, la comparación de las medidas tomadas del mismo sujeto (arousal inducido). Para ello haremos una combinación del análisis de la varianza aplicado en la comparación de grupos independientes y el análisis utilizado para el experimento, antes visto, de medidas repetidas, Como veremos, en este análisis de la varianza, intervienen dos términos de error: el error entre y el error intra. El error entre nos servirá para determinar la significación del efecto de los factores A y B y su interacción, es decir, el efecto de los factores con grupos de sujetos independientes. El error intra nos servirá para determinar la significación de la variable de medidas repetidas, así como la interacción de esta variable con las otras dos (AX C y BX C), y la interacción conjunta de las tres (4 X BX C). La partición de la suma de cuadrados y grados de libertad, para dicho experimento, se recopilan en la tabla 16.14. Partición de la suma de cuadrados Para la partición de la suma de cuadrados calcularemos, en primer lugar, la suma de cuadrados total: a) Suma de cuadrados total (137)2 SCret = (392 + (19 + (2)? +... + (0)? == 162.37 La suma de cuadrados total, se repartirá entre la suma de cuadrados entresujetos y la suma de cuadrados intrasujetos. b) Suma de cuadrados intersujetos, La suma de cuadrados entre sujetos reflejará las diferencias existentes en los individuos. Para ello se =309 — 146.63 = 1 Cap. 16. Pruebas de significación 307 Tabla 16.14. Partición de la suma de cuadrados y grados de libertad de un experimento factorial con medidas repetidas Fuentes de variación Grados de libertad Intersujetos abn — 1= 63 Tratamiento A a-1=1 Tratamiento B b=1=3 Interacción A X B (a—1)(6-1)=3 Error entre ab(n— 1) =56 Intrasujetos abr(c— 1) = 64 Tratamiento € e=1=1 Interacción A X C Interacción BX C Interacción AX BXC (a-D(c-1)=1 (6 1(c-10)=3 (a—D)(b— 1)(c-1) =3 ab(n—1)(c—1) =56 Total aben— 1 =127 Error intra sumarán loz puntajes dados por cada sujeto, y ello constituirá la base para el cálculo de la varianza intersujetos. Coen - n= 285.5 — 146.63 = 138.87. c) Suma de cuadrados intrasujetos, Dicho cálculo es una estimación de la variación dentro de cada sujeto, Para obtener dicha suma de cua- árados se parte de los puntajes directos y de la suma de los puntajes dados por cada sujeto. SCnsecajaon = (3384 (DE (2984 0 (0) (5), (09, 6) (1) [5 e ] 2 = 309 — 285.5 = 23.5, Partición de la suma de cuadrados entresujetos La suma de cuadrados entresujetos que, en el ejemplo que comen- tamos, tiene abn — 1=63 gl, puede dividirse en: la suma de cua- . drados para el neuroticismo (4); la suma de cuadrados para los tiempos 308 Segunda parte. Los datos empíricos de prueba (B); la suma de cuadrados para la interacción de ambos AX B; y la suma de cuadrados del error entre suejtos Para el cálculo de las diferentes sumas de cuadrados correspondientes a la partición de la suma de cuadrados entresujetos, emplearemos los datos tal como vienen reunidos en la tabla 16.15. Tabla 16,15, Resultados acumulados para el neuroticismo (4) y tiempos de prueba (8) Tiempos de prueba Neuroticismo be ba be ba Totales a 22 15 9 9 55 de 23 4 15 10 82 Totales 45 49 24 19 137 b.l. Suma de cuadrados del neuroticismo (A). Para el cálculo de esta suma de cuadrados utilizaremos los totales de los respectivos va- Jores de A. (55)? + (82)? _ (137)* ci 138 = 152,328 — 146.63 = 5.69. b.2. Suma de cuadrado de tiempos de prueba (B). Como en el caso anterior se tomarán los totales para los respectivos valores de B. — 165), (09) (19)2 _ (137)? _ 32 32 32 128 167,593 — 146,63 = 20.96, » (24)2 SC, ++ b.3. Suma de cuadrados de la interacción AX B. La suma de cuadrados de la interacción AX B, se calcula a partir de los datos reunidos en cada una de las celdillas del cuadro 16.16. 22) (15)? _ (137)2 = 16 16 128 180.062 — 146.63 = 33.432; =Á (23)* (10)? SC aia == ++ + tE 33.432 — 5.69 — 20.96 = 6.77. * En efecto, para la obtención de la suma de cuadrados de Ja inter- acción, se ha calculado la varianza dentro de cada celda del cuadro, pues, cada celda representa un determinado nivel de interacción. A partir ¿ 4 Cap. 16. Pruebas de significación 309 de esta estimación (33.432) se ha restado la varianza ya conocida, debida al factor A (neuroticismo) y la debida al factor B (tiempo de pruebas). b.4. Suma de cuadrados del error entre sujetos. La varianza del error entre sujetos, constituye la varianza residual, Es decir aquella parte de la varianza entresujetos cuya fuente de variación no es conocida y, por tanto, no posee ningún tipo de explicación. Su estimación se obtiene al quitar de la varianza entresujetos, las varianzas ya calculadas, SCorror entresmjetos = 138.87 — 5.69 — 20.96 — 6.77 = 105.43. A continuación, vamos a presentar la partición de la suma de cua- drados correspondiente a la variación intrasujetos. Partición de la suma de cuadrados intrasujetos La suma de cuadrados intrasujetos (23.5), se puede dividir en el ejemplo propuesto en las siguientes partes: la varianza debida al trata- miento de medidas repetidas (arousal o tratamiento C); la varianza debida a las interacciones de primer orden, AX C y BX C; la varian- za debida a la interacción de segundo orden A X B X C; y, por último, la varianza debida al error intrasujetos. La suma de cuadrados intrasujetos, tiene abn(c— 1) =64 gl, dividiéndose en los siguientes componentes: <.1. Suma de cuadrados de la variable de medidas repetidas (arou- sal o C). Para el cómputo de la suma de cuadrados de la variable de medidas repetidas (C), sc partirá de la suma de los puntajes correspon- dientes a cada uno de los valores de C. _ (742, (6372 _ (137) rai 128 = 147.578 — 146.63 = 0.948, c.2. Suma de cuadrados de la interacción neuroticismo X arousal (4XC). Para el cálculo de la suma de cuadrados de la interacción neuroticismo X arousal (A X B), se utilizarán los puntajes acumulados de la tabla 16.16. = 126)" , (48) , 09 (34)? _ (137) _ Cae = Te + +5 128 = 155.531 — 146.63 = 8,901; 8.901 — 5.69 — 0.948 = 2.27. 32 32 $312 Segunda parte, Los datos empíricos a) Suma de cuadrados de la interacción neurolicismo X arousal (AXC). Para el cómputo de la suma de cuadrados de la interac- ción A X C, utilizaremos los datos recopilados en la tabla 16.19. (2692 y 18)", 029%, 1802 — 155.581 — 146.63 =8.901 NE NE SCinteracción axo = 8.901 — 5.69 — 0,948 = 2.27. b) Suma de cuadrados de la interacción tiempos de prueba X arou- sal (BX C). Como en el caso anterior, utilizaremos los datos acumu- lados cn la tabla de resultados de la interacción BX C. (28) , (26)* , 10)» 16 + 16 + 16 SC interacción mío = 25.552 —- 20.963 — 0,948 = 3,64, ot e2 — 192.1875 — 146.63 = 25.552 €s decir, a la suma de cuadrados dentro del cuadro de la interacción le restamos la suma de cuadrados debido al factor B y al factor C, cuyos componentes han sido considerados ya. <) Suma de cuadrados de la interacción simple AX BXC. Para el cálculo de la suma de cuadrados de la interacción antes señalada, utilizaremos los datos de la table 16.19. Tabla 16.19. Datos acumulados para la interacción AX BXC Arousal Neuroti. Tiempos de cismo prueba a a Totales EN b 12 10 22 ba 8 7 15 b, 2 7 9 ba 4 5 9 a bz 16 7 23 bz 18 16 34 ba 8 7 15 ba 6 4 10 Totales 7% 63 137 Este experimento tiene dos términos de error. El primer término (error intersujctos) nos permitirá probar la significación de los tratamientos A Osp. 16. Pruebas de nignificación — 518 Tabla 16.20, Análisis de la varianza del experimento factorial de medidas repetidas Fuentes de variación se a cm F Intersujetos 138.87 63 Neuroticismo (tratamiento A) 5.69 1 569 3.02 Tiempos de prueba (tratamiento B) 20.963 3 698 3.11 Interacción A X B 6.779 3 2.26 1.20 Error (intersujetos) 105,43 56 188 Intrasujetos 23,5 64 Arousal (tratamiento C) 0.948 1 0.948 3.38 Interacción A X C 2,27 1 2,27 8.10 Interacción BX C 3.64 3 1.21 4.33 Interacción AX BXC 0.70 3 0.23 0.83 Error (intrasujeto) 15.94 56 028 083 Total 162.37 127 y B, y de la interacción A X B. El segundo (error intrasujetos) servirá para probar la significación de los efectos restantes, En cuanto a la significación de los resultados, podemos afirmar que, para un nivel de confianza del 5%, los valores de F, respecto de 1 gl y 56 gl, y de 3 gl y 56 gl, son los siguientes: Para 1 gl/56 gl F=4.08, Para 3 gl/56 gl F=284 De ello se concluye que son significativos, a este nivel, los efectos de las variables: tiempos de prucba y arousal, y los efectos de las inter- acciones siguientes: neuroticismo X arousal, y tiempos de prueba X arousal, LA PRUEBA DE SIGNIFICACIÓN DE JI CUADRADA Para aquellos casos en que los datos han sido reunidos en escalas de medida nominales y que por tanto, la única posibilidad de cuantificación es el recuento de frecuencias para cada una de las categorías que forman la escala, la prueba de x”, es un procedimiento adecuado para probar la significación de los resultados. Para ello se convierten las frecuencias en proporciones. La lógica básica de la prueba consiste en preguntarse hasta ¿ qué punto la proporción observada se aparta significativamente o no, | de la proporción esperada, 314 Segunda parte. Los datos emptricos Ejemplo simple de la aplicación de ji cuadrada Analicemos el siguiente ejemplo en relación con el uso de x? como prueba de significación. Supóngase que se desea realizar un estudio sobre la preferencia de trabajo en equipo que presentan los alumnos del sexto semestre de bachillerato. Para ello extraemos una muestra de 120 muchachos, y dividimos las preferencias de trabajo en equipo en tres cate- gorías; positiva, negativa y neutra. La hipótesis nula consistiría en asumir que la proporción de elección de las tres categorías es la misma: fa = P= P= 1/3, En consecuencia, para una muestra de 120 sujetos, esperaríamos encontrar 40 para cada una de las categorías, Estas fre- cuencias hipotéticas reciben el nombre de frecuencias esperadas. A continuación, preguntaríamos a cada sujeto cuál es su preferencia con- Creta con respecto al trabajo en equipo; así, obtendríamos las frecuencias observadas. En el presente ejemplo, las frecuencias observadas podrían ser: 60, 35, 25, respectivamente, para cada una de las categorías antes citadas, A fin de determinar hasta qué punto las diferencias existentes entre las frecuencias teóricas y las observadas se deben al azar, podemos aplicar la siguiente fórmula: =1 (0-7 E AO en la que O denota la frecuencia observada y E la frecuencia esperada, Observemos en la tabla 16.21 que se han calculado tres ji cuadra- das, una para cada discrepancia entre O y E. La suma de las tres ji cuadradas nos da: x? = 16,25, Con este resultado vamos a la tabla de x?, para k— 1 gl (siendo k el número de categorías), es decir, para 2 gl, comprobamos que para un nivel de significación de 0.01, el valor de x? es de 9,21. Puesto que nuestro valor, x* = 16,25, es considerable- mente superior al de la distribución de x* para 2 gl, concluiremos que nada se opone en rechazar la hipótesis nula con un riesgo de error del 1%. Tabla 16.21. Operaciones para el cálculo de ji cuadrada Preferencia o E O-E (0 Ey ez Positiva 60 40 20 400 10 Neutra 35 40 5 25 0.625 Negativa 25 40 =15 225 5.625 Total 16.25 Cap. 16. Pruebas de significación $15 Otras aplicaciones de ji cuadrada La prueba de significación de ji cuadrada se puede aplicar a gran variedad de situaciones experimentales, siempre que queden clara- mente definidas las categorías de las respectivas variables, y exista una base para el cálculo teórico de las frecuencias esperadas. En la práctica el número de categorías suele ser bastante reducido debido a la difi- cultad que supone dividir a los sujetos en grupos confiables según criterios complejos. A continuación presentamos las aplicaciones más frecuen- tes de x?. La tabla de contingencia A. menudo nos encontramos con experimentos en los que es posible dividir a los sujetos según dos dimensiones de variación. Puede ocurrir, por ejemplo, que un sujeto pertenezca a un estrato social alto y posea un título universitario. Esto nos puede sugerir que posiblemente en la población general exista algún tipo de relación entre estrato social y nivel cultural, La tabla de contingencia k X 1 nos permitirá conocer si ambas variables poseen alguna relación significativa. Supóngase, por ejemplo, que nos interesa conocer la actitud de los empleados de una empresa con respecto a la dirección. Para ello entre- vistamos a cada empleado. Éstos se hallan distribuidos en cinco secciones. Les preguntamos cuál es su actitud frente a la dirección. Las tres posibles elecciones de respuesta que damos a los empleados son las siguientes: favorable, neutral y desfavorable. Con los hipotéticos resultados de nuestro estudio, presentaremos una tabla de contingencia k X 1, donde k representa las columnas y 1 las filas. El cálculo de x? requiere que todas las casillas del cuadro presenten las frecuencias esperadas. Si no se posee una base teórica que permita | establecer una hipotética suposición sobre la proporción de actitudes favorables, neutrales y desfavorables existentes dentro de cada grupo de Tabla 16.22. Actitudes de los empleados frente a la dirección Sección Favorable Neutral Desfavorable Totales 1 14 (7.98)* 2 (3.04) 3 (7.98) 19 2 10 (7.98) 3 (3.04) 6 (7.98) 19 3 8 (7,56) 5 (2.88) 5 (7.56) 18 4 6 (9.66) 5 (3.68) 12 (9.66) 23 5 4 (8.82) 1 (3.36) 16 (8.82) 21 Totales 2 16 42 100 * Los números entre paréntesis representan las frecuencias esperadas,