Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Tema 2 Experimental, Apuntes de Psicología

Asignatura: Metodología Experimental, Profesor: Juan Delgado metodologia experimental, Carrera: Psicología, Universidad: USAL

Tipo: Apuntes

2012/2013

Subido el 29/06/2013

geekko
geekko 🇪🇸

3.2

(13)

7 documentos

1 / 35

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Esquema de los diseños experimentales y
casi-experimentales.
*
Prof. Dr. D Juan Delgado Sánchez-Mateos
Departamento:
Psicología básica, Psicobiología y Metodología de las ciencias del
comportamiento
Universidad de Salamanca
Índice
I Deniciones. 2
II Esquema de los diseños experimentales. 3
III Variaciones de los diseños simples y factoriales 6
1. Grupos control 6
2. Tipos de pre-observación 8
2.1. Análisis estadísticos de los diseños con pre-test. . . . . . . . . . . 8
3. Bloques 10
3.1. Interacción bloque
×
tratamiento y aditividad. . . . . . . . . . . . 11
3.2. Pruebas asociadas al supuesto de aditividad, y soluciones en caso
deviolación.............................. 12
3.3. Enconclusión............................. 16
*
Esta obra está bajo una licencia Attribution-NonCommercial-NoDerivs 3.0
Unported de Creative Commons. Para ver una copia de esta licencia, visite
http://creativecommons.org/licenses/by-nc-nd/3.0/ o envie una carta a Creative Com-
mons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22
pf23

Vista previa parcial del texto

¡Descarga Tema 2 Experimental y más Apuntes en PDF de Psicología solo en Docsity!

Esquema de los diseños experimentales y

casi-experimentales.

Prof. Dr. D Juan Delgado Sánchez-Mateos

Departamento:

Psicología básica, Psicobiología y Metodología de las ciencias del comportamiento

Universidad de Salamanca

Índice

I Deniciones. 2

II Esquema de los diseños experimentales. 3

III Variaciones de los diseños simples y factoriales 6

  1. Grupos control 6
  2. Tipos de pre-observación 8 2.1. Análisis estadísticos de los diseños con pre-test........... 8
  3. Bloques 10 3.1. Interacción bloque×tratamiento y aditividad............ 11 3.2. Pruebas asociadas al supuesto de aditividad, y soluciones en caso de violación.............................. 12 3.3. En conclusión............................. 16 *Esta obra está bajo una licencia Attribution-NonCommercial-NoDerivs 3. Unported de Creative Commons. Para ver una copia de esta licencia, visite http://creativecommons.org/licenses/by-nc-nd/3.0/ o envie una carta a Creative Com- mons, 171 Second Street, Suite 300, San Francisco, California 94105, USA.
  1. Estrategia intra-sujetos 18 4.1. Técnicas de control de los errores de tiempo............ 20 4.1.1. Dos condiciones: Contrabalanceo............... 20 4.1.2. Dos condiciones: Aleatorización completa y en bloques.. 21 4.1.3. Más de dos condiciones: Contrabalanceo completo e in- completo............................ 22 4.1.4. Más de dos condiciones: Aleatorización completa y en blo- ques............................... 23
  2. Diseños factoriales 23 5.1. Diseño 2×2............................... 24 5.2. Diseño 2× 4.............................. 30 5.3. Diseño 2× 2 × 2............................ 31 5.4. Diseño Solomon............................ 33 5.5. Diseños factoriales mixtos...................... 33
  3. Bibliografía 34

Parte I

Deniciones.

Las diferencias entre los diseños experimentales y los pre-experimentales, o cuasi-experimentales, o casi-experimentales son escasas aunque muy impor- tantes. La fundamental es la relativa al modo en que se asignan los participantes a los grupos de comparación. En los diseños experimentales esa asignación que- da completamente bajo el control del investigador, o del experimentador, en su caso. Es muy importante el concepto asignación porque de los distintos planes o modos posibles de decidir qué sujeto experimental será sometido a qué tratamiento o tratamientos se deriva directamente qué diseño concreto se llevará a cabo, qué comparaciones serán posibles, que preguntas podremos hacer en el experimento. Pero, junto con la asignación, se suelen considerar tres parámetros que per- miten distinguir un experimento de un pre-experimento:

  1. Quién recibe qué tratamiento;
  2. cuándo lo recibe;
  3. quién lo administra.

Si cualquiera de esos tres parámetros no quedan bajo el control del experimenta- dor, hablamos de un diseño casi-experimental. Revisemos estas dos situaciones:

a) Queremos comparar los resultados académicos nales de los estudiantes de 1º de Psicología del plan de estudios del 2005 con los de los estudiantes de 1º de Psicología del Plan adaptado al EEES (plan Bolonia), conviniendo que

representa mediante la letra O mayúscula, habitualmente con el subíndice 1 para señalar que es la primera medición entre varias. Se suele representar la administración de un tratamiento escribiendo una X  en el grupo que lo recibe, y nada en el grupo control (aquél con el que se compara). Finalmente, se considera post-observación o post-test la medición nal de la variable de respuesta una vez que se hubiesen manifestado los eventuales efectos de los tratamientos.

Diseño Asignación Pre-test Tratamiento Post-test Simple de dos grupos Azar X O Azar O

Simple de tres grupos Azar X 1 O Azar X 2 O Azar O

Factorial 2 × 2 Azar XA 1 B 1 O Azar XA 1 B 2 O Azar XA 2 B 1 O Azar XA 2 B 2 O

Pre-test - Post-test Azar O 1 X O 2 Azar O 1 O 2

Solomon (1949) Azar O 1 X O 2 Azar O 1 O 2 Azar X O 2 Azar O 2

Cuadro 1: Esquema general de los diseños experimentales básicos

Los diseños simples se caracterizan por probar los efectos de un único fac- tor sobre una variable de respuesta, sobre la que se observa después de asignar tratamientos a los grupos. El número de tratamientos varía, haciéndolo, en con- secuencia, el número de grupos. Un tratamiento y un control, o dos tratamien- tos diferentes, se estudian con el diseño simple de dos grupos al azar. Más tratamientos implicarían más grupos. Entendemos por tratamientos cada uno de los posibles valores que tome el factor en un diseño experimental dado. Los diseños más frecuentemente estudiados, por ser los más simples, y además por su excelente control sobre los factores que afectan a la validez interna, son aquellos en los que no se realizan pre-observaciones. En concreto los diseños de un único factor (dos o más niveles de tratamientos, siendo uno de ellos control, o no siéndolo) y los diseños factoriales. Los diseños con pre-test, como el Pre-test - Post-test tienen la ventaja de que podemos saber de antemano si los grupos asignados al azar eran iguales o no antes de administrar tratamientos. Así nos aseguraríamos de si esos tratamientos

cambian a los grupos respecto de su ejecución previa, sin tratamientos. Pero esa discutible ventaja se ve contrarestada por los problemas asociados a los potenciales efectos reactivos y a los potenciales efectos interactivos causados por la pre-observación. Y no siempre se dispone de métodos ni de posibilidades de estimar si existen y, en su caso, en qué medida se dan. Así, un diseño simple con pretest será una mala opción a menos que se disponga de evidencia de que el pre-test no provoca efectos reactivos ni interactivos. Más adelante discutiremos alguna posible solución para este caso. Otra solución posible a este problema sería la utilización del diseño Solomon, en el que se mezclan dos diseños; uno simple de dos grupos con pre-test y otro simple de dos grupos sin él. Probablemente, si fuese necesario medir antes del tratamiento, (y no parece que esa sea una situación ni frecuente ni deseable), este diseño sería el ideal para controlar los efectos reactivos y los interactivos, si existiese cualquiera de ellos. Posponemos una discusión más detallada de este diseño para un poco más adelante.

Diseño Asig. Pre. Trat. Post. Trat. Post. Réplicas conmutadas Azar O 1 X O 2 O 3 Azar O 1 O 2 X O 3

Cruce (crossover) Azar O 1 X 1 O 2 X 2 O 3 Azar O 1 X 2 O 2 X 1 O 3

Longitudinal Azar O 1... O 1 X O 2 O 2... O 2 Azar O 1... O 1 O 2 O 2... O 2

Cuadro 2: Esquema de otros diseños experimentales

De entre los diseños con pre-observaciones hay algunos que tienen interés. Se han seleccionado tres (Tabla 2): el de Réplicas conmutadas (switched repli- cations), el de Cruce (crossover), y el Longitudinal. El primero, de réplicas conmutadas, permite conocer los efectos de los tratamientos (control y experi- mental) en momentos diferentes para los grupos de comparación. El hecho de hacer varias observaciones a lo largo del tiempo también permite controlar los posibles efectos de la pre-observación. Para el caso de dos tratamientos distintos (X 1 y X 2 ), el diseño de Cruce per- mite estimar efectos temporales sobre los tratamientos. Se observaría el efecto de X 1 en primer lugar en un grupo, y el de X 2 en primer lugar en el otro grupo. De- spués, en una segunda ocasión, se cruzan los tratamientos, observando el efecto de X 2 en el primer grupo y el de X 1 en el segundo. Sabríamos asi, si los efectos de cada tratamiento (por ejemplo X 2 ) son similares cuando se administran en una primera o en una segunda ocasión. Esto permite conocer si se dan errores de tiempo, y controlarlos. No se controlan los errores de trasferencia asimétrica, que consisten en que el efecto facilitador (o perjudicial) de un tratamiento sobre otro (transferencia de aprendizaje, interferencia, etc.) sea distinto cuando van en un orden que cuando ese orden se invierte. Por ejemplo, si la transferencia

mente es un valor de tratamiento activo del factor, siendo de hecho un tratamiento inerte, que se conoce que no tiene efecto alguno sobre la vari- able de respuesta. Es frecuente en investigación farmacológica, donde la administración de un suero salino, o una pastilla de azucar (con aspecto adecuado, desde luego) controla los efectos de la situación de prueba, inclu- so aparentemente el tratamiento activo, de modo que lo único que cambia es el ingrediente activo en un caso e inerte en el otro. Todo es igual excepto exactamente lo que queremos saber si funciona o cómo funciona. El sujeto cree haber sido tratado: se controla esa creencia.

  1. Expectativa. Cuando es importante el proceso de administración de los tratamientos, y éstos se anticipan, es frecuente que los sujetos tengan la expectativa de recibir un tratamiento determinado. Finalmente, reciben el tratamiento, con lo que esa expectativa se ve satisfecha. Pero en el caso del grupo control, lo que de hecho reciben es un placebo. Así, la expectativa es igual en los dos grupos. Se controla la expectativa.
  2. Lista de espera. Se mantiene una primera reunión con todos los sujetos. A los del grupo experimental se les administra el tratamiento con el nivel del factor previsto. A los del grupo control no se les administra, y se les promete un tratamiento en una segunda reunión. Con ello se controla el efecto de la anticipación del tratamiento. Frecuentemente, acabada la investigación, se trata a las personas que estaban en este grupo.
  3. Grupo atendido. Las personas en un grupo atendido se encuentran oca- sionalmente con los investigadores. Si están en un grupo de lista de espera, la espera se realiza manteniendo contacto con el equipo de investigación. Se pretende controlar el posible efecto del contacto social con ese equipo (que también es posible que tenga efectos sobre el comportamiento que se pretende estudiar -dependiendo. obviamente, del tipo de comportamiento de que se trate).
  4. Grupo no atendido. No hay contacto especial con las personas del grupo control. Suele utilizarse cuando a un grupo se le administra una determi- nada terapia (cognitiva, por ejemplo), y al otro no se le administra.
  5. Si, en el caso anterior no hay, además, expectativa de recibir tratamiento, este tipo de tratamiento (o ausencia) controla sólo la remisión espontánea del problema no tratado.

Nada hay que impida que, en situaciones concretas, existan otros procedimientos que permitan controlar los efectos de tratamientos por contraste con grupos que, o bien reciben el tratamiento más habitual (al que se puede considerar control en ese sentido), o bien reciben un tratamiento que puede tener interés considerar como el nivel básico para comparar con él los demás. Realmente, el concepto de grupo control es amplio.

  1. Tipos de pre-observación

En los diseños con pre-observación, o pre-test, como vimos más arriba, el problema fundamental es la posibilidad de aparición de efectos reactivos (los participantes en el experimento adaptan sus respuestas en el post-test al hecho de que ya han sido expuestos antes a los métodos y contenidos de la medición), y efectos interactivos (los participantes que tras el pre-test reciben tratamientos reaccionan -efectos reactivos- en el post-test en una medida diferente a aquella en la que reaccionan los participantes del grupo no tratado). Para evitarlos se proponen tres alternativas:

  1. Pre-test simulado (proxy): que consiste simplemente en la sustitución de la variable de respuesta medida en el pre-test por otra muy similar aunque no idéntica a ella; típicamente una variable conceptualmente relacionada con la respuesta que se medirá en el post-test. Al no ser la misma variable en ambas ocasiones, cabe pensar en los efectos reactivo e interactivo se dejarán sentir de forma mucho menos marcada, incluso cabe en muchas ocasiones descartarlos.
  2. Pre-test repetido: se trata de dos pre-tests antes del tratamiento, sobre la misma medida de respuesta. Permiten evaluar diferencias antes del tratamiento, así como efectos de maduración, regresión o instrumentación. Aunque aparentemente más pre-tests no debieran ser la solución a los efec- tos de la pre-observación, de hecho permiten evaluar mejor esos efectos, y nada mejor que el conocimiento de aquello cuyos efectos se quieren con- trolar.
  3. Pre-test retrospectivo: administrado en el mismo momento del post-test, solicita a los sujetos experimentales que describan su situación y estado antes del tratamiento. Por ejemplo, que evalúen cuánto han aprendido du- rante el experimento, o cuánto han visto incrementada (o decrementada) su ejecución normal, etc. El problema de este tipo de procedimiento es que está sujeto a demasiados sesgos: motivacionales, deseabilidad social, etc. Probablemente sea un procedimiento mejor para evaluar la experiencia subjetiva del participante que para estimar efectos de tratamiento.

2.1. Análisis estadísticos de los diseños con pre-test.

Hay varios enfoques posibles para analizar los diseños con pre-test. El más simple de los cuales consiste en comparar los datos de post-observación del grupo control y del experimental. Esto, que es posible, tiene sentido sobre to- do si los datos del pre-test proporcionan evidencias de que los dos grupos se han comportado de forma sensiblemente igual en el pre-test, lo que se consid- eraría como prueba de que ambos grupos eran sensiblemente iguales antes de la administración de tratamientos. A pesar de todo, con este procedimiento no se garantiza que no aparezcan efectos reactivos o interactivos como los antes señalados.

  1. Bloques

Los diseños de bloques son una variación posible, y muy importante, de los diseños aleatorizados (simples o factoriales). Consiste en la formación de conjuntos de sujetos que compartan una característica relevante en la misma medida. Por ejemplo, los sujetos que sean muy introvertidos (en la misma me- dida) forman uno de esos conjuntos. Los que sean un poco menos introvertidos (en la misma medida) forman otro conjunto. Así, se forman conjuntos de su- jetos iguales respecto de la variable introversión - extroversión, hasta llegar al conjunto de los más extrovertidos. A cada uno de esos conjuntos de sujetos se los denomina bloques. El caso más sencillo lo constituye el diseño de grupos apareados, en el que cada pareja es un bloque, en la medida que comparta una característica determinada. La variable en la que se mide esa característica (por ejemplo, introversión - extroversión) se denomina variable de bloqueo. Suele ser una variable no ma- nipulable, habitualmente un atributo personal de cada sujeto (lo que permite también hablar de ellas como de variables atributivas): su inteligencia, su ha- bilidad, su capacidad numérica, su uidez verbal, su estatura, etc. Así, sujetos máxima e igualmente hábiles, por ejemplo, forman un bloque; sujetos de habili- dad alta, forman otro; de habilidad media, otro; etc. Las de bloqueo son variables que el investigador no puede manipular, pero puede usar seleccionando sujetos sobre la base de sus distintos valores. Se llaman por eso, también, variables de asignación. Una característica relevante de los diseños de bloques, de hecho la que acon- seja su uso, la constituye el hecho de que reducen (o pueden reducir) el error experimental. La variable de bloqueo es una parte de las diferencias interindi- viduales que, si es relevante para un experimento concreto, puede sustraerse de la cantidad de error provocada por las múltiples diferencias interindividuales ex- istentes. Está claro que esa variable de bloqueo ya no es una fuente de varianza desconocida, sino controlada, conocida, de efectos calculables. En la Figura 1 se muestra una tabla de datos proveniente del manual de Kirk (1995). Se somete a un grupo de 32 personas a cuatro tratamientos (a1, a2, a3 y a4 ), por ejemplo a cuatro tipos diferentes de terapia. Previamente se han formado ocho bloques (bl1, bl2, ..., bl8 ), cada uno con cuatro personas mínimamente variables respecto de una característica atrubutiva, por ejemplo, ocho niveles de ansiedad rasgo medida según el STAI (Spielberger, Gorsusch & Luschene, 1970). Así, por ejemplo, en el bloque bl1 las personas con menor ansiedad, en el bloque bl8 las personas con mayor ansiedad. Se mide (en un ejemplo cticio) el número de síntomas de depresión que subsisten tras la terapia.

En la Figura 1 aparecen las sumas por columnas (tratamientos) de las pun- tuaciones, sus medias y los efectos, denidos como diferencias entre las medias de los grupos y la media total del experimento. Aparecen también las sumas, medias y efectos para las las (bloques). En ambos casos (tratamientos y blo- ques) se elevan los efectos al cuadrado y se suman (suma de los cuadrados de

Figura 1: Ejemplo de un diseño de bloques (Kirk, 1995)

los efectos, o suma de cuadrados de los efectos). Con ellas se podría realizar fácilmente el análisis de varianza, conocida la suma de cuadrados total, que se calcularía del mismo modo que en cualquier diseño de grupos. Se cumpliría así:

SCT otal − SCtratamientos − SCbloques = SCerror(residual) El error se calcula en este diseño como un resto, un residuo. Contiene todas las variaciones no explicadas ni por tratamientos ni por bloques, lo que incluye errores de medida, irrelevancias aleatorias, diferencias interindividuales distintas de la variable de bloqueo (distintas de la ansiedad rasgo), etc. Pero lo más relevante es que ese resto se conceptúa como la interacción entre bloques y tratamientos, y esa interacción hay que considerarla con un poco más detalle.

3.1. Interacción bloque×tratamiento y aditividad.

La Figura 2 contiene la representación gráca de los datos de este ejemp- lo. Nos jamos primero en la línea quebrada que corresponde a los datos del tratamiento a1, que parece corresponder a puntuaciones que van haciéndose menores conforme aumenta la ansiedad (conforme se pasa de los primeros a los últimos bloques). Ocurre lo mismo con la línea quebrada correspondiente al grupo de tratamiento a2. En general, las puntuaciones son más altas que las del tratamiento a1, pero también se encuentra un patrón análogo de decrecimien- to conforme se pasa de los primeros a los últimos bloques. Algo similar puede decirse de los datos del tratamiento a3 : decrecen cuando crece el ordinal de bloque. En los tres casos se ha dibujado una línea recta (más na) que correspondería a la tendencia lineal de cada grupo de tratamiento. Pues bien, las desviaciones de los datos alrededor de esa tendencia lineal reejan la naturaleza del error en estos diseños. Podríamos concluir, a partir de la información de a1, a2 y a3 que se trata de tratamientos aditivos: pasar del tratamiento a1 al tratamiento a equivale a sumar una constante a las puntuaciones del primero para obtener las del segundo. Puede objetarse que esta aditividad no es perfecta, y, en efecto, no lo es, aunque sí aproximadamente. Habrá menos objeciones si concluyésemos que las tendencias, en los tres casos, son lineales decrecientes. Si la aditividad

a1 a2 a3 a a1 1. a2 0.881 1. a3 0.830 0.745 1. a4 -0.587 -0.527 -0589 1.

Cuadro 3: Matriz de correlaciones de Pearson de los datos del ejemplo de Kirk (1995).

perspectivas, acercarse a este problema. La primera es la prueba de no aditividad o prueba de un grado de libertad de Tukey. Consiste en el cálculo de la suma de cuadrados de la interacción A Lineal×B Lineal (que tiene un único grado de libertad, al tratarse de una comparación o contraste entre medias), conoci- da como suma de cuadrados de no aditividad y que constituye una estimación de la interacción sistemática, para sustraerla del error calculado anteriormente. Quedaría, entonces, el modelo de análisis como sigue:

SCT otal − SCtratamientos − SCbloques = SCerror(residual)

donde

SCerror(residual) = SCN oAditividad + SCrestoN A

y en la que SCrestoN A(suma de cuadrados de error resto de la no aditividad ) es la suma de cuadrados de error que queda tras restar del error residual el componente de interacción. Ese error resto de la no aditividad, nalmente, puede utilizarse como término de error correcto para este experimento. Claro está, este error se calcula con un grado de libertad menos de los que tenía el error residual: el de la no aditividad que se ha sustraido. La segunda prueba que nos permite conocer si la no aditividad es estadísti- camente signicativa, es decir, aumenta signicativamente la imprecisión del ex- perimento, se basa en la estructura de la covarianza de los tratamientos. Veamos. Si volvemos a observar la Figura 2, convendremos en que con los datos de los tratamientos a1, a2 y a3 se pueden calcular índices de correlación y que éstos arrojarán resultados positivos: a valores altos en a1, corresponden valores altos en a2 y a3, a valores bajos en a1, corresponden valores bajos en a2 y a3, ... Pero convendremos también en que la correlación calculable con cualquiera de los datos de los tratamientos a1, a2 y a3 con los datos del tratamiento a serán negativos. A valores altos en a1, a2 o a3 se corresponden valores bajos en a4, mientras que a valores bajos en a1, a2 y a3 se corresponderían valores altos en a4. Así, la falta de aditividad del grupo a4 con los grupos a1, a2 y a se puede detectar en el patrón de correlaciones entre los datos. En la Tabla 3 se encuentra la matriz de correlaciones para este ejemplo. En ella vemos cómo, en efecto, la la inferior contiene correlaciones negativas, ree- jando la falta de aditividad del grupo a4 con los demás; y correlaciones positivas entre los grupos a1, a2 y a3. Pero más útil que la matriz de correlaciones es

a1 a2 a3 a a1 2. a2 1.357 1. a3 1.143 0.714 0. a4 -1.143 -0.714 -0.714 1.

Cuadro 4: Matriz de varianza - covarianza de los datos del ejemplo de Kirk (1995)

a1 a2 a3 a a1 1. a2 0.107 1. a3 0.107 0.107 1. a4 0.107 0.107 0.107 1.

Cuadro 5: Matriz de varianza - covarianza promediada, para los datos del ejem- plo de Kirk (1995)

la de varianza - covarianza. En ella (Tabla 4) se representan en la diagonal las varianzas de los grupos de tratamiento (a1, a2, a3 y a4), que deben cumplir la condición clásica para los análisis estadísticos paramétricos de ser homogéneas. Fuera de la diagonal se encuentran las covarianzas entre los datos de los dis- tintos tratamientos. Recuérdese que la covarianza y la correlación reejan, bien que de modo distinto, las mismas relaciones entre los grupos. No se olvide que

rxy =

covxy SxSy

de modo que la correlación es un valor adimensional mientras que la covarianza, como la propia varianza, se expresa en las mismas unidades que la variable de- pendiente, elevadas al cuadrado. Pero, si la covarianza es positiva, la correlación es positiva, y si la covarianza es negativa, la correlación es negativa. Hemos de añadir que, del mismo modo que las varianzas (en la diagonal de la matriz) han de ser homogéneas, también han de serlo las covarianzas. Así, la matriz ideal contendría la misma varianza en la diagonal, por una parte, y la misma covarianza fuera de la diagonal, por otra. Una prueba posible consi- stiría en probar el ajuste entre la matriz de varianza - covarianza obtenida de hecho y la matriz de varianza - covarianza que antes hemos llamado ideal, que se construiría promediando las varianzas por una parte, y promediando las co- varianzas por otra parte, y reejando ambos valores en esaa nueva matriz, que podríamos llamar matriz promedio (Tabla 5). Con esta nueva matriz promedio tenemos un término con el cual comparar la matriz obtenida. Tal comparación se realiza a través de la prueba de Box, o prueba de igualdad y simetría de las matrices de varianza - covarianza. Tal de- nominación alude al hecho de que las varianzas y las covarianzas tienen valores constantes, o iguales, y que esta matriz es simétrica respecto de ambas diago- nales. Este tipo de matrices se dice que tienen simetría compuesta. La fórmula de

y Greenhouse, 1958). Actualmente, el enfoque más utilizado y recomendado es el ajuste ˜ε de Huynh y Feldt, aunque es probable que aparezca alguna veces el de Geisser y Greenhouse en algún programa estadístico, o en artículos de investigación.

3.3. En conclusión

Salvando los problemas que se acaban de discutir, los diseños de bloques se analizan según al principio dijimos:

SCT otal − SCtratamientos − SCbloques = SCerror(residual)

se calcula la suma de cuadrados total, cosa que sabemos hacer (con todos los datos), la suma de cuadrados de tratamientos (con los efectos de los tratamien- tos, que se encontraban en las columnas de la Figura 1)), la suma de cuadrados de bloques (con los efectos de los bloques, que se encontraban en las las de la Figura 1), y, por sustracción respecto de la total, la suma de cuadrados de er- ror residual (bloque×tratamiento). Dividiendo esas sumas de cuadrados por sus grados de libertad correspondientes, que serían (a - 1) para tratamientos, (n -

  1. para bloques, y (a - 1)(n - 1) para el error, tendríamos las medias cuadráticas correspondientes. Con ellas, se calcularían las razones F necesarias. Obviamente, desde un punto de vista experimental la única razón F necesaria sería la de tratamientos

F =

M CA

M Cerror

aunque la de bloques también vale la pena calcularla. Esa razón

F =

M Cbloques M Cerror

nos indicaría en qué medida la variable de bloqueo se relaciona con la variable dependiente. Esa información es conveniente porque nos indica en qué medida se ha reducido la varianza de error respecto del valor que tendría en un diseño de grupos al azar. Si la variabilidad de los bloques fuese escasa, no signicativa estadísticamente, la variable de bloqueo no habría servido para reducir el error, con lo que habríamos hecho un experimento más costoso que uno de grupos al azar (y de supuestos mucho más complejos) para nada. En el ejemplo que estamos manejando, probablemente ese es el caso. La Figura 3 representa la variabilidad de tratamientos, y la Figura 4 la variabilidad de los bloques. Mientras en la primera observamos cierta variación en las medias, en la segunga la gráca plana parece indicar pocos efectos diferenciales de los bloques. En todo caso, los análisis estadísticos y los intervalos de conanza nos per- mitirán concluir de modo conveniente. No se olvide que todo lo que es necesario con un diseño de grupos lo es en la misma medida con uno de bloques: revisión de supuestos, realización de

Figura 3: Gráca de las medias de los tratamientos del diseño de bloques del ejemplo numérico de Kirk (1995)

Figura 4: Gráca de las medias de los bloques del diseño de bloques del ejemplo numérico de Kirk (1995)

  1. etc.

A pesar de las evidentes ventajas, estos diseños también presentan serios incon- venientes. Entre ellos:

  1. La posibilidad de aparición de errores de tiempo, o progresivos. Se trata del hecho de que los tratamientos han de administrarse sucesivamente al mismo sujeto. Ello hace que, al comienzo del procedimiento experimental el sujeto se encuentre descansado, y al nal haya aumentado su fatiga. Los tratamientos administrados al principio y al nal del procedimiento experimental pueden sumar (o restar) a sus efectos los de la práctica o la fatiga que se acumula progresivamente con el paso del tiempo.
  2. A veces los efectos de los tratamientos son efímeros, en cuyo caso no hay problemas especiales con estos diseños. Pero otras veces esos tratamientos son duraderos, con lo que se hace necesario realizar el experimento en eta- pas, con el riesgo consiguiente de pérdida de sujetos, o de la acumulación de aún más errores progresivos.
  3. Aunque no es exclusivo de los diseños de medidas repetidas (aparece tam- bién en los de bloques), es serio el potencial problema de la interacción entre tratamientos y sujetos: el hecho de que los efectos de los distintos tratamientos no afecten en la mima medida aditiva a los diferentes sujetos. Por ejemplo, a Juan y a Alberto el tratamiento A1 les afectan en la misma medida, pero el tratamiento A2 afecta más a uno que a otro. Si el efecto de A2 fuese aditivo sobre el efecto de A1 habría de afectar también en una medida similar (mejorando o disminuyendo sus puntuaciones) a los dos sujetos. Esto, obviamente, dentro de los límites del azar. Pero ese es el problema, a veces esa falta de aditividad supera esos límites y se hace sistemática. Entonces hay un problema, porque los modelos estadísticos dependen de varios supuestos, entre ellos el de aditividad de los efectos de los tratamientos. Ya hemos visto anteriormente la complejidad de ese supuesto.

Los problemas asociados a los errores de tiempos requieren soluciones especiales. Se conocen, en general, como técnicas de control de los errores de tiempo o progresivos. Hay que señalar que en los diseños intrínsecamente de medidas repetidas no es necesario preocuparse con los errores de tiempo, porque en estos diseños los citados errores no son tales, sino una característica relevante del diseño: precisamente es el paso del tiempo el que forma parte del tratamiento (recuérdese el ejemplo, más arriba, de los niños con dicultades de lectura, en los que el tratamiento consistía sencillamente en la acumulación de días en los que observaba el tiempo que pasaban leyendo. En cambio hay diseños en los que la práctica o la fatiga que crecen con el tiempo que lleva el sujeto realizando la tarea experimental no se deben confundir con el efecto del tratamiento que se va administrando también a lo largo del tiempo. Para tratar de evitar esa confusión, existen ciertas técnicas de control que vale la pena revisar.

4.1. Técnicas de control de los errores de tiempo.

4.1.1. Dos condiciones: Contrabalanceo.

Supongamos que se van a medir tiempos de reacción ante 10 estímulos vi- suales y ante 10 estímulos auditivos. Se toman a los mismos sujetos experimen- tales primero tiempos presentando estímulos visuales, después tomándolos al presentar estímulos auditivos. Mediante este procedimiento, con los estímulos visuales el sujeto no tiene aún práctica con la tarea (por ejemplo, pulsar un botón en un mando), mientras que con los auditivos ya la ha realizado antes, lo cual tenderá a facilitar sus respuestas. Esa facilitación afectará crecientemente ensayo tras ensayo, con lo que en los diez últimos ensayos, es decir, ante estí- mulos auditivos, su media será mejor que en los diez primeros. Ese efecto del tiempo, de la práctica, ese error progresivo se confunde, entonces con el efecto que pudiera tener el tratamiento (visual / auditivo). Algo análogo cabe decir de la fatiga, el tiempo de reacción medio ante estí- mulos visuales se toma al principio, con poca fatiga, mientras que el tiempo de reacción medio ante auditivos se toma cuando la fatiga puede haber afectado más. No se está diciendo aquí que esos errores sean inevitables y se produzcan siempre. Lo que se está diciendo es que, en el caso de que se produzcan, no somos capaces de discriminar cuánto hay de efectos de los tratamientos y cuanto de errores de tiempo. Ni tampoco cabe pensar, como una mirada demasiado inocente puede pretender, que los errores debidos a la práctica y los debidos a la fatiga se compensen. Más bien lo que ocurre es que se mezclan de un modo desconocido y muy posiblemente dependiente de la tarea que el sujeto experimental deba ejecutar. La solución conocida como contrabalanceo es muy simple: a la mitad de los sujetos experimentales se les toman primero tiempos presentando estímulos visuales, y después se toman presentando estímulos auditivos; a la otra mitad se les toman primero tiempos presentando estímulos auditivos, y después se toman presentando estímulos visuales. El esquema es muy simple: a - b; b - a.

Orden 1 º 2 º Tratamientos Visuales Auditivos Tratamientos Auditivos Visuales

Cuando calculemos la media de los tiempos de reacción ante estímulos vi- suales, esta media, si contiene efectos de orden, los contiene tanto por haber aparecido en primer lugar como por haber aparecido en segundo lugar: es decir, tiene balanceados esos efectos de orden o de tiempo. Lo mismo puede decirse de la media de los tiempos de reacción ante estímulos auditivos. El hecho de balancear o equilibrar esos efectos cambiando el orden es lo que se conoce como contrabalanceo. El único problema importante que puede plantear esta estrategia es el de la transferencia asimétrica: se trata de un fenómeno perfectamente conocido en Psicología: al realizar una determinada tarea, se transere a otra nueva una