Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

Control de Estimulos. Lectura complementaria, Apuntes de Psicología

Universidad de Sevilla (US)Psicología

Prof. María Francisca Arias

Asignatura: Aprendizaje complejo, Profesor: María Francisca Arias, Carrera: Psicología, Universidad: US

Tipo: Apuntes

2016/2017

Subido el 29/05/2017

laura_coll_cortes 🇪🇸

4.3

(11)

11 documentos

1 / 37

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Descubre Apuntes de Psicología Universidad de Sevilla (US)

Documentos relacionados

TEMA 8 APRENDIZAJE

TEMA 5 APRENDIZAJE COMPLEJO Y COGNICIÓN

TEMA 1 INTRODUCCIÓN CONCEPTUAL Aprendizaje y conducta complejos:

(2)

conducta novedosa

TEMA1.2 VARIACION Y SELECCIÓN

Otras orientaciones dinámicas: Adler, Lacan y Psicoanálisis contemporáneo

(1)

ihibicion reciproca

EL ANÁLISIS EXPERIMENTAL CONDUCTUAL DE LA CONCIENCIA Significados comunes del término

(2)

Sociedad de Hipnoterapia Clínica

(2)

fac examen

(3)

fac examen

(8)

examen FAC POR TEMAS

(13)

Vista previa parcial del texto

¡Descarga Control de Estimulos. Lectura complementaria y más Apuntes en PDF de Psicología solo en Docsity!

248 — Psicología del aprendizaje que producen. La descarga inescapable induce más miedo que la descarga escapable (Mineka, Cook y Miller, 1984). La ansiedad que suscita la descarga inescapable sería" la causa de la interferencia. Los defensores de esta hipótesis argumentan que la des- carga inescapable provoca por una parte, miedo condicionado a las claves del aparato y por otra, alteraciones en los niveles de neurotransmisores circulantes (Weiss y Sim» son, 1985). Estos factores interactúan para interferir en el aprendizaje posterior. Aun» que los déficit biológicos desaparecen pronto, el miedo condicionado a las claves del aparato dura más tiempo (48-72 horas). Si la fase de prueba ocurre inmediatamente después de la fase de pretratamiento, el miedo dificulta la ejecución de la respuesta. Se ha constatado que cuando los animales pueden predecir la descarga, no apa» rece el efecto de interferencia (Seligman y cols. 1968, 1975). De acuerdo con esto, los estímulos predictores generan claves asociadas con la ausencia de descarga, Cuando los ensayos de descarga son predecibles, la ausencia de señal predice la au- sencia de descarga. El alivio y la relajación suscitados por tales claves de seguridad reducen los efectos deletereos de la descarga. En estudios recientes, se ha comprobado, además, que cuando se presenta en la fase de pretratamiento un estímulo breve después de la descarga inescapable, desa- parcce el efecto de interferencia en la fase de prueba (Mineka y cols. 1985; Minox, 1990; Ferrándiz y Vicente, 1992; 1995). Este segundo estímulo adquiere propiedpr ys des de señal de seguridad y alivio. Como este estímulo feedback e correlacionar ap do con la ausencia de descarga, disminuye el nivel de estrés y suscita un estado dé4 relajación en el sujoto que facilita el aprendizaje posterior. Desaparece el miedo? crónico y los sujetos se comportan como los controles, Estos datos sobre el efecto de los estímulos feedback cuestionan las hipóte: que enfatizan el papel crítico que juega el aprendizaje instrumental en el efecto interferencia. La idea de que cs la percepción de la falta de contingencia entre lá $ respuesta y la terminación de la descarga la que lleva al sujeto a formarse expectatiz vas de incontrolabilidad que dificultan el aprendizaje posterior no se sustenta, CAPÍTULO 6 CONTROL DE ESTÍMULOS* M.* Francisca Arias Holgado Santiago Benjumea Rodríguez Francisco Fernández Serra 6.1. Introducción El presente capítulo tratará sobre los fenómenos de a a, néricamente bajo el epígrafe “Control de estímulos En é a Ct e edad det respuestas condicionadas que ls siguen, uirir sobre la probabilida: las A Cs pavlovianas o de paturaleza instrumental : DA Con todo, a a se reconocer que, a medida que se vaya avanzando enel pes miento yo ría de las situaciones experimentales analizadas lo serán a * condicionamiento in trumental u operante, desplazando progresivamente a, as ca del com. pavloviano. Ello no obedece más que al hecho histórico de que la temática del con trol de estímulos ha sido abordada de forma mucho más exhau: treno del primero. :0 e instrumental 6.1.1. Control antecedente de la conducta en el condicionamiento cli A) Control de estímulo positivo 0 excitatorio . os diionamiento € ya se ha visto en el Capítulo 3, el resultado obvio del IAE omo ya se ha E 03, ol cos namiente clásico excatorio es que un estímulo inicialmente Po o o aa y ici á á la mediante sl 5 d 5 nada (RC), acabará provocándola p u aso n e 1 condi e ando a llamarse estímulo condicionado (EC). Di estímulo incondicionado (El), pas: : Di: Sho con otras palabras, la aparición de la RC puede ser ahora provocada p *) Este trabajo ha sido financiado me yu 193-1456 concedida por la Dirección «diante la ayuda PB94-1456 conce ( q ral Ye Investigación Científica y Técnica del Ministerio de Educación y Ciencia (España), dentro del Programa de Promoción General del Conocimiento, 250 Psicología del aprendizaje aparición previa del EC. De igual forma, cuando un organismo aprende a emitir una nueva respuesta instrumental para obtener reforzamiento, lo hace ante deter- minados estímulos que están presentes cn dicha situación. Por ello, y tal como acer- tadamente formuló Thorndike (1911), la presencia de tales estímulos llamados modernamente estínulos discriminativos (ED)-- evocarán la emisión de dicha res- puesta por parte del organismo. Es decir, tanto ci condicionamiento clásico como el instrumental u operante implican a nivel conductual con independencia de los ni- veles representacionales o cognitivos el aprendizaje y desarrollo de un nuevo con- trol antecedente sobre la respuesta, de forma que ésta se hace más probable cuan- do dichos estímulos antecedentes están presentes. Tradicionalmente, siguiendo la lógica del modelo del reflejo, el tipo de control antecedente implícito en el condicionamiento clásico se ha visto más como una for- ma de conexión mecánica EC-RC que como un contro] probabilístico de la res- puesta por el estímulo. Ésta fue, históricamente, la razón fundamental que permitió a Skinner (1935, 1937) diferenciar entre ambos tipos de condicionamiento, defen- diendo el carácter emisivo o probabilístico del control antecedente ejercido por los ED sobre la respuesta operante, frente al supuesto conexionismo mecanicista del control antecedente pavloviano!, Vista desde la perspectiva actual, sin embargo, tal distinción nos resulta bastante irrelevante: el carácter mecanicista o probabilístico de la relación de control antecedente es más dependiente del tipo de procedimiento experimental y del sistema de medida elegido que de la propia naturaleza del tcnó- meno. Baste recordar, por ejemplo, que la tasa de una respuesta esquelética como el picoteo o la opresión de una palanca en una cámara experimental, siempre fue considerada como la medida empírica de probabilidad de emisión de una operante. Sin embargo, hoy es también la forma en que se miden (directa o indirectamente) las RC pavlovianas en las dos preparaciones de condicionamiento clásico más utili- zadas en la actualidad: el automoldeamíiento (Brown y Jenkins, 1968) y la respuesta emocional condicionada (Estes y Skinner, 1941). B) Control de estímulo negativo o inhibitorio Existe una segunda forma de control de estímulo que es simétrica y opuesta a la anterior. En tales situaciones, el organismo debe aprender a inhibir una RC o a de- jar de emitir una respuesta operante en presencia de determinados estímulos. Én el caso del condicionamiento clásico, hablamos de inhibición condicionada para este tipo de situaciones y EC inhibitorios para los estímulos que ejercen un control ne- gativo antecedente sobre la RC (ver Capítulo 3). En el caso del condicionamiento instrumental u operante, llamamos control discriminativo negativo y estímulo delta (EA) respectivamente al proceso de control y al estímulo controlador. En resumen, se dice que existe control de estímulos cuando una respuesta -pavloviana o instrumental- cambia de probabilidad al presentarse dichos estímu- los. Si el cambio implica un aumento de la probabilidad de la respuesta con respec- to a la que ésta tenía en ausencia del estímulo antecedente, se habla de control de estímulos positivo o excitatorio, Por contra, si la probabilidad de que la respuesta á me a Capítulo 6: Control de estímulos 251 aparezca es menor en presencia que en ausencia del estímulo controlador, se habla de control de estímulos negativo o inhibitorio. 6.1.2. El control antecedente como proceso de adaptación del organismo al medio Aprender a reaccionar dando las respuestas oportunas en los momentos ade- cuados tiene, obviamente, un alto valor de supervivencia para los organismos. Por ello, como cualquier proceso de aprendizaje, el control de estímulos puede ser visto como un mecanismo de adaptación del individuo al medio. Algunos autores han se- ñalado la similitud entre los procesos propuestos por Darwin para explicar la adap- tación filogenética y los implicados en la evolución ontogenética de la conducta (Skinner, 1966, 1981, 1984; Staddon y Simmelhag, 1971; Gilbert, 1972; Richelle, 1987, 1992), Staddon y Simmelhag (op. cit.), por ejemplo, mostraron cómo los prin- cipios darvinianos de variación y selección podían ser trasladados analógicamente al campo de los principios del aprendizaje. Así, mientras que los principios de varia- ción conductual constituirían el bloque de procesos encargados de generar nuevas conductas —a través de la producción ordenada de variaciones del comportamiento ya existente— los llamados principios de selección se encargarían de eliminar, de en- tre todas las variantes producidas por los primeros, aquéllas más inútiles o menos adaptativas para el organismo en una determinada situación. Retomando dicha pro- puesta, analizaremos la temática del control de estímulos en su doble vertiente de selección y generación de nuevas conductas. A) Principios de selección: discriminación de estímulos Una de las caras del control de estímulos es la restricción de determinados com- portamientos a determinados ambientes. Esto es, no todas las conductas adquiridas son necesarias o adaptativas en todos los ambientes. Por ello, aprender a ejecutar cada una de ellas en el contexto oportuno constituye una de las habilidades básicas para sobrevivir, cconomizando el esfuerzo conductual. Así, cuando los perros de Pavlov aprendían a salivar ante el sonido de un metrónomo mediante un proceso de condicionamiento clásico, también estaban aprendiendo a no hacerlo ante cual- quier sonido que escucharan, no agotando la producción de sus glándulas salivares ante cualquier estimulación acústica percibida. De igual forma, cuando una rata aprende a oprimir una palanca al iluminarse una lamparita en su cámara experi- mental -que indica que dicha conducta será recompensada con comida— también está aprendiendo a no hacerlo cuando está apagada, economizando su esfuerzo al no emítir la conducta cuando ésta es inútil. Genéricamente, se llama discriminación al proceso selectivo de control de estí- mulos que se encarga de limitar los comportamientos aprendidos a determinados ambientes y de evitar que éstos se den en cualquier circunstancia. A los procedi- mientos, fenómenos y teorías relativos a la discriminación de estímulos dedicare- mos la primera parte de este capítulo. 254 — Psicología del aprendizaje generaliza ante tales estímulos o, si se prefiere, que cl sujeto discrimina bien entre el Es y los estímulos El y E9. Valores intermedios de respuesta, como los presenta- dos ante los estímulos E2 y E3 y ante E7 y ES, nos indican un cierto grado de gene- ralización, obviamente mayor en el caso de E3 y E? que en E2 y ES. Si queremos, de forma complementaria, podemos decir que cl sujeto discrimina mejor entre el -. E+ y los estímulos E2 y E8 que entre el E+ y los estímulos E3 y E7. La unión de todos los puntos que nos indican los distintos valores de la respues- ta en presencia de cada uno de los estímulos probados, nos permite trazar una línea que se llama gradiente de generalización. El ejemplo utilizado en la Figura 6.1 108 ape | pone de manifiesto una generalización media ante estímulos próximos al entrena " do. Por su parte, en la Figura 6.2, podemos observar en A que el sujeto respondg prácticamente lo mismo al E+ (ES) que al resto de los estímulos que le presentag mos (El a EA y E6 a E9). Éste sería un caso de generalización completa o, si se pres fiere, de respuesta indiscriminada. En estos casos suele decirse que el E+ no ejercg ningún control especial sobre el comportamiento del sujeto. En el ejemplo utilizado en B de la Figura 6.2 tenemos justamente el caso contrario al acabado de ver. El su- jeto sólo responde ante el E+ (ES), no haciéndolo, prácticamente, ante el resto de sc, los estímutos de prueba (El a E4 y E6 a E9). De hecho, ante un gradiente de esti naturaleza, diremos que el sujeto no muestra ninguna generalización o, si prefer mos, que el sujeto discrimina perfectamente entre el E+ y el resto de los estímulas que le hemos presentado. El control ejercido sobre la conducta del sujeto por el es tímulo entrenado es, en este caso, completo. Valor de la respuesta EL 02 PS Es DS 6 ET ES ES j Dimensión de los estímulos A Figura 6.2. Gradientes de gencralización extremos. En A aparece un gradiente Plano que p ne de manifiesto una generalización completa. En B se represcata un gradiente con trazas muy inclinado que indica una perfecta discriminación. ¿ produce una gran discriminación entre E+ y el resto de los estímulos). Cuando el 255 Capítulo 6: Control de estímulos La observación de la inclinación o pendiente de la línea de un gradiente permi- te, por tanto, decir rápidamente qué grado de generalización/discriminación ante estímulos no entrenados presenta un sujeto. Si la línea es prácticamente paralela a la abscisa y el gradiente tiende a ser plano (caso A de la Figura 6.2), decimos que se ha producido una generalización completa. Cuando, por el contrario, se produce una fuerte caída desde el valor de respuesta observado ante E+ y los valores obte- nidos ante el resto de los estímulos probados, cuando, en definitiva, la inclinación del gradiente es muy pronunciada, decimos que no se da generalización (o que se trazado del gradiente desciende moderada y progresivamente respecto al valor de respuesta obtenido en presencia del E+ (caso de la Figura 6.1), concluiremos que el sujeto presenta niveles medios de generalización. B) Índices de discriminación Al contrario de lo que se ha hecho en el apartado anterior, en vez de destacar el grado de generalización que presenta un sujeto ante estímulos no entrenados, se va a fijar la atención en el proceso complementario. Al hacerlo hablaremos del nivel de discriminación que posee un sujeto entre el E+ y otros estímulos, subrayando así hasta qué punto ejerce el estímulo entrenado mediante reforzamiento un buen con- trol antecedente sobre la conducta, Una manera sencilla de hacer esto es emplear alguna razón o índice de discriminación (Skinner, 1938). Para ello se comparará el nivel de respuesta en presencia del estímulo entrenado mediante reforzamiento (E+) con el nivel de respuesta ante cualquier otro estímulo, simplemente no entre- nado o entrenado como E- (ver nota 2). Con tal comparación se logra determinar en qué medida el nivel de respuesta ante el E+ se aparta del nivel de respuesta que pudiera presentarse tanto ante estímulos nuevos no explícitamente entrenados co- Mo ante el E-, explícitamente no reforzado. Podemos operar como sigue: Nivel de respuesta a E+ l.= » Nivel total de respuesta donde el “nivel total de respuesta” está constituido por la suma de los valores de Tespuesta al propio E+ y al otro estímulo presentado, ya se trate de un E- o de un estímulo sin entrenamiento específico. Si el sujeto sólo responde en presencia del E+, y no ante el otro estímulo, el ín- dice de discriminación (1) será igual a 1. En este caso la discriminación será per- fecta y la generalización nula. En términos de contro! de la conducta por los es- tímulos antecedentes, diríamos aquí que el estímulo entrenado como E+ ejerce un Control total sobre el comportamiento del sujeto. En caso de que el otro estímulo 256. Psicología del aprendizaje fuese un E-, igualmente podríamos decir que, de forma complementaria, el Exe ejerce un control antecedente total sobre el comportamiento, en el sentido de quef*" en presencia del E-, el sujeto sc abstiene por completo de presentar la conducta? condicionada al Ex. a Por el contrario, si el sujeto responde por igual al E+ que al otro estímulo po bado, el 1, será de 0,5. El sujeto en este caso no discrimina entre los estímulos que se le presentan o, lo que es lo mismo, generaliza entre ellos, no existiendo un con- trol diferenciado del E+ sobre el comportamiento del sujeto. En el caso de que el otro estímulo probado fuera un E--, podríamos añadir que tampoco estc segundo estímulo ejerce un adecuado control antecedente sobre el comportamiento, ya q y su presencia no “inhibe” las respuestas del sujeto. Valores intermedios del I,,, ent 1 y 0,5, ponen de manifiesto distintos niveles de discriminación, siendo ésta másg na cuanto más próximo a 1 se encuentre el índice obtenido. Finalmente, si al cal lar el Ip obtuviéramos valores significativamente inferiores a 0,5, tendremos que; mulo respecto al E+. 6.2.2. Situación estándar de reforzamiento diferencial con dos estímulos Las situaciones más simples para obtener una buena discriminación implican 1: utilización de, al menos, dos estímulos entrenados de mancra diferente, Si ante da estímulo X, el sujeto recibe sistemáticamente reforzamiento, y ante el estímulo Y, no lo recibe nunca (procedimiento de reforzamiento diferencial), cabe esperar quí 2 el sujeto se muestre sensible a tal entrenamiento. Cuando se manipula el ambiente” del sujeto cómo se acaba de describir, se le da la oportunidad de comportarse d manera diferenciada ante estímulos del medio que han sido bien diferenciados, La sensibilidad al entrenamiento diferencial consistirá, precisamente, en que el sujeto s¿ llegue a discriminar entre los dos estímulos presentados. El logro de la discrimina: ción se traducirá, en cl ejemplo anterior, en que el sujeto presente la respuesta en. presencia del estímulo ligado al reforzador (X: E+) y no la presente ante el estín le lo que, en su historia, nunca fue seguido por la operación de reforzamiento (Y: EJ A continuación se estudian las distintas posibilidades que se pueden emplear en reforzamiento diferencial de dos estímulos. En primer lugar, hay que contar con la variable orden de presentación de los €s- tímulos implicados en la situación de discriminación. La ocurrencia temporal del Es y del E- puede ser simultánea o, por el contrario, sucesiva. 7 Para el establecimiento de una discriminación por cl procedimiento simultáneo”, se presentan a la par al sujeto tanto el E+ como el E-. Así, por ejemplo, imagine: mos que tenemos a una paloma cn una caja de Skinner donde, a derecha e izqui da del comedero, hay dos teclas que, aleatoriamente, se van iluminando cada Uf con un color (rojo y verde). El sujeto tiene la posibilidad en todo momento de res ponder a una o 2 otra tecla. Supongamos ahora que, con independencia de su locag: lización a derecha o a izquierda del comedero, el sujeto es reforzado por picotear ¿2 Capítulo 6: Control de estímulos 257 tecla que en ese momento está iluminada de rojo; por el contrario, si responde a la tecla uminada con verde, no obtiene el reforzador (programa concurrente de re- forzamiento-extinción). Tal situación permitiría el aprendizaje de la discriminación entre los dos colores presentados simultáneamente, llegando a convertirse en este caso el color rojo en E+ (EP) y el color verde en E- (EA). El procedimiento de discriminación sucesiva implica, por su parte, la presenta- ción secuencial de los dos estímulos que vamos a entrenar. Supongamos ahora que tenemos a una paloma en una caja de Skinner con una sola tecla de respuesta. A veces la tecla se ilumina de rojo y, si el sujeto presenta la respuesta de picoteo a la tecla, aparece el reforzador; en otros momentos la tecla se ilumina con color verde y, aunque el sujeto la picotee, no aparece nunca el reforzador (programa múltiple reforzamiento-extinción). Este procedimiento lleva también a la discriminación en- tre los dos colores, llegando el sujeto a responder solamente en presencia del E+ (color rojo: ED) y absteniéndose de picotear la tecla cuando ésta se ilumina con el color que ha funcionado como E- (verde: EA). Una segunda variable a tener en cuenta para el establecimiento de una discri- minación es el momento o instante en que, dentro del procedimiento, se comienza a presentar cl E—. Si el E- se introduce desde el principio de la primera sesión de condicionamiento hablaremos de presentación inicial. Si, por el contrario, la intro- ducción del E- tiene lugar después de varias sesiones de entrenamiento de la res- puesta, nos referiremos a una condición de presentación posterior del E- (Terrace, 1963, 1966). Por último, y como tercera variable que afecta al aprendizaje discriminativo, se- ñalaremos el modo en que es presentado el E-. Siguiendo nuevamente a Terrace : (1966) que, por lo demás, recoge antecedentes experimentales que se remontan entre otros a Pavloy (1927)- distinguiremos entre condiciones de presentación constante y progresiva del E-. En la primera, el E- permanece invariable a lo largo de todo el entrenamiento, Supongamos que los estímulos que se emplean en una discriminación vienen definidos por los colores con los que se ilumina una tecla de ¿ na caja de Skinner, mediante el modo de presentación constante del E- la ilumi- nación de la tecla tendrá siempre la misma duración y brillantez que tenga el E+ : cuando, a su vez, le toque presentarse. Sólo la longitud de onda del E- (el matiz dentro de un color o el color con el que se ilumina la tecla) diferirá de la longitud de onda empleada como E+. Por su parte, cuando se utiliza el modo de presenta- ción progresiva del E-, las diferencias entre este estímulo y cl E+ son notables al comienzo del entrenamiento. En la situación de encendido de tecla que acabamos de comentar, con la presentación progresiva del B- no sólo existirán diferencias de longitud de onda respecto al E+; además, al comenzar el entrenamiento, el brillo y la duración del E- serán menores que los que se estén empleando con el E+. Pro- gresivamente, a lo largo del entrenamiento diferencial, iremos aumentando tanto la brillantez como la duración del E- hasta alcanzar los valores que, desde el comien- zo, hemos dado al E+. Mediante el análisis de las diferentes técnicas que se analizarán a continuación se pueden ver los efectos que las variables citadas ejercen sobre el establecimiento de una discriminación. 260 Psicología del aprendizaje ejemplo, Ferster y Skinner, 1957). Esto lleva a la conclusión de que cuanto más lar- sn e Intermitente sea la historia de condicionamiento previa a la introducción de la * situación discriminativa, más “errores” cometerá j ? i , á el suje ación jeto respondiendo en presen- B) El modo de presentación del E- Antes de la década de los veinte, ya se realizaron en el laboratorio de Paviov di- versos experimentos que, manipulando el modo de presentación del E-, sometieron a prueba la rapidez y eficacia en la adquisición de una discriminación. Los result dos obtenidos por Pavlov y sus colaboradores fueron muy claros, Sistemál camente, cuando el procedimiento discriminativo se realizaba por etapas. “comenzando el 0 trenamiento con dos estímulos claramente diferentes y, poco a poco acortando 2 diferencias entre ellos hasta hacerlas mínimas (entrenamiento progresivo), se obte. nía con rapidez una buena discriminación. Si se optaba por el procedimiento ue se ha llamado * constante”, presentando desde el comienzo del entrenamiento directas mente a seo dos estímulos muy semejantes, la discriminación, si es que llegaba d darse, se ecía trabajosamente. Los experimentos de uno de los discípulos de mo ubergritz (Pavlov, 1927)- servirán para ilustrar lo anterior. mn mpleando como RC ha salivación en un perro, se pretendía que el animal dis- inara entre círculos de papel de igual tamaño pero diferentes colores. Para ello se empleó una escala de 50 tonalidades cuyo valor 1 correspondía al color blanco el valor 50 al negro. El entrenamiento consistió en la presentación, más o menos al z atoria (entrenamiento sucesivo), de un círculo blanco (valor 1 de la escala) ue seguido por la comida (ensayos de condicionamiento del E+) y de un círculo pis d ro (valor 10 de la escala) que nunca era reforzado (ensayos de condicionamiento del E-). Después de 75 presentaciones del círculo gris, el perro no mostraba signos de discriminación y salivaba en presencia del E-. Tras ello se comenzó a resentar a animal un círculo gris mucho más oscuro (valor 35 de la escala) como E la dis: minación se estableció en pocos ensayos. Progresivamente se utilizaron como $ círculos con tonos grises cada vez más claros (valores 25 y 15 de la escala) hasta 1 gar al gris de valor 10. Informa Pavloy de que, en total, bastaron 20 presentacion: de los Cuatro tonos de grises para alcanzar una discriminación completa (ausencia di salivación condicionada en presencia del gris elaro de valor 10). El experimento reseñado pone de manifiesto que con un modo de presentación: progresiva del > se logra que el sujeto cometa menos “errores” discriminativos que : ndo el modo de presentación del E- es constante. Usando ratas y empleando A e es poca separados, en discriminaciones simultáneas, los sujet o qu nen e CON pocos “errores si el entrenamiento es progresivo. Por coma, ls sa fetos cometen más “errores” si los dos tonos próximos del gris $ o de anera constante a lo largo de todo el entrenamiento (Schlosberg y- , 1943; Lawrence, 1952). de para eolica estos resultados, babría que retomar la descripción de los gradientes» ' geueralización hecha con anterioridad. Como se ve en la Figura 6.1 ante estímul Capítulo 6: Control de estímulos 261 Ex, los sujetos suelen dar más respuestas que anie estí- os al E+. Teniendo esto presente, podemos asumir que el E- tiene un valor constante y próxi- más próximos o similares al mulos más alejados o distint en Jos entrenamientos discriminativos donde mo al Ex, el grado de generalización desde este último estímulo hacia el primero se- rá alto y, por lo tanto, los sujetos cometerán abundantes “errores”. Por el contrario, en los casos de entrenamiento progresivo, el grado de generalización desde el E+ hacia el E- inicial (estímulo bastante distinto del propio E+) será muy escaso y, por lo tanto, los sujetos cometerán pocos “errores”. Pero, además, las claras diferencias físicas entre los dos estímulos que se presentan al sujeto al comienzo de) entrena- miento, facilitan que éste los perciba como distintos y ligados a consecuencias dife- rentes (reforzamiento frente a ausencia de reforzamiento), con lo que la discrimina- ción entre el E+ y el primer valor del E- se establece con rapidez. Alcanzada por el sujeto una primera discriminación entre el E+ y “otro” estímulo, la discriminación entre E+ y los nuevos valores que progresivamente empleemos para el E- se ve faci- litada, lográndose, de este modo, llegar a discriminar con pocos “errores” entre dos estímulos próximos. Hay que señalar la semejanza existente entre el procedimiento progresivo de dis- criminación y el moideamiento por aproximaciones sucesivas de una conducta ope- rante que, de forma espontánea, no presenta el sujeto. Como se sabe, mediante el moldeamiento por reforzamiento diferencial se logra instaurar en el repertorio COn- ductual del sujeto una conducta inicialmente inexistente. De igual forma, mediante el procedimiento discriminativo progresivo, se instaura, paso a paso, una diferenciación de conducta ante dos estímulos próximos que, de manera más o menos “espontánea” (entrenamiento constante), el sujeto tiene dificultades para establecer. De hecho, por analogía con el moideamiento de conducta mediante aproximaciones sucesivas, hay que hacer referencia al procedimiento progresivo de discriminación como moldea- miento discriminativo, ya que con su empleo se da forma, poco a poco, a una discri- minación o diferenciación clara en la conducta ante estímulos físicamente bastante si- milares. Desde esta óptica, el procedimiento progresivo de discriminación no es más que uno entre los posibles usos del moldeamiento para establecer nuevos comporta- mientos (respuestas discriminadas en este caso) dentro del repertorio de un sujeto. C) Combinaciones del modo y del momento de presentación del E- do las incidencias del momento y del modo de introducir discriminativo, podemos plantearnos qué in- na discriminación la combinación de las los que permiten las variables mo- prueba empírica tales Analizadas por separa: el E- en la situación de aprendizaje fluencia tendrá sobre la adquisición de Us distintas posibilidades de presentación de estímul do y momento. Terrace (1963) fue el primero en someter a combinaciones que, resumidas, aparecen en el Cuadro 6.1, Las dos variables, con dos posibilidades procedimentales cada una de ellas, nos permiten plantear cuatro técnicas diferentes para el establecimiento de una discri- minación: procedimiento inicial-progresivo, inicial-constante, posterior-progresivo y, por último, posterior-constante. 262 Psicología del aprendizaje modo de introducción del E- en la situación discriminativa. CUADRO 6.1. Posibilidades de presentación del E- resultantes de combinar el momento y el 3) MODO DE PRESENTACION DEL E- A E Progresivo Constante MOMENTO DE | Inicial Procedimiento Procedimiento PRESENTACION Inicial Progresivo Inicial-Constamte DELE- 7 Posterior Procedimiento . Procedimiento Posterior-Progresivo | — Posterior-Constante Por lo visto hasta ahora, cabe pensar que será el procedimiento inicial-progresi-| vo el que con mayor rapidez y eficacia permitirá establecer una buena discrimina, ción entre un E+ y un E-. Efectivamente, en este procedimiento se combinan tanto el momento idóneo para presentar el E- (al inicio del condicionamiento) como el' modo de hacerlo (progresivo). Por otro lado, cabe prever que será el procedimien: E to posterior-constante el más lento y menos eficaz para que el sujeto aprenda a dis- si criminar entre E+ y E-. Tal previsión se asienta en el hecho de combinar las dos condiciones de presentación (momento posterior y modo constante) que, al ser probadas de manera independiente, mostraron menos eficacia para la instauración baña de la discriminación. A partir de los resultados expuestos en los apartados anterio $% res, los dos procedimientos restantes (inicial-constante y posterior-progresivo) dez. En derian, permitir el establecimiento de la discriminación con más dificultad que el cedimien: - il ás fáci limi » rocedimien 10 inicial-progresivo, pero más fácilmente que el procedimiento posté- de __ La situación experimental básica diseñada por Terrace consistía en entrenar 2 diferentes grupos de palomas a discriminar entre el encendido en rojo o en verde e de la tecla de respuesta de una caja de Skinner. El encendido en rojo funcionó co- mo Ex, siendo seguidas las respuestas de picoteo a la luz roja por el reforzador, la: iluminación de la tecla con color verde constituyó el E- ante el que las posibles res puestas de picoteo no eran reforzadas. Un elemento común a las cuatro combina-* ciones experimentales empleadas por Terrace era que las ocurrencias del E+ y el Los resultados de la investigación se ajustaron a las predicciones que hace un momento planteamos. Adoptando como medida de la discriminación lograda el nú: k mero de respuestas que los sujetos presentan en presencia del E- (el número di : errores discriminativos que cometen las palomas, en la terminología de Terrace, los sujetos del entrenamiento inicial-progresivo prácticamente no respondieron an* le el E ajo largo de las 28 sesiones de entrenamiento. Durante el mismo período? media de respuestas al E- de los sujetos del grupo posterior-constante se aproxi”. 263 Capítulo 6: Control de estímulos mó a las 4.000; de ellas, alrededor de 3.500 (como media del grupo) fueron dadas durante las tres primeras sesiones de entrenamiento. Los grupos que tuvieron en- trenamiento inicial-constante y posterior-progresivo cometieron un número inter- medio de “errores”. El aprendizaje de una discriminación sin, virtualmente, res- puestas ante el E- llevó a Terrace a bautizar al procedimiento inicial-constante como entrenamiento de discriminación sin errores. Por contraste con los resultados de ese entrenamiento, el procedimiento posterior-constante puede ser considerado como prototipo del lento aprendizaje con “errores de una discriminación. Las interpretaciones de los resultados obtenidos por los distintos grupos no son diferentes a las que, por separado, ya hicimos cuando analizamos las distintas posí- bilidades de presentación del E-—. Así, en el grupo inicial-progresivo (sin “errores”), debido al entrenamiento inicial, habrá poca resistencia a la extinción de la respues- ta y poca capacidad de generalización desde el E+; a ello hay que añadir que, en ca- so de producirse generalización desde el E+, dado que el E- es inicialmente muy distinto del E+ (entrenamiento progresivo), se verá poco afectado por la posible generalización. Todo conduce en el entrenamiento inicial-progresivo a una rápida y buena discriminación entre los dos estímulos. En el polo opuesto están los resulta- dos del entrenamiento posterior-constante. Podemos justificarlos asumiendo, en primer lugar, que cuando es introducido tardíamente el E- (entrenamiento poste- rior), la resistencia de la respuesta a la extinción ya será alta debido al prolongado entrenamiento en solitario del E+ y, por ello mismo, la cantidad de generalización desde el E+ bien condicionado hacia el E- será también alta. En segundo lugar, la presentación con valor constante del E-, por su similitud con el E+, implicará un gran efecto de generalización desde el estímulo positivo al negativo. La incidencia de las variables modo y momento tal como se utilizan en el procedimiento posterior- constante, justifican la lenta y difícil adquisición de la discriminación. Finalmente, en los procedimientos inicial-constante y posterior-progresivo se producirían canti- dades intermedias de generalización entre E+ y E- que llevarían a los resultados discriminativos -también intermedios- que se obtuvieron en los grupos a los que se asignaron esos tratamientos. 6.2.3. Discriminación y fenómenos de atención A) Dimensiones relevantes e irrelevantes de los estímulos Tanto en la vida cotidiana como en situaciones experimentales, los estímulos que controlan nuestra conducta (y la del resto de los animales) no se componen de una única propiedad física aislada como color, forma, tamaño, posición, etc. Más bien al contrario, por muy simple que parezca, toda estimulación antecedente que incide sobre un organismo agrupa un conjumto de esas u otras propiedades o di- mensiones. En algunas ocasiones, el carácter plural y multidimensional de la esti- mulación antecedente se manipula en los experimentos sobre discriminación de manera deliberada mediante la formación de estímulos compuestos (consistentes, por ejemplo, en la presentación de un triángulo sobre un fondo rojo o de un sonido 266 Psicología del aprendizaje efectivo, mayor control alcanzarán las dimensiones estimulares que se manipula expresamente y más irrelevante se volverá el contexto. Como ya apuntamos en el = apartado 6.2.2, el entrenamiento discriminativo enseña a los sujetos qué caracterís" : ticas del ambiente deben prestar atención y cuáles deben ignorar (Schwartz, 1989). Veámoslo con un ejemplo experimental. + Jenkins y Harrison (1960) reforzaron a un primer grupo de palomas (A) por Pi»g»- cotear una tecla de respuestas según un programa de reforzamiento de intervalos" variable (1V), estando siempre presente un tono de 1.000 Hz. Un segundo grupo de * palomas (B) fue sometido a reforzamiento diferencial del tipo presencia/ausencia del estímulo, siendo el E+ un tono de 1.000 Hz y el E- la ausencia de dicho tono. .: En un trabajo posterior de los mismos autores (Jenkins y Harrison, 1962), otro gru-+* po de palomas (C) fue reforzado en presencia de un tono de 1.000 Hz (Ex) no sién-* dolo cuando el tono cra de 950 Hz (E-). Tras estos entrenamientos, se efectuarog”. pruebas de generalización con cada uno do los grupos, presentando como estímulos. de prueba valores de frecuencia del tono superiores e inferiores al del tono utiliza- do en el entrenamiento como E+ (1.000 Hz). Los resultados obtenidos se traduje- ron en un gradiente de generalización plano para el grupo A, un gradiente de gene: ralización intermedio para el grupo B y un gradiente de generalización MUY... inclinado para el grupo C (ver Figuras 6.1 y 6.2 para gradientes similares a los des»-$ critos). Una posible explicación para estas diferencias entre grupos podríamos en- 38 contrarla en la distinta función de control que, frente al control ejercido por el tono ?' de 1.000 Hz, ejercen los estímulos incidentales sobre la conducta de los sujetos e: cada grupo (Sehwartz, 1989). Así, cuanto mayor es el control ejercido por el con; texto o algún aspecto de éste, menor será el control por el tono (grupo A, donde; además el tono forma parte de Jos estímulos contextuales por estar siempre prese: te); cuanto mayor control por el tono, menor control ejercerá el contexto (grupo €) Los factores responsables de que en cada situación discriminativa los sujetos presten atención a determinados estímulos y no a otros, esto es, de que se seleccione una re- lación de control y no otra, serán discutidos en el apartado siguiente, relativo a los fenómenos asociativos básicos de atención selectiva. Se ha dicho que con el entrenamiento discriminativo las sujetos aprenden qué ca racterísticas del ambiente son relevantes y cuáles no lo son. Pero, ¿aprenden los suje: tos algo acerca de las dimensiones irrelevantes o son éstas sencillamente ignoradas? La cuestión no tiene una respuesta fácil. Wilkie y Masson (1976) realizaron un expe- rimento utilizando el mismo procedimiento de Reynolds (1961) y el mismo estímulo compuesto, Cuando sometieron a prueba los componentes por separado (color rojo y forma triangular) comprobaron que sólo la dimensión color controlaba la conductá del sujeto. Igual que en el experimento de Reynolds, se daba un control sclectivo la conducta de los sujetos por una de las dimensiones estimulares utilizadas. Con pos: terioridad a la prucba de atención, Wilkie y Masson comenzaron a entrenar a sus pa: lomas para que respondieran en presencia de un triángulo (que antes había formado compuesto con el color rojo en el E+) y en presencia de un círculo (que con anteriori- ,¿ dad formaba compuesto con el color verde en el E-). Durante este entrenamiento 4 observaron que la tasa de respuesta se incrementaba de forma más rápida ante el% triángulo (asociado previamente al reforzamiento) que ante el círculo (asociado pre- 267 Capítulo 6: Control de estímulos viamente a extinción), concluyendo que el triángulo mostraba cierto control agur do previamente (aprendizaje latente) sobre la conducta de los sujetos. Sin embargo, estos resultados no aclaran si las diferencias encontradas fueron debidas: a) Al control excitatorio por parte de la forma previamente asociada al refor- zamiento (triángulo). asoció ala a b) A un control inhibitorio ejercido por parte de la forma que se asoció a la sencia de reforzamiento (círculo). o coat e) A la neutralidad de la forma triangular frente al carácter inhibitorio del círculo. Para aclarar estos aspectos, Kendall y Mills (1979) sometieron a un grupo de pa- lomas a una discriminación donde el E+ consistió en la presentación de un triángulo sobre fondo rojo (estímulo compuesto de dos dimensiones) y el E-en la presentación de la tecla encendida de color verde (una única dimensión). Tras el entrenamiento discriminativo se efectuó una prueba presentando los siguientes estímulos en extin- ción: triángulo sobre fondo rojo, triángulo sobre fondo verde, sólo el triángulo, sólo el color rojo o sólo el color verde. En dicha prueba, los sujetos dieron más respuestas en presencia del E+ original que ante el color rojo en solitario; igualmente, respon dieron más al triángulo -tanto si se presentaba solo como si lo hacía sobre un fondo verde— que hacia el color verde en solitario (el E- original). Tales resultados estarían evidenciando cierto control excitatorio por parte del triángulo, confirmando la prime, ra de las tres posibilidades señaladas. Dicho control sólo pudo adquirirse durante € entrenamiento discriminativo, cuando el triángulo formaba parte del Er Resumiendo, el conjunto de resultados presentado pone de manifiesto: 1) Cuando un sujeto es sometido a un problema de discriminación, donde los estímulos antecedentes se componen de más de una dimensión 0 propiedal estimular asociadas a una misma probabilidad de reforzamiento, se produce un control selectivo de la conducta del sujeto por parte de una de las dimen- siones entrenadas. En esto consiste la atención. . o . La dimensión a la que los sujetos atienden será la dimensión Televante; la dimensión o dimensiones a las que los sujetos no atienden serán considera- das dimensiones irrelevantes. . Durante el entrenamiento discriminativo los sujetos aprenden a prestar atención a las dimensiones relevantes, pero de ello no se deriva necesaria- mente que ignoren las dimensiones irrelevantes. Más bien, los daros pare- cen apuntar a que, durante un entrenamiento discriminativo, se pra ce un activo proceso de aprendizaje acerca de la irrelevancia de determinados es- tímulos (Mackintosh, 1973, 1975). 2 3 B) Fenómenos asociativos básicos de atención selectiva En el apartado anterior ha quedado una cuestión por resolver; en una situación discriminativa, en la que existen varias dimensiones O propiedades estimulares po- 268 — Psicología del aprendizaje tencialmente relevantes, ¿cuál de ellas será seleccionada?, ¿de qué depende que en una situación dada se seleccione una u otra dimensión? Los avances producidos en la Psicología del aprendizaje durante el último cuarto de siglo (especialmente en la ”, tradición del aprendizaje asociativo) han arrojado un conjunto de fenómenos expe- rimentales que, junto con otros más clásicos procedentes de las tradiciones pavlo- viana y operante, ayudarán a resolver las cuestiones planteadas. Básicamente, podemos afirmar que el hecho de que un elemento de un compues- to adquiera contro! sobre la conducta de un sujeto, frente a otros elementos presentes en la misma situación, depende de un conjunto de factores tanto de carácter filogené- — « tico como ontogenético. Los factores filogenéticos darían cuenta de cómo la destaca- bilidad (salience) de los estímulos antecedentes, ta naturaleza del estímulo reforzador y, finalmente, el tipo de respuesta requerida por parte del sujeto, determinan la selec- ción de una relación de contro! u otra, Los factores ontogenéticos estarían referidos, por un lado, a la influencia que la historia de aprendizaje ejerce sobre la selección de repertorios discriminativos y, por otro, al valor informativo que la estimulación ante- cedente le aporta a un sujeto respecto a la presencia o ausencia de acontecimientos importantes. Unos y otros factores actúan en una mísma dirección para hacer que, en cada momento, se seleccione la relación de control más adaptativa; dicho de otro mo- do: de ellos dependerá que, en una situación diseriminativa, el sujeto atienda a las propiedades estimulares que le son relevantes y desatienda las que no lo son. : 1) Factores filogenéticos determinantes de la atención selectiva. Las características especificas de los elementos de un estímulo compuesto antecedente pueden determinar que los sujetos atiendan selectivamente unas u otras dimensiones. Pavlov (1927) comprobó que cuando en una situación de condicionamien to presentaba a sus perros un estímulo compuesto por elementos muy dife al rentes en destacabilidad natural, el elemento más sobresaliente o destacable era el que ganaba control sobre la conducta, mientras que el elemento me nos destacable apenas si se condicionaba. A este fenómeno de control selec: tivo de la conducta por el elemento más fuerte de entre los que forman un compuesto, lo denominó ensombrecimiento. Los elementos del compuest que no adquirían control sobre la conducta de un sujeto quedaban así en: sombrecidos por la presencia de otro elemento más potente. No obstante, el: elemento que se ve ensombrecido en una situación concreta de condiciona- miento puede ganar control sobre la conducta de un sujeto en otra situa“ ción, con tal que no existan al mismo tiempo otros elementos más destaca- bles que él. Por otro lado, la naturaleza del reforzador utilizado afectará a la aten- ción que los sujetos dispensen a unos u otros estímulos antecedentes. Así; por ejemplo, Foree y Lolordo (1973) encontraron que cuando un grupo dez palomas cra reforzado con comida en presencia de un estímulo compuest por una huz y un sonido, era el elemento visual del compuesto el que adqui ría control sobre la conducta de los sujetos, Por el contrario, cuando el re”; forzamiento consistió en la evitación de una descarga, habiendo aprendida las palomas a responder en presencia del estímulo compuesto, se comprobó: 1 Capitulo 6: Control de estímulos 269 que el sonido controlaba la respuesta de evitación de los sujetos en mayor medida que la luz, Ante la presentación simultánea de claves visuales y audí- tivas, las palomas atienden selectivamente a la clave visual cuando son refor- zadas positivamente con comida; en cambio, las claves auditivas adquieren más fácilmente control sobre la conducta que cs negativamente reforzada. La selección de una relación de control discriminativo frente a otras po- sibles, dependiendo de la naturaleza del reforzador o El utilizado, también puede encontrarse como parte de los resultados del trabajo realizado por García y Koelling (1966) sobre aversión condicionada al sabor. Dichos auto- ves dieron de beber agua con un sabor particular a un grupo de ratas en pre- sencia de claves auditivas y visuales, por tanto, se trataba de un estímulo an- tecedente compuesto por elementos auditivos, visuales y de sabor. Este compuesto se asociaba, en dos de los grupos utilizados, al malestar gástrico (El) producido, bien por exposición a rayos X, bien por una inyección de cloruro de litio y, en un tercer grupo, a un choque eléctrico (El). Cuando en la fase de prueba se presentaron los elementos del compuesto de forma se- parada (el componente audiovisual por un lado y el de sabor por otro), se comprobó que el elemento audiovisual controlaba la respuesta de evitación sólo si había estado asociado a la descarga, pero no cuando lo había sido al malestar gástrico; por el contrario, el componente de sabor controlaba la respuesta cuando había estado asociado previamente al malestar gástrico, pero no cuando fue asociado a la descarga. La atención selectiva hacia determinadas propiedades o dimensiones de un complejo estimular puede también depender del tipo de respuesta discri- minativa requerida. Así, por ejemplo, Dobrzecka, Szwejkowska y Konorski (1966) estudiaron el aprendizaje de discriminación en perros ante dos tipos de estímulos auditivos sonido de un metrónomo y sonido de un zumba- dor-, procedentes de diferentes localizaciones espaciales —uno situado de- lante y otro detrás del animal-. En esta situación se trataba de comprobar cuál de las características del compuesto (tipo de sonido o localización) con- trolaba la respuesta de levantar una pata detantera en los perros. Se forma- ron dos grupos en función de la respuesta discriminativa requerida. Un pri- mer grupo debía levantar la pata derecha cuando se presentaba el sonido del metrónomo (E1+) y, en cambio, levantar la pata izquierda en presencia del sonido del zumbador (E2+). El segundo grupo fue entrenado a levantar la pata cuando oía el sonido del zumbador (E+) y no levantarla cuando so- naba el metrónomo (E-). Una vez establecidas cada una de las discrimin: ciones (derecha/izquierda y hacer/no hacer), Dobrzecka y colaboradores in- tercambiaron las posiciones del metrónomo y del zumbador con objeto de probar en qué medida dicho cambio afectaba a cada una de las discrimina- ciones establecidas. Los resultados mostraron que en el grupo donde la res- puesta consistió en levantar la pata derecha o la izquierda, era la proceden- cia del sonido (detrás o delante del animal) la propiedad que controlaba dicha respuesta, con independencia del tipo de sonido que se tratara (me- trónomo o zumbador). En cambio, en el grupo entrenado en levantar la pa- 272 Psicología del aprendizaje CUABRO 6.2. Tabla resumen de algunos fenómenos básicos de atención selectiva. Fenómeno Fase de preexposición | Fase de condicionamiento Inhibición latente LUZ LUZ - El Irreleyancia aprendida LUZ // El LUZ - Ef LUZ // El |_Desatención general TONO - El Bloqueo LUZ-El (LUZ + TONO) - El Supercondicionamiento LUZ -NO El / (LUZ + TONO) - El NO LUZ - El df: Presentación aleatoria de estímulos. 7: Ensayos alternos. Acabamos de ver cómo el reforzamiento de un estímulo, tanto en las si- tuaciones de irrelevancia/desatención como en la de bloqueo, no conduce ne- cesariamente a su establecimiento como señal del reforzador (como un E+). En el mismo contexto histórico que los trabajos anteriores, Wagner, Logan, Haberlandt y Price (1968) presentaron un conjunto de resultados que abun- darían en la idea de que el carácter discriminativo de un estímulo no está de- terminado tanto por las contingencias de reforzamiento, como por la validez 4 relativa o el valor predictivo de todos los estímulos presentes simultáncamen-, te. De esta manera, si en una situación se presentan diversas claves estimula res concurrentes, la efectividad de cada una de ellas corno señal del reforza dor dependerá de la validez o efectividad que posean todas las demás clavej presentes en ese instante (validez relativa). El elemento de mayor validez re lativa será, finalmente, el que controle la conducta, ensombreciendo o dificulé tando el condicionamiento de los elementos menos válidos. El trabajo de Wagner y colaboradores (1968) comprende tres experi. mentos, en los que se obtuvieron resultados similares con independencia de la preparación utilizada (condicionamiento instrumental, respuesta emocio- nal condicionada y condicionamiento palpebral, respectivamente, en los ex* perimentos 1, 2 y 3). El diseño básico, común a las tres situaciones experi-, mentales podría esquematizarse tal y como aparece en la Figura 6.3. Como se aprecia en la figura, en ambos grupos se presentan en el mismo. número de ocasiones dos tipos de compuestos estimulares formados por un compuestos tienen un elemento común (luz) y dificren en el tipo de tong utilizado en cada caso. Por lo demás, los grupos presentan distintas propor- ciones de reforzamiento a cada elemento. Así, aunque la luz se emparej po, en el primer grupo el tono] siempre aparece emparejado con el El (100% de las ocasiones) y, en cambio, cl tono 2 nunca va seguido por el re- 23 Capítulo 6: Control de estímulos Grupo A DTINILANNANATL py O y E y E y pS y E y E y ED y PE po O E Grupo B| 2 TUS pa y RE y E PO y E y y PO y PR PU PS VE FER Figura 6.3. Esquema básico de relación entre estímulos en dos grupos (A y B) con distintos grados de correlación respecto al El (adaptado de Wagner y cols., 1968). forzador (0%). En el segundo grupo, la probabilidad de que el Ei acompa- ñe a cualquiera de los dos elementos auditivos en los ensayos en los que és- tos estaban implicados es la misma e idéntica a la de la duz (50%). Dado que en los dos grupos el porcentaje de reforzamiento recibido por Ja luz fue el mismo, cabría esperar que se condicionara por igual en ambos. Sin embargo, los resultados de Wagner y colaboradores demostraron que esto no fue así. En el grupo 1 la luz se condicionó escasamente (experimen- tos 1 y 3) o no se condicionó en absoluto (experimento 2); en cambio, en el grupo 2, la luz se condicionó perfectamente en las tres situaciones experi- mentales, La explicación para este diferente condicionamiento de la luz en cada grupo se encuentra en el distinto tratamiento que reciben los elemen- tos auditivos en cada uno de los compuestos. En el grupo 1, la luz formaba parte de un compuesto donde estaba presente un estímulo (tono 1) mejor correlacionado con el reforzador y, por ello, más válido y mejor predictor del EJ que la luz. En el grupo 2, la luz formaba parte de compuestos donde no existían otros elementos mejor correlacionados con el El, en cuyo caso, el mayor número de presentaciones reforzadas de la luz favoreció su condicio- namiento, convirtiéndola en el elemento más válido y mejor predictor de la ocurrencia del EL El trabajo sobre validez relativa de Wagner y colaboradores, así como los demás trabajos que se han revisado (ensombrecimiento, bloqueo, rele- vancia causal, etc.), demuestran que el reforzamiento de un estímulo com- puesto no garantiza que todos o varios de sus elementos constituyentes se conviertan en señales relevantes. A partir de los anteriores trabajos también han sido identificados un conjunto de factores o reglas de selectividad aso- ciativa (validez relativa, destacabilidad natural, historia previa y adecuación biológica), responsables de que, en cada caso, tuviera lugar la selección pre- 274 Psicología del aprendizaje C) Conducta de observación y reforzamiento condicionado una cierta “confusión” inicial entre los efectos del reforzamiento y los del no refor- ferente de uno de los elementos de un compuesto frente a los demás. Por... otro lado, implícita o explícitamente, en todos los trabajos revisados suby: ce la idea de que, en el transcurso del aprendizaje discriminativo, todos los"? estímulos presentes en un mismo momento compiten entre sí por ganar con” trol sobre la conducta de un individuo. Dicha competencia puede cstable- cerse entre estímulos con diferente grado de adecuación biológica respecto .- al reforzador (caso de la aversión condicionada) o respecto a la respuesta ? discriminativa (experimento de Dobrzecka y cols.), entre un estímulo y las Y claves estimulares (por ejemplo, en la irrelevancia aprendida), entre un es, : tímulo nuevo y otro conocido (como en el caso de bloqueo) o entre diversos. estímulos neutros concurrentes (situaciones de validez relativa). La relación de control que resulte seleccionada será la que predomine, ensombreciento el posible establecimiento de otras relaciones discriminativas. La noción de competencia estimular, acabada de plantear, constituye uno de los pilares básicos tanto del modelo atencional de Sutherland y Mac- + kintosh (1971) como del modelo de aprendizaje asociativo de Rescorla y * Wagner (1972). A ello cabría añadir otra asunción básica de dichos modelos con claras implicaciones para la atención selectiva: el máximo de control que un estímulo o conjunto de estímulos puede alcanzar sobre la conducta * de un sujeto es limitado y, además, la máxima capacidad de control que pue- de lograrse debe ser compartida (en igual o diferente grado, en función de 72 las reglas selectivas) por todos los estímulos presentes en la misma situación. = En el modelo de Sutherland y Mackintosh (1971) cl límite superior viene ? marcado por la capacidad limitada de atención que un sujeto puede dispen: sar a un conjunto de dimensiones estimulares. Cuando un sujeto es enfrenta- do por primera vez a una estimulación compleja, su atención se dispersa en”, tre las diferentes dimensiones, A medida que avanza el entrenamiento discriminativo la atención hacia una dimensión particular se incrementa y decreciendo la atención prestada a otras dimensiones. En el modelo de Re: corla y Wagner (1972), el límite máximo de control sobre la conducta que un estímulo puede alcanzar se identifica con la fuerza asociativa asintótica que: puede crearse entre un estímulo antecedente y el reforzador. En este modelo, los distintos elementos de un compuesto compiten por ganar fuerza asoci. tiva, que sé traducirá en una mayor o menor capacidad predictiva respecto: al reforzador. De esta manera, si un determinado elemento de un compues- to se convierte en una señal predictiva o informativa acerca de la ocurrencia del reforzador, cualquier otro estímulo que lo acompañe se convertirá en ma señal redundante y no informativa que, por consiguiente, será desaten- ida. En los momentos iniciales de un entrenamiento discriminativo suele producirse 275 Capítulo 6: Control de estímulos zamiento. Por ejemplo: si se quiere que una paloma picotee una tecla de respuestas iluminada de color rojo (E+) y no picotee cuando la iluminación de la tecla es de color verde (E-), al comienzo de la aplicación del reforzamiento diferencial podría suceder que la paloma picotce Ja tecia de manera indiscriminada o, también, que presente la respuesta en presencia del E- no haciéndolo en presencia del E+. Wyc- koff (1952, 1969) sugirió que ese cruce de efectos, propio de los momentos iniciales del entrenamiento discriminativo, podía deberse a una insuficiente observación de los estímulos por parte del sujeto. Consecuentemente, la reducción de esa confu- sión inicial, conforme avanzaba el entrenamiento, podía estar reflejando la adquisi- ción de una conducta de observación apropiada. Las denominadas respuestas de ob- servación por Wyckoff (1952) pueden definirse como aquéllas que permiten el contacto entre la forma de energía, que define la dimensión de estímulo relevante, y los órganos receptores del sujeto (Dinsmoor, 1983, 1985). Por extensión, podemos considerar como respuestas de observación aquéllas que, sin estar sometidas a las contingencias de reforzamiento programadas, permiten el contacto de los sujetos con los estímulos discriminativos (Dinsmoor, 1983, 1985, 1995). Por ejemplo: si que- remos saber el tiempo que hará en el fin de semana para, en función de ello, em- prender un viaje a la playa, llegado el momento podemos ponermos en marcha en dirección al mar con la incertidumbre de si lloverá o lucirá el sol o, por el contrario, podemos buscar las previsiones meteorológicas en un periódico, en la televisión o llamando por teléfono al servicio meteorológico. Todas estas conductas constituyen respuestas de observación, ya que posibilitan el acceso a determinados estímulos (previsión de tiempo soleado o lluvioso) ante los que nos comportaremos de forma discriminada (ir a la playa o quedarnos en casa). Las respuestas de observación han sido extensamente estudiadas en situaciones controladas de laboratorio, tanto con sujetos animales (Dinsmoor, 1983, 1985), como con sujetos humanos (Case, Fantino y Wixted, 1985; Case, Ploog y Fantino, 1990). El paradigma experimental utilizado básicamente mantiene las características del pro- cedimiento presentado por Wyckoft (1969) que a continuación se analiza. El princi- pal objetivo del trabajo de Wyckoff era estudiar la adquisición de las respuestas de observación en el trancurso de una discriminación, así como tratar de explicar por qué se mantenían tales respuestas. Para ello reforzó a un grupo de palomas con co- mida cuando picoteaban una tecla de respuestas iluminada con color rojo (E+), no siendo reforzadas si la iluminación de la tecla era de color verde (E-). Hasta aquí se trata de un entrenamiento discriminativo con reforzamiento diferencial como los que ya conocemos. La peculiaridad del procedimiento residía en que los discrim: nativos estaban disponibles sólo si los sujetos presentaban una respuesta arbitraria, diferente a la discriminativa, consistente en oprimir un pedal situado en el suelo de la cámara (respuesta de observación). De no producirse la respuesta de observa- ción, la tecla se mantenía permanentemente iluminada de color blanco, tanto en los momentos en los que las respuestas de picoteo llevaban al reforzador, como en los momentos donde el picoteo no era reforzado. La presión del pedal nunca fue segui- da inmediatamente por el reforzador, sino por la aparición del E+ o del E-. Los re- sultados mostraron una rápida adquisición de la respuesta de observación, así como su mantenimiento durante largos períodos de tiempo, si bien, las presiones del pe- 278 — Psicología del aprendizaje Ferster, 1960; Cumming y Berryman, 1961). Un arreglo experimental típico de este procedimiento es el representado en la Figura 6,4. En un aparato experimental (ca- * ja de Skinner u ordenador, según los sujetos experimentales sean palomas o huma- nos), el ensayo comienza con la presentación de un estímulo (un triángulo en el 3 ejemplo de la Figura 6.4) denominado estímulo de muestra (estímulo instruccional o contextual). Generalmente, ante la presentación de dicho estímulo, se requiere que el sujeto produzca alguna respuesta cuya función es servir como respuesta de ob- servación (tocar la figura, oprimir la tecla “intro” en el ordenador, picotear la tecla E de respuestas donde se proyecta el estímulo, etc.) que hace aparecer dos o más nue- vos estímulos que constituyen los estímulos de comparación entre los que el sujeto habrá de elegir uno (en el ejemplo, un triángulo y un cuadrado). En función de cuál A haya sido el estímulo de muestra, uno de los estímulos de comparación (triángulo) + funcionará como E+ y el otro (cuadrado) funcionará como E-, esto es: la elección * del sujeto entre los estímulos de comparación es condicional al estímulo de muestra ;y,;, que se haya presentado, Cuando el sujeto efectúa una elección correcta (triángulo) EE es reforzado y comienza un nuevo ensayo, generalmente con la presentación de un? nuevo estímulo de muestra diferente al del ensayo previo. Por el contrario, las elec-¡¿ ciones incorrectas del sujeto no serán reforzadas, pudiéndose, entonces, aplicar Un procedimiento de corrección de errores (persistiendo en el mismo ensayo hasta que % el sujeto elija correctamente) o pasar directamente al ensayo programado siguiente. ¿1 Estímulo de muestra ENSAYO 1 Qe Er ENSAYO 2 A Estímulos de comparación l Figura 6.4, Arreglo experimental típico de presentación de ensayos en un procedimiento de A igualación a la muestra. ” 279 Capítulo 6: Control de estímulos A partir de un procedimiento de igualación a la muestra como el descrito, pueden efectuarse múltiples variaciones (Carter y Werner, 1978 y Mackay, 1991). Así, por ejem- plo, dependiendo de la relación temporal existente entre la presentación del estímulo de muestra y la aparición de los cstímulos de comparación podemos hablar de tres tipos: a) Igualación simultánea a la muestra si cl estímulo contextual no desaparece con la respuesta de observación y permanece presente al mismo tiempo que los estímulos de comparación b) Igualación de demora cero si la respuesta de observación hace desaparecer el estímulo de muestra al mismo tiempo que aparecen los estímulos de compa- ración procedimiento representado en la Figura 64. c) Igualación demorada a la muestra cuando entre la desaparición del estímulo de muestra y la aparición de los estímulos de comparación transcurre un pe- ríodo de tiempo? Otra posible modificación sobre la situación estándar de igualación a Ja muestra consiste en requerir a los sujetos que elijan el estímulo de comparación que sea igual al de muestra o, por el contrario, sc les demande que respondan al estímulo que sea dife- rente. El primer caso correspondería al ejemplo representado en la Figura 6.4 y se de- nomína, estrictamente, igualación a la muestra. En el segundo caso se trataría de que, dada la presentación del triángulo como estímulo de muestra, el sujeto elija el cuadra- do para ser reforzado (éste funcionaría ahora como E+ y el triángulo sería el E-). A esta situación se la conoce como diferenciación de la muestra y, al igual que ocurría con la igualación a la muestra, puede ser simultánea, de demora cero o demorada. “Tanto en las situaciones de igualación como de diferenciación de la muestra acaba- das de ver, aparecerá en cada ensayo un estímulo de comparación idéntico al de mues- tra y otro diferente. En estos casos, las elecciones correctas de los sujetos están deter- minadas por la identidad física del estímulo de muestra y uno de los estímulos de comparación, bien para elegirlo (caso de igualación) o para rechazarlo (caso de dife- renciación). Sin embargo, las relaciones entre los estímulos implicados en las discrimi- naciones condicionales no tienen necesariamente que estar basadas en sus similitudes físicas, también pueden ser arbitrarias. Cuando ocurre esto, el procedimiento se deno- mina ¡gualación simbólica o arbitraria a la muestra (Cummimg y Berryman, 1965; Car- ter y Eckerman, 1975; Carter y Werner, 1978), un procedimiento mucho más rico y po- tente que el de igualación idéntica a la muestra, dada la cantidad y complejidad tanto de estímulos como de relaciones que nos permite cxplorar. Fijémonos en la Figura 6.5 Supongamos que se entrena a un niño para que elija el estímulo de comparación don- de aparece la palabra casa si el estímulo de muestra consistió en el dibujo de una casa y que elija la palabra árbol si la muestra consistió en la representación pictórica de un ár- bal. Los dibujos que representan a la casa y al árbol (estímulos de muestra) son física- mente bien distintos de las palabras casa y árbol! (estímulos de comparación), aunque o por ello nos hallamos ante una situación de diferenciación a la muestra. Muy al con- trario, la relación entre cada estímulo de muestra con el correspondiente estímulo de comparación sigue siendo de igualación, sólo que ahora no se trata de una relación ba- sada en las propiedades físicas de los estímulos, sino en sus propiedades funcionales, 280 — Psicología del aprendizaje una relación semejante a la que en conducta verbal se establece entre un símbolo y el * significado de éste. Así, las únicas restricciones que presenta un procedimiento de igua- lación simbólica a la muestra son, a juicio de Carter y Werner (1978), que el estímulo de muestra no vuelva a presentarse formando parte de los estímulos de comparación y que para cada estímulo de muestra exista un único estímulo de comparación correcto, Figura 6.5. Ensayos utilizados típicamente cn un procedimiento de igualación simbólica o arbitraria a la muestra. En suma, los variados procedimientos de igualación a la muestra que han sidg presentados constituyen tan sólo un conjunto de técnicas --las más utifizadas— pará estudiar un fenómeno conductua! más general, como es el de discriminación condi cional (Yarezower, 1971). La característica básica definitoria de toda discriminación” condicional es la existencia de una condición estimular instruccional que seleccioná; toda una relación de control discriminativo, indicando la conducta discriminativé que en su presencia será más efectiva. La aplicabilidad y relevancia de las discrimi naciones condicionales para el estudio de la conducta humana compleja revisten pecial importancia. En este tipo de relaciones descansa, por ejemplo, el origen de conducta simbólica, requisito básico para la adquisición del más simple significa vocabulario o correspondencia semántica (Catania, 1980; Sidman, 1986). simbólica Los resultados obtenidos en las investigaciones sobre discriminación condicio”. nal han abierto un interesante debate acerca de qué es lo que aprende un sujeta, que resuelve exitosamente este tipo de tareas. Dicho de otro modo: ¿cuál es la es--¿ trategía de aprendizaje que despliega un sujeto enfrentado a una tarca de discrimi- nación condicional? A partir de los estudios con el procedimiento de igualación a la muestra, gran a parte de ellos llevados a cabo con palomas como sujetos experimentales, se ha con- Y . 281 Capítulo 6: Control de estímulos duido que la adquisición de una discriminación condicional implica: a) el estableci- miento de una discriminación sucesiva entre los distintos estímulos que aparecen como muestra a lo largo del entrenamiento; h) el establecimiento de una discrimi- nación simultánea, en cada ensayo, entre los diferentes estímulos de comparación, y c) el establecimiento de una relación (condicional) entre el estímulo de muestra y Jos estímulos de comparación (Carter y Werner, 1978, Zentall, Hogan y Edwards, 1984; Mackay, 1991). En tanto dicha relación sea, en último término, la que deter- mine la ejecución del sujeto que llevará al reforzador, la relación en sí adquirirá funciones discriminativas que se pueden calificar como de orden superior. No parece existir un acuerdo acerca del tipo de relación que aprenden los sujetos o, dicho de otra manera, acerca de la naturaleza de la estrategia de aprendizaje que si- guen los sujetos. Dos de las hipótesis que han concentrado los esfuerzos de gran parte de investigadores son las siguientes: por un lado, algunos resultados experimentales parecen apoyar la idea de que en las situaciones de igualación a la muestra los sujetos aprenden múltiples reglas o relaciones específicas para cada par de estímulos forma- dos por el de muestra y el correspondiente E+ de entre los estímulos de comparación. Tales relaciones serían del tipo sí..., entonces. ..; estarían Timitadas a los estímulos utili- ados en la situación de entrenamiento y, por lo tanto, no serían transferibles a nuevas situaciones (Cummine y Berryman, 1961, 1965; Farthing y Opuda, 1974; Carter y Ec- kerman, 1975; Carter y Werner, 1978; Premack, 1978; Holmes, 1979; Mackay, 1991). Por otro lado, un grupo importante de investigadores han puesto de manifiesto que, en las tareas de igualación a la muestra, los sujetos establecen una regla general, una relación abstracta o conceptual que, una vez establecida, no se limita a las condiciones estimulares del entrenamiento, sino que puede ser generalizada a nuevas situaciones no entrenadas. Se diría que los sujetos aprenden relaciones de orden superior del tipo igual/distinto, menor/mayor, etc., que supondrían la adquisición del concepto de iden- tidad o tamaño (Urcuioli y Nevin, 1975; Urcuioli, 1977, Zentall y Hogan, 1978; Pisa- ercta y Witt, 1983; Zentall y cols., 1984). Determinar si un sujeto en una tarea de igualación a la muestra sigue una estrate- gía del tipo sí... entonces... o una regla general no resulta fácil. Supongamos que so- metemos a una paloma a una tarea de igualación a la muestra como la representada en la Figura 6.6. Ante el estímulo de muestra “árbol” elige “árbol”, ante “casa” elige “casa” y cuando se presenta la “pelota” elige “pelota”. La ejecución del sujeto por sí misína no arroja luz sobre la estrategia que está siguiendo. Para determinar el tipo de relación que controla la ejecución correcta del sujeto es necesario someterlo a una si- tuación de prueba cn la que se presenten nuevos estímulos no experimentados duran- te el entrenamiento. Así, por ejemplo, si aparece como estímulo de muestra la “mari- Posa” y el sujeto elige “mariposa”, frente a “casa” o “pelota”, o aparece “silla” y elige “silla”, frente a “árbol” o “casa”, demostraría que está siguiendo una regla general, en este caso de identidad o de igualdad; si, por el contrario, no elige “mariposa” o “silla” después de haberle presentado estos estímulos como muestra, respondiendo sobre cualquiera de los otros estímulos de comparación, pondría de manificsto que está si- guiendo una estrategia de reglas específicas (tipo sí..., entonces. ..), de manera que no efectuará la elección correcta hasta que haya aprendido las nuevas relaciones. Siempre que en una situación como la descrita los datos apoyen la hipótesis del aprendizaje de 284 — Psicología del aprendizaje procesamiento, siendo también un importante signo del desarrollo cognitivo (ver, por ejemplo, Nisbbet y Wilson, 1977; Jacoby y Dallas, 1981; Reber, 1989). Y Pero independientemente de la supuesta superioridad cognitiva del procesa- miento implicado en los fenómenos relativos al metaconocimiento, el origen de los mismos puede encontrarse en un proceso tan básico como la mera discriminación. Para que un sujeto pueda describir sus acciones, resultará obvio que previamen- te deberá poder discriminar entre ellas, identificando cada una de sus conductas co- mo unidades diferenciables de las otras. Ello se puede explicar, simplemente, como un caso de discriminación sucesiva en la que la propia conducta del sujeto actúa co- mo estímulo discriminativo de la conducta siguiente. Un sencillo experimento iné- dito de nuestro laboratorio (Benjumea y García, 1995) puede ejemplificar pertecta- . mente la discriminación de la propia conducta por unas patomas. Cada ensayo det. este experimento estuvo formado por dos componentes sucesivos. En el primer: componente ambas tecias se ihiminaban de blanco, siendo la primera respuesta da- da en la tecla “correcta” la que permitía pasar al segundo componente, Por el cons» trario, las respuestas dadas a la tecla “incorrecta” no tenían ningún tipo de conse-=** 4 cuencia, permaneciendo el animal en el primer componente. Antes de comenzar”, Á cada ensayo, el ordenador asignaba una de las teclas como “correcta” y la otra co- $ mo “incorrecta” con la misma probabilidad para cada una. El animal, por lo tanto,. no tenía otra forma de “saber” cuál era la tecla “correcta” que picotear una u otra! para comprobar su efecto. Al comienzo del entrenamiento, un mal “conocimiento” de la situación hacía que los sujetos dieran un importante número de respuestas “incorrectas” antes de cambiar a la tecla “correcta”. Sin embargo, con la práctica, pronto aprendieron a cambiar de tecla tras una única respuesta “incorrecta”; es de- yy, cir, las palomas llegaron a adquirir un buen “conocimiento” sobre cómo salir del primer componente. Para desarrollar en ellas un cierto grado de “metaconocimien- * to” sobre la situación, se programaron las cosas de forma que en el segundo compo-- nente del ensayo una de las teclas se iluminó de rojo y la otra de verde, de manera aleatoria. Si el animal había salido del primer componente al picar la tecla blanca derecha, debía ahora elegir la tecla verde para obtener el reforzador; por el contra- rio, si había salido picoteando la tecla blanca izquierda, ahora debía responder en la que estuviera iluminada de rojo. Es decir, “rojo” y “verde” significaban respecti- vamente: “acabo de picar la tecla izquierda” o “acabo de picar la tecla derecha”. En definitiva, se trataba de una igualación simbólica a la muestra (ver apartado ri lativo a discriminación condicional e igualación a la muestra en este mismo capítulo en la que el estímulo de muestra era la conducta previa del anima) y los estímulos de: comparación los colores rojo y verde. Usando dicho procedimiento, obtuvimos una ejecución prácticamente perfecta tras unos 500 ensayos, lo que demuestra la capaci- dad de organismos tan simples como las palomas para utilizar sus propias respues tas como estímulos discriminativos de acciones subsiguiente Usando una técnica muy parecida, Shimp (1982, 1983, 1984) ha demostrado que también pueden obtenerse disociaciones entre el conocimiento implícito y el explíci: to en aves y ratas. En dichos experimentos, los sujetos que mejor discriminaban sus. patrones conductuales eran, sin embargo, los que peor los usaban luego para optimi- a zar el reforzamiento. : p£> 285 Capítulo 6: Control de estímulos D) Estados internos como estímulos discriminativos: el origen de la introspección Etimológicamente, la palabra introspección significa “mirar hacia adentro”, y en su uso psicológico habitual se utiliza para definir la actividad de un sujeto humano que es capaz de identificar, diferenciar, comparar y describir sus estados y/o actividades mentales de una forma consciente. Pues bien, al menos una parte importante de dicha actividad introspectiva, la relativa a la identificación y discriminación de los estados in- ternos, puede ser abordada a través del paradigma de la discriminación. Un experi- mento de Lubinski y Thompson (1987) puede servirnos de ejemplo de cómo podemos enseñar a un animal a discriminar entre algunos estados internos de su organismo. En dicho experimento, a unas palomas se les inyectaba diariamente una sustancia elegida previamente al azar de entre suero fisiológico, un tranquilizante y un estimu- lante. Es decir, cada día el ave podía “sentirse” en uno de los tres estados correspon- dientes (neutral, tranquilizada, estimulada). Transcurrido el tiempo necesario para que la droga surtiese efecto, se introducía a las palomas en una cámara experimental con tres teclas de respuesta, habiendo asignado el experimentador de forma arbitra- ría una tecla a cada uno de los estados inducidos por la droga. Ahora se pedía a los sujetos que “acertasen” con la tecla correspondiente a la droga previamente experi- mentada: un picotazo dado a Ja tecla adecuada producía reforzamiento, uno dado a cualquiera de las otras dos conducía al fin del ensayo sin recibir recompensa. Tras un cierto entrenamiento, todos los sujetos fueron capaces de “informar” al experimenta- dor de una forma fiable en qué estado se encontraban cada día, Una vez más, nos encontramos ante un procedimiento de igualación simbólica a la muestra en el que los estímulos de muestra son los estados internos inducidos por la droga y los estímulos de comparación cada una de las teclas. Usando técnicas similares se ha descubierto que, a veces, los animales “confunden” dos estados indu- cidos por fármacos muy diferentes, lo que sugirió a los investigadores la existencia de alguna relación desconocida entre ellos, llevándolos a descubrir un nuevo meca- nismo insospechado de actuación farmacológica (ver Lubinski y Thompson, 1993). Finalmente, los estados internos parecen controlar la eficacia de otras discrimina- ciones, aun cuando no fueron programados para ello, Así, en un trabajo ya clásico, Overton (1964) demostró que la discriminación en un laberinto podía deteriorarse si se cambiaba el estado interno del anima! (de droga a no-droga, o de no-droga a dro- ga) con respecto a las condiciones del entrenamiento. Este fenómeno, conocido como aprendizaje dependiente del estado, parece suge- rir que, lo mismo que las claves contextuales, los estados internos provocados por los fármacos pasan a formar parte del complejo estimular que controla antecedentemen- te las respuestas del sujeto. En relación a la introspección humana, Skinner (1974) ha propuesto una inter- pretación radical y tentadora: los seres humanos aprendemos a mirar a nuestro inte- rior —identificando, diferenciando, relacionando, etc., nuestros estados internos- a partir del entrenamiento recibido a través de la comunidad social (mediante discri- minaciones análogas a las descritas más arriba aunque bastante más ricas y comple- jas). El origen último de nuestra conciencia individual tendría pues, paradójicamen- te, un origen social (Skinner, 1957, 1974; ver también Mead, 1934; Vygotsky, 1962). a A. 286 Psicología del aprendizaje E) La duración como propiedad discriminable de los estímulos Todo acontecimiento ambiental o conductual tiene lugar “en el tiempo” o, más“: concretamente, presenta propiedades temporales. Nos centraremos aquí exclusiva- mente en el control de la conducta por aspectos temporales de los estímulos, no en- trando en las dimensiones temporales del propio comportamiento que, por otra parte, algunos de nosotros ya hemos tratado (Fernández Serra y Arias, 1993). La propiedad temporal más obvia de los estímulos es su duración. De hecho, podemos decir que todo estímulo se presenta con una duración determinada como, por lo de- más, se presenta con una determinada forma, un tamaño, un color, un brillo concre- E to o una intensidad específica, Hemos ido viendo cómo diversas dimensiones opro- * piedades “sensoriales” de los estímulos (por ejemplo, el color y/o la forma) pueden. ejercer un control antecedente sobre el comportamiento. Por ello, es de esperar como, por ejemplo, sugirieron Skinner (1938) o Catania (1970)- que las propieda- Ñ des temporales también ejerzan dicho control y permitan tanto la discriminación o como Ja generalización. Un experimento de Church y Deluty (1977) servirá parag'” someter a prueba estas posibilidades y, eventualmente, poner un ejemplo de la na-4 turaleza diversa de los estímulos discriminativos. E Mediante reforzamiento posítivo, Church y Deluty entrenaron a un grupo de%: ratas en la conducta instrumental de presionar dos palancas (situadas a izquierda y “y derecha) en una caja de Skinner. Tras ello comenzaron Jos ensayos destinados a es: lablecer la discriminación temporal entre dos duraciones de un mismo estímulo: una duración “corta” de dos segundos y otra “larga” de ocho segundos. Así, al fina- lizar la ocurrencia del estímulo durante dos segundos, la respuesta de presión de una palanca específica (la izquierda, por ejemplo) llevaba a la presentación de co- mida, mientras la presión de la otra palanca (derecha) suponía que no apareciera el Í reforzador. Lo contrario ocurría cuando el estímulo duraba ocho segundos; ahora era la presión de la palanca derecha la que llevaba al refoszador, mientras que éste no“ se presentaba si el sujeto apretaba la palanca izquierda. De nuevo nos encontrames ante un procedimiento de discriminación condicional arbitraria donde el estímulo de. muestra fue la duración y los estímulos de comparación fueron las Posiciones derecha ¿ o izquierda de las palancas. : A! comenzar el entrenamiento discriminativo, los animales mostraban un com portamiento indiferenciado ante las dos duraciones del estímulo. De hecho, respon, dían al azar, presionando cada palanca aproximadamente en el 50% de las ocasio” E nes. Progresivamente los sujetos fueron aprendiendo las funciones discriminativas $ que tenía cada duración y, adaptando su comportamiento a las circunstancias ant, bientales, comenzaron a presentar la conducta de manera discriminada. Finalmen- te, las duraciones del estímulo llegaron a controlar eficazmente el comportamientos de forma que los animales prácticamente sólo presentaban la RC (presión palanci Izquierda) tras la duración de dos segundos y la RL (presión palanca derecha) úni Camente cuando el estímulo duraba ocho segundos. Obtenida la discriminación entre las dos duraciones, puede plantearse hasta” qué punto se dará el proceso complementario de generalización (temporal, en este caso). Una forma sencilla de hacerlo fue planteada por Stubbs (1968): podemos vol- + Capítulo 6: Control de estímulos 287 ver a presentar a los sujetos el estímulo entrenado pero, ahora, con duraciones in: termedias entre las dos empleadas en la discriminación. Si los animales estiman que la nueva duración es. por ejemplo, similar a la de dos segundos, responderán con la R¿: (presión de palanca izquierda); si, por cl contrario, “estiman” que la nue- va duración es similar a la entrenada como larga, responderán presentando la Ry (presión de palanca derecha). Un procedimiento como éste fue empleado por Church y Deluty y les permitió obtener resultados de la misma índole de los que se muestran en la Figura 6.7. Como se puede ver en ella, las ratas estimaron como “Lar- gas” en mucha mayor proporción las duraciones más próximas al valor. de ocho se- gundos (E+) que las más cercanas a los dos segundos (E-). La generalización tem- pora) era, por tanto, mayor cuanto más cercana se encontraba Ja duración de prueba de aquélla que había sido entrenada como E+, De forma complementaria, los ani- males estimaron en mayor proporción como “cortas” las duraciones que, de hecho, estaban más cercanas a los dos segundos (E+) que las más próximas a ocho (E-). Figura 6.7. Prucba de discriminación/generalización temporal realizada mediante un proce- dimiento de estimación, Para cada duración del estímulo se muestra la proporción de Re (presión de palanca izquierda) y la proporción de Ry, (presión de palanca derecha). Proporción de respuestas (Co L) 67 ns Dutación del estímulo (5) Los resultados de investigaciones como la que aquí hemos presentado ponen de manifiesto que, efectivamente, los procesos de discriminación/generalización pue- den establecerse a partir de dimensiones estimulares que no están vinculadas ex- Presamente a un sistema sensorial específico. 6.3, Variación: la generación de conductas en nuevos ambientes 6.3.1. Generalización de estímulos En el apartado 6.2.1 se ha descrito qué es un gradiente de generalización y, so- meramente, cómo se puede interpretar; sin embargo, no hemos desarrollado toda-