Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Elementos Fundamentales de Aprendizaje: Respuesta Instrumental y Operante - Prof. 90, Apuntes de Psicología

Conceptos básicos del aprendizaje instrumental y operante, incluyendo la respuesta instrumental, suceso meta, relación entre ellos, conducta dirigida a una meta, procedimientos de moldeamiento y el efecto de reforzamiento. Se abordan conceptos relacionados con la variabilidad conductual, sistemas de conducta y limitaciones en el condicionamiento instrumental.

Tipo: Apuntes

Antes del 2010

Subido el 22/09/2010

ananakm
ananakm 🇪🇸

5

(3)

7 documentos

1 / 7

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 5: CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS.
Condicionamiento instrumental: las presentaciones de los estímulos dependen
de la ocurrencia previa de respuestas especícas.
Elementos fundamentales:
Respuesta instrumental
Suceso meta
Relación entre respuesta instrumental y suceso meta
Conducta dirigida a una meta: situaciones de aprendizaje en las que los
estímulos a los que se enfrenta un organismo son resultado directo de su conducta.
Conducta instrumental: la que sucede debido a que ha servido previamente
como instrumento para producir ciertas consecuencias.
¿Cómo puede investigarse la conducta instrumental? Buscando ejemplos de CDM
en el ambiente natural, aunque no es probable que tenga resultados denitivos.
1. PRIMERAS INVESTIGACIONES SOBRE EL CONDICIONAMIENTO
INSTRUMENTAL.
Thorndike comenzó estudiando qué capacidades intelectuales humanas están
presentes en los animales.
Procedimiento: gato hambriento en una caja problema con algo de comida fuera de
la vista. Debía aprender cómo salir. Con la práctica, las latencias eran cada vez más
cortas.
Contribuciones:
Evitación de interpretaciones antropomórcas de la conducta
Interpretación del resultado como aprendizaje de una asociación E-R
La consecuencia de la respuesta exitosa fortalecía la asociación E-R
Ley del efecto: si una respuesta en presencia de un estímulo es seguida
por un suceso satisfactorio, la asociación entre el E-R se fortalece. Si la
respuesta es seguida por un suceso molesto, la asociación E-R se debilita.
2. APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO
INSTRUMENTAL.
Thorndike utilizó 15 cajas problema. Algunas estándar para facilitar la comparación.
2.1.. PROCEDIMIENTOS DE ENSAYO DIRECTO.
Acaba con la retirada del animal del aparato y la RI se realiza sólo una vez durante
cada ensayo.
Siglo XX, W.S. Small: el laberinto aprovecharía la propensión de las ratas a los
pasadizos pequeños y tortuosos.
Formas de cuanticar la conducta de elección:
Velocidad de la carrera: desde la caja de salida hasta la de meta. Aumenta
con ensayos de entrenamiento repetidos.
Latencia: tiempo que tarda el animal en abandonar la caja de salida y
empezar a desplazarse por el pasadizo. Se hacen más cortas a medida que
progresa el entrenamiento.
1.. PROCEDIMIENTOS DE OPERANTE LIBRE.
En un laberinto en T las oportunidades para responder son programadas por el
experimentador.
Operante libre (Skinner): se repite la respuesta instrumental sin restricciones. La
conducta en curso es un continuo.
Operante: forma de dividir la conducta en unidades medibles con signicado.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Elementos Fundamentales de Aprendizaje: Respuesta Instrumental y Operante - Prof. 90 y más Apuntes en PDF de Psicología solo en Docsity!

TEMA 5: CONDICIONAMIENTO INSTRUMENTAL: FUNDAMENTOS.

Condicionamiento instrumental: las presentaciones de los estímulos dependen de la ocurrencia previa de respuestas específicas. Elementos fundamentales:

• Respuesta instrumental

• Suceso meta

• Relación entre respuesta instrumental y suceso meta

Conducta dirigida a una meta: situaciones de aprendizaje en las que los estímulos a los que se enfrenta un organismo son resultado directo de su conducta. Conducta instrumental: la que sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias. ¿Cómo puede investigarse la conducta instrumental? Buscando ejemplos de CDM en el ambiente natural, aunque no es probable que tenga resultados definitivos.

1. PRIMERAS INVESTIGACIONES SOBRE EL CONDICIONAMIENTO

INSTRUMENTAL.

Thorndike comenzó estudiando qué capacidades intelectuales humanas están presentes en los animales. Procedimiento: gato hambriento en una caja problema con algo de comida fuera de la vista. Debía aprender cómo salir. Con la práctica, las latencias eran cada vez más cortas. Contribuciones:

• Evitación de interpretaciones antropomórficas de la conducta

• Interpretación del resultado como aprendizaje de una asociación E-R

• La consecuencia de la respuesta exitosa fortalecía la asociación E-R

• Ley del efecto: si una respuesta en presencia de un estímulo es seguida

por un suceso satisfactorio, la asociación entre el E-R se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E-R se debilita.

2. APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO

INSTRUMENTAL.

Thorndike utilizó 15 cajas problema. Algunas estándar para facilitar la comparación.

2.1.. PROCEDIMIENTOS DE ENSAYO DIRECTO.

Acaba con la retirada del animal del aparato y la RI se realiza sólo una vez durante cada ensayo. Siglo XX, W.S. Small: el laberinto aprovecharía la propensión de las ratas a los pasadizos pequeños y tortuosos. Formas de cuantificar la conducta de elección:

• Velocidad de la carrera: desde la caja de salida hasta la de meta. Aumenta

con ensayos de entrenamiento repetidos.

• Latencia: tiempo que tarda el animal en abandonar la caja de salida y

empezar a desplazarse por el pasadizo. Se hacen más cortas a medida que progresa el entrenamiento.

1.. PROCEDIMIENTOS DE OPERANTE LIBRE.

En un laberinto en T las oportunidades para responder son programadas por el experimentador. Operante libre (Skinner): se repite la respuesta instrumental sin restricciones. La conducta en curso es un continuo. Operante: forma de dividir la conducta en unidades medibles con significado.

Respuesta operante: se define a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta operante. El elemento fundamental es la forma en que se “opera” en el ambiente.

a) Entrenamiento y moldeamiento en el comedero.

• Entrenamiento al comedero: aprender cuándo está disponible la comida en

el comedero por condicionamiento clásico (sonido).

• Si la respuesta no es algo que el animal ya realiza ocasionalmente, nunca

sucederá por sí misma la respuesta que produce el reforzador. Moldeamiento: incluye reforzamiento de aproximaciones y no reforzamiento de las formas de respuesta más tempranas. La forma en que el organismo cumple la función no importa, pero los pasos en el moldeamiento afectan a esta forma. Con entrenamiento prolongado, la respuesta llega a ser más eficiente e involucra menos gasto de energía.

b) Moldeamiento y nueva conducta.

El moldeamiento aprovecha la variabilidad inherente de la conducta F 0 E 0El condicionamiento instrumental incluye la construcción o síntesis de una nueva unidad conductual a partir de componentes de respuesta preexistentes en el repertorio del sujeto. El moldeamiento puede producir nuevas formas de respuesta F 0 E 0A medida que el criterio para el reforzamiento es gradualmente modificado, las respuestas varían de forma correspondiente y, eventualmente, aparecen conductas que nunca habían aparecido.

c) La tasa de respuesta como medida de la conducta operante.

Los métodos de operante libre permiten observación continua. El organismo determina la frecuencia de su respuesta instrumental y se observan los cambios en la probabilidad de la conducta a lo largo del tiempo. Tasa de ocurrencia: más probable, tasa alta; improbable, tasa baja.

3. PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL.

Estímulo apetitivo = consecuencia placentera. Estímulo aversivo = consecuencia molesta. Contingencia positiva: la respuesta instrumental puede proporcionar el estímulo. Contingencia negativa: la respuesta instrumental puede retirar o eliminar un estímulo. El aumento o disminución en la tasa de respuesta depende de la contingencia respuesta-consecuencia y de la naturaleza de la consecuencia.

a) Reforzamiento positivo.

Procedimiento en que la respuesta aproxima o produce un estímulo apetitivo. Contingencia positiva entre la respuesta y el estímulo positivo. Produce un aumento en la tasa de respuesta.

b) Castigo.

La respuesta instrumental produce o aproxima un estímulo molesto o aversivo. Contingencia positiva respuesta-consecuencia. Disminución en la tasa de respuesta.

Deriva instintiva: las respuestas extras que se desarrollan en situaciones de reforzamiento con comida, son actividades que los animales realizan instintivamente cuando obtienen comida. Estas respuestas naturales son muy fuertes y compiten con las respuestas requeridas.

c) Sistemas de conducta y limitaciones en el condicionamiento instrumental.

Consecuente con los sistemas de conducta : cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa y se dedica a actividades relacionadas con la comida.

• Efectividad del procedimiento para el incremento de una RI F 0 E 0según la

compatibilidad de la RI con la organización preexistente del sistema.

• La naturaleza de otras respuestas dependerá de los componentes

conductuales del sistema que se activa.

• Deberíamos poder predecir las respuestas que se incrementan con un

determinado reforzamiento.

• Condicionamiento clásico F 0 E 0otra forma de diagnosticar si una R es parte de

un sistema de conducta. Estudio con hámsters de Shettleworth F 0 E 0la teoría de los sistemas de conducta predice que el reforzamiento de comida podría producir incrementos en actividades como cavar, escarbar o erguirse, pero no en lavarse la cara y rascarse. Condicionamiento clásico F 0 E 0otra forma de diagnosticar si una R es parte de un sistema de conducta. Experimento de Timberlake y cols. F 0 E 0la deriva instintiva se desarrolla con CC y CI. Representa l aintrusión de respuestas apropiadas al sistema de conducta activado durante el CI.

4.2. EL REFORZADOR INSTRUMENTAL.

Varios efectos del reforzador determinan sus efectos sobre el aprendizaje y la ejecución de la conducta instrumental.

a) Cantidad y naturaleza del reforzador.

Un cambio en la cantidad del reforzador puede hacerlo cualitativamente distinto.

• Incrementos en la cantidad o calidad del reforzador F 0 E 0mayores tasas de

respuesta.

• En situaciones de operante libre, los efectos de la magnitud del reforzador

dependen del programa de reforzamiento y otros factores.

b) Cambios en la naturaleza y la cantidad del reforzador.

La efectividad de un reforzador depende de sus propiedades y de cómo se compara con otros experimentados por el individuo. Fundamentación del modelo Rescorla-Wagner

• Recompensa favorable como especialmente buena tras reforzamiento con

una recompensa mala

• Recompensa desfavorable como especialmente mala tras una buena

recompensa. Crespi F 0 E 0los efectos de una nueva recompensa aumentaron por la experiencia previa con una recompensa contrastada. Contraste positivo: alta respuesta por recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva (pareciendo especialmente buena si se ha experimentado una consecuencia peor). Contraste negativo: respuesta disminuida por una recompensa desfavorable por una experiencia anterior con una consecuencia mejor (pareciendo especialmente mala si se ha experimentado una recompensa mejor). Contraste conductual simultáneo: se dan si las condiciones de recompensa se modifican una y otra vez con una clave diferente señalando cada condición de recompensa. Los diferentes efectos de contraste están mediados por diferentes mecanismos:

• Contraste negativo: atribuido a los efectos aversivos que supone la

obtención de una recompensa inesperadamente pequeña.

Los efectos emocionales de este cambio no se dan inmediatamente y son seguidos por una acomodación a la continua disponibilidad de sólo una recompensa pequeña.

4.3. LA RELACIÓN RESPUESTA-REFORZADOR.

Un organismo debe organizar su conducta organizando su tiempo y energía. Para ser eficiente hay que ser sensible a la relación respuesta-reforzador:

• Cuándo se debe actuar para obtener un reforzador.

• Cuándo el reforzador se entrega independientemente de la acción.

Tipos de relaciones respuesta-reforzador:

• Temporal: contigüidad temporal: reforzador inmediatamente después de la

respuesta.

• Causal: contingencia: la respuesta instrumental es necesaria y suficiente

para la ocurrencia del reforzador.Los factores temporales y causales son independientes.

a) Efectos de la contigüidad temporal.

El reforzamiento inmediato es preferible al demorado. El aprendizaje instrumental se altera demorando el reforzador tras la ocurrencia de la respuesta instrumental. La respuesta decae bastante rápido con incrementos en la demora del reforzamiento. ¿Por qué es el condicionamiento instrumental tan sensible a la demora del reforzamiento? Porque para asociar el R1 con el reforzador, el organismo tiene que poder distinguir de alguna forma R1 de otras respuestas que realiza durante el intervalo de demora. Cómo resolverlo: conectando mejor la RI con el reforzador demorado, mediante:

• Con un reforzador secundario inmediatamente después de la RI (EC

previamente asociado con el reforzador).

• Con un procedimiento de marcado: marcar la RI criterio para distinguirla de

las otras. No puede explicarse por reforzamiento secundario o condicionado porque el estímulo de marcado se presenta tras respuestas correctas e incorrectas. ¿Cuáles son las consecuencias del reforzamiento independiente de la respuesta que podrían contribuir a los efectos perjudiciales del reforzamiento demorado?

• Las respuestas pueden interferir en la R instrumental crítica.

• El condicionamiento de claves contextuales: el reforzador ocurrirá en el

contexto experimental sin ser señalado por la respuesta, lo que bloqueará la asociación. Los procedimientos que interrumpen el condicionamiento de claves contextuales ayudan a neutralizar los efectos perjudiciales del reforzamiento demorado en el CI.

b) La contingencia respuesta-reforzador.

Incluso con una relación causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. La contigüidad es el factor crítico, más que la contingencia.

c) El experimento de superstición de Skinner.

Conducta supersticiosa: responder como si la conducta controlara la entrega del reforzador, cuando es proporcionado independientemente de la conducta. Explicación: reforzamiento accidental o adventicio: emparejamiento accidental de una respuesta con la entrega del reforzador. Skinner sugería que una contingencia positiva respuesta-reforzador no es necesaria para el CI.

i. Reinterpretación del experimento de superstición.

Contigüidad puesta en duda por Staddon y Simmelhag. Respuestas terminales y de ínterin. No encontraron reforzamiento accidental. La entrega de comida influía sólo en la fuerza de las respuestas terminales.

Déficit de aprendizaje porque los animales aprenden a ser inactivos. La descarga inescapable disminuye el movimiento motor y a esto se deben los posteriores déficits de actuación. Hay también situaciones en las cuales los efectos de aprendizaje no son debidos a la supresión del movimiento.

iv. Déficit atencional.

La descarga inescapable hace que los animales presten menos atención a sus acciones. Experimento Maier, Jackson y Tomie F 0 E 0se enfrentan al mismo problema que un animal que recibe reforzamiento demorado. Podría ser manipulado con los mismos procedimientos:

• Marcado: las ratas a las que se proporciones descarga inescapable no ven

interrumpido su escape posterior si cada R es marcada con un estímulo externo. Conclusión: una de las funciones del déficit de aprendizaje es una reducción de la atención a las respuestas que el animal realiza.

v. Relaciones estimulares en el condicionamiento de escape.

¿Por qué la exposición a la descarga no es tan dañina si el animal puede realizar respuestas de escape? Conducta de escape: la respuesta instrumental tiene como consecuencia la terminación de un estímulo aversivo. Pero también hay relaciones especiales estimulares:

• Claves de retroalimentación de la terminación de la descarga: E producidos

por la R experimentados al comienzo de la R de escape, justo antes de que la descarga se retire.

• Claves de retroalimentación de la señal de seguridad: E producidos por la R

experimentados cuando el animal completa la R, justo después de que la descarga se haya retirado al comienzo del intervalo entre ensayos. Son seguidas por el intervalo entre ensayos (ausencia de descarga), por lo que se convierten en inhibidores condicionados del miedo Es más probable que las claves contextuales de la cámara en la que se administran las descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables. Respuesta de escape: indica que la descarga se está terminando. Las diferencias en cómo los animales afrontan la estimulación aversiva puede ser resultado de diferencias en las relaciones de señal.