Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


esquema cap 5 ame, Esquemas y mapas conceptuales de Psicología

Asignatura: aprenentatge i motivació, Profesor: Joan Sansa, Carrera: Psicologia, Universidad: UB

Tipo: Esquemas y mapas conceptuales

2013/2014

Subido el 04/06/2014

xeniaescalona
xeniaescalona 🇪🇸

3.9

(110)

32 documentos

1 / 8

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS
PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL
Comienzan con Thorndike.
Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal debía aprender cómo salir de la caja.
Los resultados son obvios, con la repetición elanimal cada vez tarda menos tiempo en repetir la acción que abre la caja. Sin embargo hay que hacer una puntualización,
Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como una asociación estímulo-respuesta.
Ley del efecto: Si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la
respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica un aprendizaje E-R.
APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL
Procedimientos
de ensayo
discreto
Normalmente se llevan a cabo en laberintos
W.S. Small (1899-1900) creó laberintos para estudiar la conducta de las ratas. Uno tenía forma de T (para estudiar la conducta de elección )y otro era
simplemente alargado con forma de I (gráficos pág 129).
Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la meta) y el tiempo de latencia (tiempo que tarda en abandonar la
salida e iniciar la carrera).
Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones.(a diferencia de los laberintos en T en que el animal era
sacado del laberinto al llegar a meta). Skinner quería obtener una respuesta más natural en los experimentos.
La observación informal sugiere que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto de operante como
la forma de dividir la conducta en unidades medibles con significado.
Foto página 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida.
La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El operante de presión de la palanca se
define como una presión hacia abajo suficiente para que cause el cierre del microinterruptor.
Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del signo mediante un sonido (condicionamiento
clásico) para que el animal se dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el animal está preparado para
aprender la respuesta instrumental.
Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente NUNCA sucederá por si misma la respuesta que produce el reforzador.. Poco a
poco vamos produciendo un moldeamiento de la conducta del animal hasta conseguir la respuesta buscada.
pf3
pf4
pf5
pf8

Vista previa parcial del texto

¡Descarga esquema cap 5 ame y más Esquemas y mapas conceptuales en PDF de Psicología solo en Docsity!

CAPITULO 5: CONDICIONAMIENTO INTRUMENTAL – FUNDAMENTOS

PRIMERAS INVESTIGACIONES SOBRE CONDICIONAMIENTO INSTRUMENTAL

Comienzan con Thorndike.

Sus experimentos se basaban en introducir animales hambrientos en cajas con comida en el exterior y a la vista del animal. El animal debía aprender cómo salir de la caja.

Los resultados son obvios, con la repetición elanimal cada vez tarda menos tiempo en repetir la acción que abre la caja. Sin embargo hay que hacer una puntualización,

Thorndike no explicaba que los animales compredieran el funcionamiento del mecanismo que abría la caja, sino que la abrían como una asociación estímulo-respuesta.

Ley del efecto: Si una respuesta en presencia de un estímulo es seguida por un suceso satisfactorio, la asociación entre el estímulo (E) y la respuesta (R) se fortalece. Si la

respuesta es seguida por un suceso molesto, la asociación E-R se debilita. La ley del efecto implica un aprendizaje E-R.

APROXIMACIONES MODERNAS AL ESTUDIO DEL CONDICIONAMIENTO INSTRUMENTAL

Procedimientos de ensayo discreto

Normalmente se llevan a cabo en laberintos

W.S. Small (1899-1900) creó laberintos para estudiar la conducta de las ratas. Uno tenía forma de T (para estudiar la conducta de elección )y otro era simplemente alargado con forma de I (gráficos pág 129).

Con los laberintos se puede medir la velocidad de la carrera (desde la salida hasta la meta) y el tiempo de latencia (tiempo que tarda en abandonar la salida e iniciar la carrera). Skinner (1938). Se permite que el animal repita la respuesta una y otra vez sin restricciones.(a diferencia de los laberintos en T en que el animal era sacado del laberinto al llegar a meta). Skinner quería obtener una respuesta más natural en los experimentos.

La observación informal sugiere que la conducta en curso es un continuo, una actividad sigue a la otra. Skinner propuso el concepto de operante como la forma de dividir la conducta en unidades medibles con significado.

Foto página 131: Rata hambrienta en una caja de Skinner. Hay una palanca conectada a un dispensador de comida.

  • La respuesta operante (presionar la palanca) se define a partir del efecto que produce en el ambiente. El operante de presión de la palanca se define como una presión hacia abajo suficiente para que cause el cierre del microinterruptor.
  • Entrenamiento y moldeamiento al comedero Es la primera fase. Se realiza un seguimiento del signo mediante un sonido (condicionamiento clásico) para que el animal se dirija al comedero. (esto es el entrenamiento al comedero). Tras este entrenamiento el animal está preparado para aprender la respuesta instrumental.

Si la respuesta NO ES ALGO que el animal ya realiza ocasionalmente NUNCA sucederá por si misma la respuesta que produce el reforzador.. Poco a poco vamos produciendo un moldeamiento de la conducta del animal hasta conseguir la respuesta buscada.

Procedimientos de operante libre

Esta dos fases que hemos visto del modeamiento son: “reforzamiento de aproximaciones sucesivas”

Moldeamiento y nueva conducta Toda la nueva unidad conductual de la rata está formada por un conjunto de respuestas preexistentes. Es decir, se le enseña una nueva combinación de respuestas familiares en una nueva actividad. Es importante señalar que el moldeamiento aprovecha la variabilidad inherente de la conducta. Es decir, se puede variar la conducta en una dirección u otra.

El moldeamiento puede producir nuevas formas de respuesta nunca antes realizadas por el organismo.

Antes de los experimentos las palomas conseguían abrir el pico 10 mm, pero tras el moldeamiento llegaban hasta 20 mm.

La tasa de respuesta como medida de la conducta operante

Los experimentos con operante libre permiten una observación continua durante largos periodos (a diferencia del ensayo discreto). Skinner propuso la “tasa de ocurrencia” (frecuencia de la respuesta por minuto) como medida de la probabilidad de una respuesta. Las respuestas más probables ocurren con frecuencia y muestran una tasa alta.

PROCEDIMIENTOS DE CONDICIONAMIENTO INSTRUMENTAL

Antes de empezar con los procedimientos (que son 4) vamos a explicar 4 conceptos:

  • Estimulo apetitivo : Una consecuencia placentera.
  • Estímulo aversivo: Una consecuencia molesta.
  • Contingencia positiva: La respuesta instrumental proporciona el estímulo (un

chico corta el césped y recibe dinero)

  • Contingencia negativa: La respuesta instrumental evita el estímulo (cierro la

ventana y no entra lluvia)

Importante la tabla de la página 134

Y ahora los 4 procedimientos:

1. La respuesta

instrumental

picoteos como quisieran siempre que fuesen 8 entre dos teclas. Tras 50 ensayos solo recibirían comida si no repetian ninguna de las combinaciones de los 50 ensayos del principio. Paralelamente un grupo de control recibía comida independientemente de si repetía o no. Los resultados demostraron que el grupo que no tenía que repetir las combinaciones daba mucha más variabilidad en su respuesta que el grupo de control, creando combinaciones nuevas.

Por lo tanto:

  • La variabilidad de la respuesta puede mantenerse e incrementarse por reforzamiento.
  • En ausencia de reforzamiento explícito de la variabilidad, la respuesta llega a ser más estereotipada con un condicionamiento instrumental continuado.

Relevancia o pertinencia en el condicionamiento instrumental

Thordike estudió las respuestas de gatos atrapados en cajas. Primeramente condicionó el rascado y el bostezo como respuestas instrumentales para escapar y en otros experimentos condicionó manipular un picaporte o tirar de una anilla. Demostró que cuando se trataba del picaporte o la anilla, la

respuesta era mucho más vigorosa que cuando se trataba del bostezo y el rascado. La evolución natural del gato hace que manipular un picaporte y empujar una anilla son respuestas que están relacionadas de forma natural con escapar de la trampa. Con esto se explica el concepto de pertinencia.

Deriva instintiva: Breland y Breland observaron varias limitaciones y problemas a la hora de entrenar animales para realizar exhibiciones en circos. Observaron que los animales realizaban conductas relacionadas con su forma de alimentación en lugar de reproducir la conducta buscada por los educadores.

Sistemas de conducta y limitaciones en el condicionamiento instrumental

De acuerdo con la teoría de los sistemas de conducta, cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa y se dedica a otras actividades relacionadas con la comida. De acuerdo con la aproximación de los sistemas de conducta, deberíamos ser capaces de predecir qué respuestas se incrementarán con un reforzamiento de comida mediante el estudio de lo que los animales hacen cuando su sistema de alimentación está activado en ausencia de condicionamiento instrumental. Esto suena un poco lioso pero se entiende con el siguiente ejemplo:

Cuando un hamster tiene comida suficiente se dedica a otras actividades como el autocuidado (lavarse, etc) pero cuando está hambriento su sistema de conducta se centra en otras actividades como rascar o comer. Por lo tanto podemos concluir que el autocuidado no está relacionado con su sistema de conducta de la alimentación y que el reforzamiento de comida podría producir incrementos en actividades como cavar y escarbar pero no en lavarse la cara y rascarse.

2. El reforzador

instrumental

Cantidad y naturaleza del reforzador

Las dos características están muy relacionadas. Tener un reforzador más grande o más sabroso (en el caso de la comida) provocará respuestas más intensas en los sujetos.

Cambios en la naturaleza y cantidad del reforzador

Esto está relacionado con el modelo Rescorla-Wagner visto en el tema anterior.

Si el EI es mayor de lo esperado, producirá condicionamiento excitatorio. Si por el contrario el EI es menor de lo esperado, producirá condicionamiento inhibitorio.

Contraste positivo: Se refiere a una elevada respuesta por una recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva.

Contraste negativo: Se refiere a una respuesta disminuida por una recompensa desfavorable debido a una experiencia anterior con una consecuencia mejor.

Contraste sucesivo (positivo o negativo): Dos condiciones de respuesta en diferentes fases del experimento y sólo un cambio en la magnitud de la recompensa para los grupos de cambio.

Contraste conductual simultáneo: Efectos de contraste conductual (contraste positivo y negativo) que están producidos por frecuentes cambios entre una condición de recompensa favorable y una desfavorable, con cada condición de recompensa asociada a su propio estímulo distintivo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en una situación está determinada en parte por las experiencias del organismo con reforzadores en otras situaciones.

3. La relación

respuesta- reforzador

2 tipos de relaciones entre una respuesta y un reforzador

a) Relación temporal (o contigüidad temporal): Tiempo que transcurre entre la respuesta y el reforzador. En la “Contigüidad temporal” el reforzador se entrega inmediatamente después de la respuesta.

b) Relación causal: (o contingencia respuesta-reforzador). Se refiere al hecho de que la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.

Efectos de la contigüidad temporal

El reforzamiento inmediato es preferible al demorado. Proporcionar el reforzador inmediatamente después de la ocurrencia de la respuesta instrumental facilita el aprendizaje. Hay varios factores que explican porqué el condicionamiento instrumental es tan sensible a la demora del reforzamiento:

importantes al comienzo del intervalo entre comidas, cuando la presentación de comida era improbable.

El tipo de respuestas que se dan en el intervalo se agrupan en 3 subgrupos siguiendo el orden temporal tras la última aparición de comida:

a) – Búsqueda focalizada poscomida (cerca del cuenco)

b) – Búsqueda general (lejos del cuenco)

c) - Búsqueda focalizada (cerca del cuenco otra vez)

Efectos de la controlabilidad de los reforzadores

Con una contingencia fuerte, que el reforzador suceda depende de si ha ocurrido la respuesta instrumental. Un hallazgo importante en experimentos con perros fue que la exposición a una descarga incontrolable dificultaba el aprendizaje posterior. Este efecto recibe el nombre de efecto de indefensión aprendida.

1. El diseño triádico: (tabla página 153)

Los experimentos de indefensión aprendida se realizan utilizando el diseño triádico.

Contiene 2 fases:

a) Exposición

■ Grupo de ratas E: Expuesto a descargas periódicas de las que pueden escapar.

■ Grupo de ratas A: Cada sujeto del grupo A es acoplado a cada sujeto del grupo E y recibe las mismas descargas pero no pueden escapar de ellas.

■ Grupo C: No recibe descargas pero está confinado en el aparato tanto tiempo como los otros.

b) Condicionamiento

Los 3 grupos reciben entrenamiento de escape – evitación

Resultados: La exposición a una descarga incontrolable (Grupo A) produce peores resultados en el aprendizaje escape- evitación que el resto de los grupos. La diferencia en la tasa de aprendizaje entre los grupos muestra que los animales son sensibles a la contingencia respuesta-reforzador.

2. Hipótesis de la indefensión aprendida : Esta hipótesis asume que durante la exposición a descargas incontrolables, los animales aprenden que las descargas son independientes de su conducta, no pueden hacer nada para controlarlas. Esto dificulta el aprendizaje ya que la falta de control sobre la situación hace que descienda la motivación de los sujetos para realizar una respuesta instrumental. No confundir con el efecto de indefensión aprendida que explica el patrón de resultados obtenido con el diseño triádico. 3. Deficit de actividad: Las ratas del Grupo A aprendían a ser inactivas en respuesta a la descarga durante la fase de exposición. 4. Deficit atencional: Una descarga inescapable hace que los animales presten menos atención a sus acciones. Sin embargo marcar la respuesta instrumental supera el déficit de indefensión aprendida.

5.Relaciones estimulares en el condicionamiento de escape : El rasgo definitorio de la conducta de escape es que la respuesta instrumental tiene como consecuencia la terminación del estímulo aversivo. Además, la respuesta de escape tiene como resultado claves internas de retroalimentación de la respuesta. Hay dos:

  • Claves de retroalimentación de la terminación de la descarga. (al comienzo de la respuesta de escape)
  • Claves de retroalimentación de la señal de seguridad. (cuando el animal completa la respuesta)

Estas claves contextuales llegan a convertirse en inhibidores condicionados del miedo y limitan el miedo elicitado por las claves contextuales de la cámara experimental. Hay mayor probabilidad que las claves contextuales de la cámara en la que se administran las

descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables.