Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Condicionamiento Instrumental: Tipos, Procesos y Ejemplos - Prof. Adarraga, Apuntes de Psicología

El condicionamiento instrumental, su diferencia con el condicionamiento clásico y presenta los tipos básicos de este proceso de aprendizaje. Se incluyen ejemplos y procesos como generalización, moldeado y procedimientos de ensayo discreto y operante libre. El texto también menciona la contribución de b.f. Skinner y su teoría del refuerzo.

Tipo: Apuntes

2013/2014

Subido el 03/03/2014

emilylanzas
emilylanzas 🇪🇸

3.9

(111)

17 documentos

1 / 13

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
TEMA 2: PROCESOS DE CONDICIONAMIENTO: FUNDAMENTOS
2.1.- Condicionamiento instrumental (CI)
El condicionamiento instrumental (CI) constituye uno de los mecanismos de
aprendizaje de mayor importancia teórica y práctica: por una parte, es seguramente
el más investigado y mejor comprendido, y por otra es fuente de algunas de las más
significativas aplicaciones de la psicología a problemas concretos.
En una primera aproximación, se trata del mecanismo que permite a un organismo
aprender cuáles de sus acciones se relacionan con resultados beneficiosos y
cuáles con resultados nocivos en un ambiente dado. Es decir, es el mecanismo de
aprendizaje basado en premios y castigos. El organismo aprende a realizar más
frecuentemente comportamientos que demuestran tener consecuencias beneficiosas, y
a abandonar aquellas conductas cuyas consecuencias resultan ser dañinas.
El condicionamiento clásico o pavloviano (CC) permite a un organismo aprender
acerca de las señales que presagian eventos importantes: aspectos de su entorno que
no le resultan controlables. El CI, por el contrario, permite a un organismo aprender a
controlar ciertos aspectos del medio mediante su conducta.
El condicionamiento instrumental, por tanto, se diferencia del CC en un aspecto
esencial: En el CI, la secuencia de sucesos depende de la conducta del organismo. En
el CC, lo que sucede a lo largo de una sesión está prefijado por el psicólogo, en el caso
de un experimento o una intervención profesional, o viene dado por el ambiente en las
situaciones naturales. En todo caso, en el CC la secuencia de estímulos que el
organismo recibe es la misma independientemente de lo que haga.
En sentido estricto, el C. Operante es un caso particular de C. Instrumental. El C.
Instrumental, como ya hemos dicho, se refiere a los mecanismos por los cuales un
organismo aprende a dar una respuesta más frecuentemente (o menos) en virtud de
los eventos(o “consecuencias”) que siguen sistemáticamente a dicha respuesta. El C.
Operante se refiere a los casos en los que dicha respuesta se define como un
operante, es decir, en virtud de sus propiedades funcionales. Sin embargo, la
importancia relativa del C.operante es tan grande que a menudo ambos términos
(“operante” e “instrumental”) aparecen intercambiados.
2.1.1. El fenómeno/procedimiento básico
En una situación estimular dada (antecedente), una respuesta emitida por un
organismo va seguida sistemáticamente por un cierto tipo de suceso ambiental
(consecuente o “consecuencia”). A medida que la situación se repite, la fuerza o la
probabilidad de la respuesta se ve modificada.
[ (Antecedente) Respuesta Consecuente] Cambio en la fuerza de R.
Cuando la respuesta resulta aumentada o fortalecida, decimos que el consecuente es
un refuerzo o reforzador. Cuando la respuesta resulta debilitada o reducida,
llamamos al consecuente castigo.
pf3
pf4
pf5
pf8
pf9
pfa
pfd

Vista previa parcial del texto

¡Descarga Condicionamiento Instrumental: Tipos, Procesos y Ejemplos - Prof. Adarraga y más Apuntes en PDF de Psicología solo en Docsity!

TEMA 2: PROCESOS DE CONDICIONAMIENTO: FUNDAMENTOS

2.1.- Condicionamiento instrumental (CI)

El condicionamiento instrumental (CI) constituye uno de los mecanismos de aprendizaje de mayor importancia teórica y práctica: por una parte, es seguramente el más investigado y mejor comprendido, y por otra es fuente de algunas de las más significativas aplicaciones de la psicología a problemas concretos.

En una primera aproximación, se trata del mecanismo que permite a un organismo aprender cuáles de sus acciones se relacionan con resultados beneficiosos y cuáles con resultados nocivos en un ambiente dado. Es decir, es el mecanismo de aprendizaje basado en premios y castigos. El organismo aprende a realizar más frecuentemente comportamientos que demuestran tener consecuencias beneficiosas, y a abandonar aquellas conductas cuyas consecuencias resultan ser dañinas.

El condicionamiento clásico o pavloviano (CC) permite a un organismo aprender acerca de las señales que presagian eventos importantes: aspectos de su entorno que no le resultan controlables. El CI, por el contrario, permite a un organismo aprender a controlar ciertos aspectos del medio mediante su conducta.

El condicionamiento instrumental, por tanto, se diferencia del CC en un aspecto esencial: En el CI, la secuencia de sucesos depende de la conducta del organismo. En el CC, lo que sucede a lo largo de una sesión está prefijado por el psicólogo, en el caso de un experimento o una intervención profesional, o viene dado por el ambiente en las situaciones naturales. En todo caso, en el CC la secuencia de estímulos que el organismo recibe es la misma independientemente de lo que haga.

En sentido estricto, el C. Operante es un caso particular de C. Instrumental. El C. Instrumental, como ya hemos dicho, se refiere a los mecanismos por los cuales un organismo aprende a dar una respuesta más frecuentemente (o menos) en virtud de los eventos(o “consecuencias”) que siguen sistemáticamente a dicha respuesta. El C. Operante se refiere a los casos en los que dicha respuesta se define como un operante, es decir, en virtud de sus propiedades funcionales. Sin embargo, la importancia relativa del C.operante es tan grande que a menudo ambos términos (“operante” e “instrumental”) aparecen intercambiados.

2.1.1. El fenómeno/procedimiento básico

En una situación estimular dada ( antecedente ), una respuesta emitida por un organismo va seguida sistemáticamente por un cierto tipo de suceso ambiental ( consecuente o “consecuencia”). A medida que la situación se repite, la fuerza o la probabilidad de la respuesta se ve modificada.

[ (Antecedente)RespuestaConsecuente]  Cambio en la fuerza de R.

Cuando la respuesta resulta aumentada o fortalecida, decimos que el consecuente es un refuerzo o reforzador. Cuando la respuesta resulta debilitada o reducida, llamamos al consecuente castigo.

En el caso más sencillo, se sitúa a un organismo en una determinada situación controlada (e.g., en una caja de Skinner y con cierto grado de privación previa de alimento), y se le suministra como consecuente (reforzador) una cierta cantidad de comida cada vez que emite una respuesta concreta y predeterminada por el psicólogo (apretar una palanca, picotear un disco, etc.). Se comprueba que la frecuencia de la respuesta elegida aumenta sistemáticamente a medida que transcurre el tiempo.

A la inversa, se puede diseñar una situación en la que la respuesta vaya seguida, por ejemplo, por una descarga eléctrica. En tal caso, la R tenderá a darse menos o a desaparecer.

2.1.2. Conceptos principales

2.1.2.1. Respuesta

  • La respuesta objeto de condicionamiento instrumental puede ser, en principio, cualquiera que esté incluida en el repertorio conductual del organismo. Puede ser desde la respuesta más simple hasta una secuencia conductual compleja.
  • Las respuestas de carácter innato, relacionadas con funciones muy vitales para el organismo (alimentación, reproducción, etc.), son muy difíciles de modificar por condicionamiento (incluso imposibles, en algunos casos) y siempre existe el riesgo de producir alteraciones psicopatológicas al contravenir tendencias muy potentes y arraigadas (por ejemplo, si aplicamos consecuentes dolorosos a la conducta de comer, el organismo puede sufrir un serio desequilibrio psicológico). En general, el condicionamiento funciona óptimamente sobre conductas previamente aprendidas por el organismo, cuyo componente innato sea escaso o nulo. Estas, particularmente en nuestra especie, son la inmensa mayoría.
  • Un tipo especialmente importante lo constituyen los operantes o respuestas operantes. Un operante es una respuesta definida por sus propiedades funcionales o funcionalidad, es decir, por los efectos que opera en el ambiente (de ahí su nombre). Así, por ejemplo, cualquiera de las formas en que un organismo puede accionar una palanca se consideran como casos de una misma respuesta u operante. Es decir, puede ignorarse por ejemplo la morfología concreta de la respuesta (que se ejecute con un miembro u otro, con movimientos diferentes, etc.) o la intensidad concreta (siempre que sea suficiente para cerrar el contacto).

2.1.2.2. Consecuente

  • Suceso que afecta sistemáticamente a la fuerza o probabilidad de la respuesta a la que sigue consistentemente.
  • Reforzador o refuerzo : es un consecuente que aumenta la fuerza o la frecuencia de R a la que sigue.
  • Un refuerzo puede ser positivo (p.ej. aparición o administración de un E apetitivo) o negativo (no-aparición o retirada de un E aversivo).

ATENCION: no confundir positivo con bueno o beneficioso, ni negativo con malo o perjudicial. Positivo significa aquí “que se da o administra”, y negativo, “que se interrumpe, quita u omite”.

  • Castigo : es un consecuente que reduce la fuerza o la frecuencia de R a la que sigue.
  • Un castigo puede también ser positivo (p.ej. aparición de un suceso aversivo) o negativo (no-aparición o retirada de un suceso apetitivo).
  • Es muy importante no confundir un reforzador con un “estímulo o suceso agradable ”. Un suceso es un reforzador, por definición, en virtud de su efecto en el

2.1.2.5. Estímulo discriminativo

  • Estímulo cuya presencia es informativa sobre la disponibilidad de un consecuente. Es decir, indica si la contingencia está "activa" o no.
  • Estrictamente hablando, es lo mismo que antecedente. Sin embargo, como ya hemos observado, lo más común es llamar estímulos discriminativos sólo a los antecedentes concretos y puntuales, como una palabra, una imagen concreta, un sonido particular, etc.
  • En las situaciones controladas (laboratorio, clínica etc.), su uso es opcional : no tiene por qué haber un E discriminativo explícito. Sin embargo, en la práctica, su importancia es a menudo crucial: de un buen análisis y manejo de los E discriminativos puede depender el éxito del proceso de condicionamiento.
  • Se suele denotar ED^ o E+^ a los estímulos que indican la disponibilidad de un consecuente (que la contingencia está vigente o activa), y E ∆^ o E-^ a los que informan de su no-disponibilidad (contingencia no vigente o inactiva).

2.1.2.6. Generalización

  • En el caso del CI, es el grado en que el organismo “extiende” el efecto del aprendizaje a situaciones antecedentes diferentes de aquellas en las que originalmente aprendió.

2.1.2.7. Discriminación

  • Aprender a efectuar o no efectuar una respuesta en función de cambios (que pueden ser muy pequeños) en el antecedente.
  • Por ejemplo, un niño puede aprender a realizar frecuentemente una conducta en casa de sus tíos (donde es reforzada) y a no realizarla nunca en casa de sus padres (donde no lo es, o resulta castigada).

2.1.2.8. Moldeado o moldeamiento ( shaping )

  • Consecución gradual de una R que no estaba presente en el repertorio conductual del organismo (o lo estaba con una probabilidad muy baja) mediante reforzamiento de respuestas que constituyen aproximaciones sucesivas a la R deseada.
  • Tiene gran importancia práctica, ya que es el principal procedimiento de aprendizaje de Rs genuinamente nuevas para el organismo.
  • Importante: no confundir con “modelado” , que es un proceso de aprendizaje basado en imitación de la conducta de alguien que sirve de “modelo”.

2.1.2.9. Adquisición

  • Periodo y situación en el que se produce el condicionamiento, es decir, el aprendizaje de una contingencia de refuerzo o castigo. En laboratorio o clínica, se llama así también al procedimiento concreto empleado para ello.

2.1.2.10. Extinción

  • Periodo y situación en el que se rompe la contingencia entre la respuesta y el consecuente, de forma que la conducta tiende a volver a su situación original: por ejemplo, el organismo cada vez realiza menos la respuesta que ya no es reforzada.

Se refiere también al decaimiento y eventual desaparición de la respuesta por razón de esa ruptura de la contingencia.

2.1.2.11. Mantenimiento

  • Cualesquiera circunstancias que impiden que una conducta entre en extinción. Normalmente, son contingencias de refuerzo (sea R+ o R-).
  • El análisis del mantenimiento de las conductas problemáticas es uno de los aspectos más importantes de la intervención clínica, ya que a menudo es difícil y al tiempo resulta clave para el éxito de la intervención.

2.1.3. Tipos básicos de condicionamiento instrumental

Los cuatro tipos básicos de condicionamiento instrumental se producen como resultado del entrenamiento de un organismo mediante el establecimiento de una contingencia entre una R. y uno de los cuatro consecuentes básicos.

  1. Reforzamiento positivo (R+) : Administración de un suceso siguiendo contingentemente a una R dada, que tiene como efecto un aumento en la fuerza, la probabilidad o la tasa de ésta. Normalmente se trata de un estímulo apetitivo o de la posibilidad de realizar una conducta de alta probabilidad..

Ejemplo: cada vez que una rata presiona una palanca (R), se le administra como consecuente un trozo de comida; se puede observar que la rata cada vez presiona más frecuentemente la palanca

El tipo de CI que resulta de aplicar sistemáticamente reforzadores positivos a una conducta se conoce como entrenamiento de recompensa.

  1. Reforzamiento negativo (R-) : Omisión o interrupción de un suceso (típicamente, un E aversivo) de forma contingente con la emisión de una R, a resultas de lo cual se produce un aumento en la fuerza, la probabilidad o la tasa de ésta.

Ejemplo: cada vez que una rata se desplaza al lado opuesto de la jaula (R), como consecuente se interrumpe una descarga eléctrica que se le estaba aplicando; se puede observar que la rata cada vez cambia de lado más frecuentemente.

La aplicación sistemática de reforzadores negativos a una R se conoce como entrenamiento de evitación o entrenamiento de escape , dependiendo de si el organismo puede mediante la R llegar a “prevenir” la aparición del E. aversivo (evitación) o sólo puede interrumpirlo, acortando su duración, una vez administrado (escape)

  1. Castigo positivo (C+) : Administración de un suceso (en el caso típico, un E aversivo) siguiendo contingentemente a una R dada, que tiene como efecto una disminución en la fuerza, la probabilidad o la tasa de ésta. Ejemplo: cada vez que una oveja entra en contacto con la cerca en la que está encerrada (R), como consecuente recibe una descarga eléctrica; se puede observar que la oveja cada vez toca menos frecuentemente la cerca.

La aplicación sistemática de castigos positivos a una R se conoce como entrenamiento de castigo.

fortalece, de forma que el organismo tendrá más tendencia a dar esa respuesta en esa situación. Si por el contrario va seguida de un suceso nocivo o desagradable, la respuesta tenderá a no darse.

Desde el punto de vista del conductismo watsoniano, enfoque dominante entre los años 20 y los 50 del siglo XX, la anterior formulación resultaba muy inadecuada, ya que se basa en estados internos del organismo ("satisfactorio", "desagradable", etc.) inobservables y por ello científicamente dudosos. Por otra parte, el intento de Thorndike de definir los “estados satisfactorios” como aquellos que el organismo no hacía nada por evitar, etc., incurría en circularidades que los críticos señalaron en repetidas ocasiones.

En los años 30-40, B. F. Skinner, sin duda el investigador más importante del conductismo y uno de los principales de toda la historia de la psicología, reformula la ley del efecto como "ley del refuerzo" adoptando un marco teórico más consistente y operativo:

Ciertos sucesos (refuerzos), cuando siguen consistentemente a una respuesta de un organismo, aumentan su probabilidad

Desentendiéndose de las interpretaciones asociacionistas, pone el énfasis en la relación estadística (contingencia) entre la respuesta y los eventos que la siguen consistentemente.

Una de las aportaciones teóricas más significativas de Skinner es la reconceptualización de la respuesta como operante , es decir, definida exclusivamente por sus propiedades funcionales (en contraposición a otros aspectos, como la topografía o la intensidad – ver Tema 1). Metodológicamente, se deben a él dispositivos como la caja de Skinner (o “cámara de operantes”), el registro acumulativo y muchos otros.

2.2. Condicionamiento clásico (CC)

2.2.0 Introducción

En el medio de los organismos hay muchos estímulos o sucesos cuyas probabilidades de aparición están relacionadas. Por ejemplo, muy a menudo el trueno va precedido del relámpago, las ventolinas suelen anteceder a las tormentas, el olor de un animal precede a su aparición, etc. De este modo, algunos estímulos constituyen “señales”, más o menos fiables, de otros sucesos.

En ciertos casos, además, el primer estímulo actúa como señal de otro estímulo o suceso que resulta muy importante para el organismo. Por ejemplo, un cierto ruido característico puede señalizar la inminente aparición de un depredador; otro sonido distinto puede indicar la posterior aparición de alimento (una presa), una pareja potencial, etc.

Evidentemente, es ventajoso para un organismo ser capaz de aprender a servirse de estas señales que le brinda su medio. El condicionamiento clásico o pavloviano es el mecanismo que nos permite captar estas regularidades.

El CC está presente en numerosísimas especies, incluida la nuestra. Es muy importante entender que no se debe confundir el CC con otras capacidades (intelectuales, etc.) que también nos permiten detectar regularidades de nuestro medio. El CC, al igual que el CI, no depende de ningun tipo de razonamiento o cálculo deliberado. Es un mecanismo que opera típicamente de forma inconsciente.

2.2.1. El fenómeno/procedimiento básico

Un organismo recibe repetidamente un estímulo neutro seguido de un estímulo biológicamente relevante (EI). Se constata que el organismo acaba dando al estímulo neutro una respuesta (RC) que previamente no era suscitada por éste. Por ello, el estímulo neutro inicial pasa a denominarse estímulo condicionado (EC)

[ECEI] ( repeticiones ) >> ECRC

2.2.2. Conceptos principales

2.2.2.1. Estímulo Neutro/Condicionado (EC) Estímulo originalmente neutro que se empareja temporalmente con el EI durante el condicionamiento. Es neutro en el sentido de que por sí mismo no suscita regularmente una R. específica, aunque puede producir alguna respuesta genérica (R. de orientación, parpadeos, etc.)

2.2.2.2. Estímulo Incondicionado (EI) Estímulo que suscita regularmente una R. no aprendida y medible en los miembros de una especie. Ejemplos: Comida, descarga eléctrica, zumo de limón en la lengua, soplo de aire en los ojos, etc.

2.2.2.3. Respuesta Incondicionada (RI) La R. no aprendida y medible suscitada por el EI de forma regular. Un EI puede suscitar más de una RI Ejemplos: salivación, flexión, reflejo pupilar, náuseas...

2.2.2.4. Respuesta Condicionada (RC) Respuesta que, una vez condicionado el organismo, resulta provocada por el EC. Frecuentemente (pero no siempre) es semejante a RI. En tales casos, la magnitud de RC es inferior a la de RI.

2.2.2.5. Contingencia Relación estadística entre el EC y el EI por la cual el primero es más o menos fiable como predictor del segundo. Significa, por tanto, lo mismo que en CI, sólo que aquí el vínculo no es entre una conducta y un consecuente, sino entre dos estímulos ambientales. En CC, las contingencias de más magnitud producen siempre mejor aprendizaje que las más bajas.

2.2.2.6. Adquisición

El EC y el EI comienzan exactamente a la vez. Lo más habitual es que también terminen al mismo tiempo, pero este no es un aspecto necesario ni especialmente relevante.

Condicionamiento simultáneo

Tiempo

EI

EC

Desde los albores de la historia del pensamiento se ha pensado que las asociaciones se establecen tanto más fácilmente cuanto más próximos estén los elementos a asociar. La proximidad entre EC y EI es máxima en el condicionamiento simultáneo.

Sin embargo, los resultados de varias décadas de investigación indican sin lugar a dudas que este procedimiento no es ni mucho menos el más eficaz para provocar una RC. En numerosas condiciones, se ha observado que el procedimiento simultáneo es totalmente inefectivo. En el mejor de los casos, resulta muy inferior a otros.

2.2.3.3.2. Condicionamiento de demora breve

El EC comienza en primer lugar. Al cabo de un tiempo breve (menos de un minuto) comienza el EI. En ese momento, el EC puede o bien terminar o bien mantenerse por un breve tiempo.

Tiempo

EI

EC

Condicionamiento de demora breve

El condicionamiento de demora breve es en muchos casos el más eficaz. Para una especie y un sistema de respuesta dados, existe un valor óptimo del intervalo entre EC y EI que da lugar a la máxima eficacia en la producción de RC. Valores inferiores o (sobre todo) superiores dan lugar a una pérdida de efectividad del procedimiento.

2.2.3.3.3. Condicionamiento de demora larga

Procedimiento idéntico al anterior, excepto en que la demora del EI respecto al EC es mayor:

Tiempo

EI

EC

Condicionamiento de demora larga

En la mayoría de los casos, este procedimiento es poco efectivo , si bien con algunas excepciones.

Trabajando con este procedimiento, en el laboratorio de Pavlov se descubrió el fenómeno conocido como inhibición de demora. Consiste en que un organismo que ha pasado por una larga fase de adquisición con demoras prolongadas aprende a inhibir la respuesta hasta el final del intervalo de demora. Es decir, la RC no se dá inmediatamente al comenzar el EC, sino que el organismo, que ha aprendido que el EI tardará aún un tiempo en llegar, la “retiene” aproximadamente hasta que dicho tiempo está a punto de concluir y el EI resulta inminente.

2.2.3.3.4. Condicionamiento de huella

Se caracteriza porque hay un “intervalo vacío” entre el EC y el EI, conocido como intervalo de huella.

Condicionamiento de huella

Tiempo

EI

EC

En 1913 realizó un experimento semejante a los de Pavlov, pero utilizando un estímulo aversivo para el organismo (una descarga eléctrica en una pata). Los resultados fueron análogos a los de Pavlov: el organismo aprendía a retirar (contraer) la pata ante la sola presencia del sonido.