







Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
El condicionamiento instrumental, su diferencia con el condicionamiento clásico y presenta los tipos básicos de este proceso de aprendizaje. Se incluyen ejemplos y procesos como generalización, moldeado y procedimientos de ensayo discreto y operante libre. El texto también menciona la contribución de b.f. Skinner y su teoría del refuerzo.
Tipo: Apuntes
1 / 13
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!








2.1.- Condicionamiento instrumental (CI)
El condicionamiento instrumental (CI) constituye uno de los mecanismos de aprendizaje de mayor importancia teórica y práctica: por una parte, es seguramente el más investigado y mejor comprendido, y por otra es fuente de algunas de las más significativas aplicaciones de la psicología a problemas concretos.
En una primera aproximación, se trata del mecanismo que permite a un organismo aprender cuáles de sus acciones se relacionan con resultados beneficiosos y cuáles con resultados nocivos en un ambiente dado. Es decir, es el mecanismo de aprendizaje basado en premios y castigos. El organismo aprende a realizar más frecuentemente comportamientos que demuestran tener consecuencias beneficiosas, y a abandonar aquellas conductas cuyas consecuencias resultan ser dañinas.
El condicionamiento clásico o pavloviano (CC) permite a un organismo aprender acerca de las señales que presagian eventos importantes: aspectos de su entorno que no le resultan controlables. El CI, por el contrario, permite a un organismo aprender a controlar ciertos aspectos del medio mediante su conducta.
El condicionamiento instrumental, por tanto, se diferencia del CC en un aspecto esencial: En el CI, la secuencia de sucesos depende de la conducta del organismo. En el CC, lo que sucede a lo largo de una sesión está prefijado por el psicólogo, en el caso de un experimento o una intervención profesional, o viene dado por el ambiente en las situaciones naturales. En todo caso, en el CC la secuencia de estímulos que el organismo recibe es la misma independientemente de lo que haga.
En sentido estricto, el C. Operante es un caso particular de C. Instrumental. El C. Instrumental, como ya hemos dicho, se refiere a los mecanismos por los cuales un organismo aprende a dar una respuesta más frecuentemente (o menos) en virtud de los eventos(o “consecuencias”) que siguen sistemáticamente a dicha respuesta. El C. Operante se refiere a los casos en los que dicha respuesta se define como un operante, es decir, en virtud de sus propiedades funcionales. Sin embargo, la importancia relativa del C.operante es tan grande que a menudo ambos términos (“operante” e “instrumental”) aparecen intercambiados.
2.1.1. El fenómeno/procedimiento básico
En una situación estimular dada ( antecedente ), una respuesta emitida por un organismo va seguida sistemáticamente por un cierto tipo de suceso ambiental ( consecuente o “consecuencia”). A medida que la situación se repite, la fuerza o la probabilidad de la respuesta se ve modificada.
[ (Antecedente) Respuesta Consecuente] Cambio en la fuerza de R.
Cuando la respuesta resulta aumentada o fortalecida, decimos que el consecuente es un refuerzo o reforzador. Cuando la respuesta resulta debilitada o reducida, llamamos al consecuente castigo.
En el caso más sencillo, se sitúa a un organismo en una determinada situación controlada (e.g., en una caja de Skinner y con cierto grado de privación previa de alimento), y se le suministra como consecuente (reforzador) una cierta cantidad de comida cada vez que emite una respuesta concreta y predeterminada por el psicólogo (apretar una palanca, picotear un disco, etc.). Se comprueba que la frecuencia de la respuesta elegida aumenta sistemáticamente a medida que transcurre el tiempo.
A la inversa, se puede diseñar una situación en la que la respuesta vaya seguida, por ejemplo, por una descarga eléctrica. En tal caso, la R tenderá a darse menos o a desaparecer.
2.1.2. Conceptos principales
2.1.2.1. Respuesta
2.1.2.2. Consecuente
ATENCION: no confundir positivo con bueno o beneficioso, ni negativo con malo o perjudicial. Positivo significa aquí “que se da o administra”, y negativo, “que se interrumpe, quita u omite”.
2.1.2.5. Estímulo discriminativo
2.1.2.6. Generalización
2.1.2.7. Discriminación
2.1.2.8. Moldeado o moldeamiento ( shaping )
2.1.2.9. Adquisición
2.1.2.10. Extinción
Se refiere también al decaimiento y eventual desaparición de la respuesta por razón de esa ruptura de la contingencia.
2.1.2.11. Mantenimiento
2.1.3. Tipos básicos de condicionamiento instrumental
Los cuatro tipos básicos de condicionamiento instrumental se producen como resultado del entrenamiento de un organismo mediante el establecimiento de una contingencia entre una R. y uno de los cuatro consecuentes básicos.
Ejemplo: cada vez que una rata presiona una palanca (R), se le administra como consecuente un trozo de comida; se puede observar que la rata cada vez presiona más frecuentemente la palanca
El tipo de CI que resulta de aplicar sistemáticamente reforzadores positivos a una conducta se conoce como entrenamiento de recompensa.
Ejemplo: cada vez que una rata se desplaza al lado opuesto de la jaula (R), como consecuente se interrumpe una descarga eléctrica que se le estaba aplicando; se puede observar que la rata cada vez cambia de lado más frecuentemente.
La aplicación sistemática de reforzadores negativos a una R se conoce como entrenamiento de evitación o entrenamiento de escape , dependiendo de si el organismo puede mediante la R llegar a “prevenir” la aparición del E. aversivo (evitación) o sólo puede interrumpirlo, acortando su duración, una vez administrado (escape)
La aplicación sistemática de castigos positivos a una R se conoce como entrenamiento de castigo.
fortalece, de forma que el organismo tendrá más tendencia a dar esa respuesta en esa situación. Si por el contrario va seguida de un suceso nocivo o desagradable, la respuesta tenderá a no darse.
Desde el punto de vista del conductismo watsoniano, enfoque dominante entre los años 20 y los 50 del siglo XX, la anterior formulación resultaba muy inadecuada, ya que se basa en estados internos del organismo ("satisfactorio", "desagradable", etc.) inobservables y por ello científicamente dudosos. Por otra parte, el intento de Thorndike de definir los “estados satisfactorios” como aquellos que el organismo no hacía nada por evitar, etc., incurría en circularidades que los críticos señalaron en repetidas ocasiones.
En los años 30-40, B. F. Skinner, sin duda el investigador más importante del conductismo y uno de los principales de toda la historia de la psicología, reformula la ley del efecto como "ley del refuerzo" adoptando un marco teórico más consistente y operativo:
Ciertos sucesos (refuerzos), cuando siguen consistentemente a una respuesta de un organismo, aumentan su probabilidad
Desentendiéndose de las interpretaciones asociacionistas, pone el énfasis en la relación estadística (contingencia) entre la respuesta y los eventos que la siguen consistentemente.
Una de las aportaciones teóricas más significativas de Skinner es la reconceptualización de la respuesta como operante , es decir, definida exclusivamente por sus propiedades funcionales (en contraposición a otros aspectos, como la topografía o la intensidad – ver Tema 1). Metodológicamente, se deben a él dispositivos como la caja de Skinner (o “cámara de operantes”), el registro acumulativo y muchos otros.
2.2. Condicionamiento clásico (CC)
2.2.0 Introducción
En el medio de los organismos hay muchos estímulos o sucesos cuyas probabilidades de aparición están relacionadas. Por ejemplo, muy a menudo el trueno va precedido del relámpago, las ventolinas suelen anteceder a las tormentas, el olor de un animal precede a su aparición, etc. De este modo, algunos estímulos constituyen “señales”, más o menos fiables, de otros sucesos.
En ciertos casos, además, el primer estímulo actúa como señal de otro estímulo o suceso que resulta muy importante para el organismo. Por ejemplo, un cierto ruido característico puede señalizar la inminente aparición de un depredador; otro sonido distinto puede indicar la posterior aparición de alimento (una presa), una pareja potencial, etc.
Evidentemente, es ventajoso para un organismo ser capaz de aprender a servirse de estas señales que le brinda su medio. El condicionamiento clásico o pavloviano es el mecanismo que nos permite captar estas regularidades.
El CC está presente en numerosísimas especies, incluida la nuestra. Es muy importante entender que no se debe confundir el CC con otras capacidades (intelectuales, etc.) que también nos permiten detectar regularidades de nuestro medio. El CC, al igual que el CI, no depende de ningun tipo de razonamiento o cálculo deliberado. Es un mecanismo que opera típicamente de forma inconsciente.
2.2.1. El fenómeno/procedimiento básico
Un organismo recibe repetidamente un estímulo neutro seguido de un estímulo biológicamente relevante (EI). Se constata que el organismo acaba dando al estímulo neutro una respuesta (RC) que previamente no era suscitada por éste. Por ello, el estímulo neutro inicial pasa a denominarse estímulo condicionado (EC)
[EC EI] ( repeticiones ) >> EC RC
2.2.2. Conceptos principales
2.2.2.1. Estímulo Neutro/Condicionado (EC) Estímulo originalmente neutro que se empareja temporalmente con el EI durante el condicionamiento. Es neutro en el sentido de que por sí mismo no suscita regularmente una R. específica, aunque puede producir alguna respuesta genérica (R. de orientación, parpadeos, etc.)
2.2.2.2. Estímulo Incondicionado (EI) Estímulo que suscita regularmente una R. no aprendida y medible en los miembros de una especie. Ejemplos: Comida, descarga eléctrica, zumo de limón en la lengua, soplo de aire en los ojos, etc.
2.2.2.3. Respuesta Incondicionada (RI) La R. no aprendida y medible suscitada por el EI de forma regular. Un EI puede suscitar más de una RI Ejemplos: salivación, flexión, reflejo pupilar, náuseas...
2.2.2.4. Respuesta Condicionada (RC) Respuesta que, una vez condicionado el organismo, resulta provocada por el EC. Frecuentemente (pero no siempre) es semejante a RI. En tales casos, la magnitud de RC es inferior a la de RI.
2.2.2.5. Contingencia Relación estadística entre el EC y el EI por la cual el primero es más o menos fiable como predictor del segundo. Significa, por tanto, lo mismo que en CI, sólo que aquí el vínculo no es entre una conducta y un consecuente, sino entre dos estímulos ambientales. En CC, las contingencias de más magnitud producen siempre mejor aprendizaje que las más bajas.
2.2.2.6. Adquisición
El EC y el EI comienzan exactamente a la vez. Lo más habitual es que también terminen al mismo tiempo, pero este no es un aspecto necesario ni especialmente relevante.
Desde los albores de la historia del pensamiento se ha pensado que las asociaciones se establecen tanto más fácilmente cuanto más próximos estén los elementos a asociar. La proximidad entre EC y EI es máxima en el condicionamiento simultáneo.
Sin embargo, los resultados de varias décadas de investigación indican sin lugar a dudas que este procedimiento no es ni mucho menos el más eficaz para provocar una RC. En numerosas condiciones, se ha observado que el procedimiento simultáneo es totalmente inefectivo. En el mejor de los casos, resulta muy inferior a otros.
2.2.3.3.2. Condicionamiento de demora breve
El EC comienza en primer lugar. Al cabo de un tiempo breve (menos de un minuto) comienza el EI. En ese momento, el EC puede o bien terminar o bien mantenerse por un breve tiempo.
El condicionamiento de demora breve es en muchos casos el más eficaz. Para una especie y un sistema de respuesta dados, existe un valor óptimo del intervalo entre EC y EI que da lugar a la máxima eficacia en la producción de RC. Valores inferiores o (sobre todo) superiores dan lugar a una pérdida de efectividad del procedimiento.
2.2.3.3.3. Condicionamiento de demora larga
Procedimiento idéntico al anterior, excepto en que la demora del EI respecto al EC es mayor:
En la mayoría de los casos, este procedimiento es poco efectivo , si bien con algunas excepciones.
Trabajando con este procedimiento, en el laboratorio de Pavlov se descubrió el fenómeno conocido como inhibición de demora. Consiste en que un organismo que ha pasado por una larga fase de adquisición con demoras prolongadas aprende a inhibir la respuesta hasta el final del intervalo de demora. Es decir, la RC no se dá inmediatamente al comenzar el EC, sino que el organismo, que ha aprendido que el EI tardará aún un tiempo en llegar, la “retiene” aproximadamente hasta que dicho tiempo está a punto de concluir y el EI resulta inminente.
2.2.3.3.4. Condicionamiento de huella
Se caracteriza porque hay un “intervalo vacío” entre el EC y el EI, conocido como intervalo de huella.
En 1913 realizó un experimento semejante a los de Pavlov, pero utilizando un estímulo aversivo para el organismo (una descarga eléctrica en una pata). Los resultados fueron análogos a los de Pavlov: el organismo aprendía a retirar (contraer) la pata ante la sola presencia del sonido.