






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Condicionamiento operante con la Ley del efecto de Thorndike, los diferentes métodos para la medición de la respuesta, los tipos de condicionamiento con sus respectivos programas de reforzamiento y los factores que afectan a la eficacia de dichos programas. Por último se trata la extinción y sus factores
Tipo: Apuntes
1 / 10
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







El condicionamiento pavloviano nos sirve para predecir aquello que va a ocurrir. No sirve para cambiar la probabilidad de lo que va a ocurrir.
El condicionamiento operante también llamado condicionamiento instrumental sirve para aprender a cambiar la probabilidad de lo que va a ocurrir en el futuro, es decir, la probabilidad de la aparición del EI.
La investigación sobre el condicionamiento operante comenzó con los experimentos realizados por el profesor Edward Thorndike, quien desarrolló un programa de investigación pensado para superar las limitaciones de la psicología comparada del momento. Thorndike realizó los primeros experimentos controlados sobre condicionamiento operante, estos son los experimentos de las cajas problema.
Thorndike propuso que una manera objetiva de medir la inteligencia de los sujetos era medir la latencia de la respuesta de escape, es decir, el tiempo que tardaba el sujeto en escapar de la caja. A menor tiempo empleado en escapar significaría que el sujeto es más inteligente. El tiempo sería el índice de medición del aprendizaje.
En el caso del aprendizaje operante hay que distinguir dos tipologías de respuesta:
Este condicionamiento no sirve para preparase sino para obtener una recompensa.
A partir de los experimentos de Thorndike propuso como ley fundamental del aprendizaje operante la Ley del Efecto. La ley del efecto dice que si a un sujeto se le presenta un estímulo y el sujeto da una respuesta ante ese estímulo, esa respuesta puede ir seguida de consecuencias agradables o desagradables.
Agradable
E → R → C
Desagradable
Si la consecuencia de la respuesta es agradable la asociación entre el estímulo y la respuesta se refuerza.
Gato en caja, si tira de la palanca sale, se fortifica la asociación entre tirar de la palanca y salir.
Por el contrario si la consecuencia de la respuesta es desagradable, la asociación entre el estímulo y la respuesta se debilita.
Actualmente la medición de la respuesta no se realiza únicamente por la latencia, también se mide la probabilidad, la magnitud. Existen dos métodos fundamentales de medición:
Psicología del aprendizaje. T6 Blanca Mora Braceros
El objetivo es evaluar si el sujeto ha aprendido a dar la respuesta correcta. El sujeto debe dar una respuesta y el ensayo finaliza cuando esta respuesta se da. Se mide a través de los laberintos de Thorndike.
2.2 Método operante libre. Su objetivo es medir la evolución del aprendizaje mediante la tasa de respuesta. Se mide con la caja de Skinner, donde la respuesta que debe dar el sujeto es apretar la palanca para obtener comida.
diferencia entre los laberintos de Thorndike y la caja de Skinner
El primer problema que se plantea en el condicionamiento operante es que damos por hecho que el sujeto va a dar la respuesta buscada, por ejemplo, en la caja de Skinner damos por sentado que la rata apretará la palanca para obtener comida pero, ¿Cómo se consigue que apriete la palanca? Para ello utilizamos el procedimiento del Moldeamiento, también llamado método de las aproximaciones positivas.
3 Moldeamiento El moldeamiento o el método de aproximaciones sucesivas consiste en el establecimiento de una escala de aproximaciones sucesivas a través de refuerzos para llegar a la conducta deseada. Se refuerza las conductas que poco a poco se vayan pareciendo a la conducta deseada.
En el caso de la caja de Skinner:
Psicología del aprendizaje. T6 Blanca Mora Braceros
Entra en el parcial I hasta aquí.
Los programas de refuerzo son las reglas que voy a imponer para determinar cuando la respuesta va a ir seguida del reforzador, o cuando va a desaparecer (en caso de correlación negativa). Normas que pongo para que determinadas respuestas vayan seguidas de un refuerzo.
Ejemplo: Cada 5 respuestas aparece un reforzador.
Los programas de refuerzo son fundamentalmente 4 que resultan de la combinación de los siguientes elementos:
Por lo tanto los cuatro tipos de programas son:
6.1.1 Programa de razón fija El reforzador se obtendrá si el sujeto cumple con un número de respuestas fijo. El patrón conductual de estos programas sería que el sujeto presenta una alta tasa de respuestas y de forma constante ya que cuanto más responda más reforzadores tendrá. Ocurre un fenómeno
llamado p ausas posreforzamiento , sobre todo en programas de razón fija muy exigentes. Las pausas posreforzamiento es la tasa cero de respuestas que ocurre justo después de cada reforzamiento. Esto ocurre porque el sujeto se prepara para una nueva serie de repuestas (carrera de la razón). A mayores requisitos de razón más largas las pausas posreforzamiento.
6.1.2 Programa de razón variable El número de respuestas para obtener el reforzador varía, aunque siempre dentro de un determinado promedio.
El sujeto responde mucho y de forma constante ya que no sabe de forma exacta el número de respuestas que debe emitir para la obtención del reforzador. Como no es posible predecir el número de respuestas requeridas por cada reforzamiento, las pausas en la tasa de respuestas son mucho menos probables que en los de razón fija.
Diferencia razón fija y razón variable: RF patrón de respuesta pausa-carrera. RV patrón estable.
La cantidad de tiempo que tiene que pasar antes que una respuesta sea reforzada se mantiene constante de un ensayo a otro. El sujeto SI RESPONDE es recompensado después del intervalo de tiempo.
En este programa se da un efecto llamado Scallop effect, efecto festoneado o festón del intervalo fijo, Es un patrón de respuestas en el que cuando se acerca el momento del refuerzo el sujeto da más respuestas y tras el reforzador disminuye las respuestas.
Como nunca se refuerza al inicio del intervalo los sujetos aprenden a esperar y responder únicamente cundo se acerca el reforzador.
El refuerzo está disponible después de un tiempo que varía aleatoriamente, pero alrededor de un promedio. Al igual que en los de intervalo fijo el sujeto tiene que realizar la respuesta para obtener el reforzador.
El intervalo es una media para la recompensa
¿Por qué no se produce el efecto festoneado? Porque el sujeto no sabe cuándo se acerca el momento en el que puede ser reforzado.
Por lo tanto el patrón de repuesta es constante y no muy elevado ya que el sujeto responde de forma continua pues no sabe cuándo se le va a reforzar y no muchas veces puesto que no aumentan los refuerzos por responder mucho.
Cada uno de los tipos de programa produce una respuesta diferente.
Además de estos 4 programas fundamentales existen otros programas llamados programa de refuerzo diferencial de tasas.
6.1.5 Programas de refuerzo diferencial de tasas Son programas de reforzamiento en los que al sujeto se le va a pedir un determinado número de respuestas dentro de un intervalo específico de tiempo para obtener el reforzador. Hay dos tipos:
II. Marcado: Hacer que cuando el sujeto da la respuesta, esa respuesta para el sujeto le resulte llamativa, de forma que preste atención a lo que acaba de hacer. Esto supone que cuando el sujeto realiza la asociación entre la Respuesta y el reforzador el estímulo sorprendente hará más fácil su asociación. Se llama así puesto que se marca cual es la conducta importante.
Como principio fundamental, a mayor recompensa el aprendizaje resulta más rápido y eficaz.
Crespi descubrió el efecto de contraste, que supone que la magnitud física de una recompensa no es lo mismo que la magnitud psicológica de esa recompensa.
La cantidad de la recompensa no depende solamente de la cantidad física de recompensa sino también de cómo percibe el sujeto esa recompensa.
El experimento de Crespi y el efecto de contraste:
Tenemos 4 grupos de ratas a las que entrenamos simplemente para correr por un corredor recto para obtener comida.
Fase1:
Fase 2 (fase de contraste):
Si el comportamiento de los sujetos se ajustara psicológicamente a la cantidad física de recompensa que recibe, los sujetos que pasan de la cantidad grande a la cantidad pequeña deberían ver reducido su rendimiento hasta el nivel del grupo con recompensa pequeña. E igualmente pero a la inversa con los del grupo que recibe una cantidad pequeña de recompensa.
No obstante, Crespi descubrió que los sujeto que recibían una recompensa pequeña y pasaban a la recompensa grande superaban el rendimiento de los sujetos que siempre recibían una recompensa grande y a la inversa los sujetos que recibían una recompensa grande y pasan a recibir una pequeña presentan una caída de rendimiento por debajo de los sujetos que siempre habían recibido una recompensa pequeña.
Efecto de contraste/Crespi : Diferencia entre el nivel que alcanza el sujeto cuando se le cambia y el nivel que tenían los sujetos que siempre han recibido esa recompensa.
RefER
Esto demuestra que la percepción de la magnitud de la recompensa no depende únicamente de la cantidad sino también de la experiencia previa.
Poco a poco el efecto de contraste se iguala con el grupo de control, por lo que el efecto de contraste es transitorio.
El efecto de contraste negativo siempre suele ser más fuerte que el efecto de contraste positivo.
Eliminación o supresión de una respuesta causada por la no aparición del refuerzo.
El procedimiento para extinguir la respuesta operante es que ante la respuesta no se le presenta recompensa.
Hay factores en el modo en el que adquirimos la respuesta operante que modifican la facilidad o dificultad para extinguir la respuesta. La extinción depende del modo en el que experimentamos la adquisición.
EFECTOS
Rata que recorre un corredor 500 veces y siempre recibe recompensa.
El sujeto que ha practicado mucho más que el otro pierde la respuesta más rápidamente que el otro
Consecuencia Apetitiva Aversiva C or rel ac ió n
Recompensa :
Correlación positiva entre la respuesta y el estímulo y la consecuencia es agradable. Aumenta la probabilidad de la respuesta
Castigo :
Correlación positiva entre la respuesta y el estímulo y la consecuencia es aversiva, desagradable. Disminuye la probabilidad de la respuesta.
Omisión
Correlación negativa entre la aparición del estímulo y la respuesta y la consecuencia es positiva. Disminuye la probabilidad de la respuesta.
Escape / Evitación
Correlación negativa entre la aparición del estímulo y la respuesta y la consecuencia es negativa. Aumenta la probabilidad de la respuesta.
El último tipo de condicionamiento recibe el nombre de escape evitación porque se agrupan dos tipos de aprendizaje distintos en esta categoría. La diferencia básica es:
♦ En el escape doy una respuesta para que desaparezca un estímulo desagradable. La rata salta al otro lado de la caja para que no le den el shock.
♦ En la evitación doy una respuesta para que no aparezca el estímulo desagradable. Es un proceso más complejo que el del mero escape. La rata aprende que cuando se enciende una luz roja y aprieta la palanca no recibe el shock. Si no aprieta la palanca sí hay shock.
Ejemplos:
Ante un estímulo aversivo reaccionamos o evitando o escpaando.