Prepara tus exámenes
Consigue puntos
Orientación Universidad
Vende en Docsity
Docsity AI

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Orientación Universidad

Vende en Docsity

Docsity AI

Inicia sesión Regístrate

Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity

Busca documentos

Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity

Busca tu universidad

Encuentra los documentos específicos para los exámenes de tu universidad

Video Cursos

Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades

Quiz

Responde a preguntas de exámenes reales y pon a prueba tu preparación

Docsity AINEW

Resume tus documentos, hazles preguntas, conviértelos en quiz y mapas conceptuales

Ver preguntas

Despeja tus dudas leyendo las respuestas a las preguntas que realizaron otros estudiantes como tú

Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium

Compartir documentos

20 Puntos

Por cada documento subido

Responde a las preguntas

5 Puntos

por cada respuesta dada (máx. 1 al día)

Todos los modos para conseguir puntos gratis

Consigue puntos de inmediato

Elige un plan Premium con todos los puntos que necesitas.

Oportunidades de estudio

Elige tu próximo programa de estudio

Ponte en contacto inmediatamente con las mejores universidades del mundo. Busca entre miles de universidades en todo el mundo. Busca entre miles de universidades partner oficiales

Comunidad

Pregúntale a la comunidad

Pide ayuda a la comunidad y resuelve tus dudas de estudio

Ebooks gratuitos

¡Nuestros e-books salva-estudiantes!

Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity

programas de refuerzo, Apuntes de Psicología del Aprendizaje

Universidad de Salamanca (USAL)Psicología del Aprendizaje

Prof. José Antonio

Asignatura: Psicologia del aprendizaje, Profesor: Jose antonio aprendizaje, Carrera: Psicología, Universidad: USAL

Tipo: Apuntes

2014/2015

Subido el 25/02/2015

arbolilla 🇪🇸

3.3

(12)

34 documentos

1 / 26

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

Programas de refuerzo y

conducta de elección

conducta

elección

Tema 6

José A. González del Campo

Universidad de Salamanca

Programas de refuerzo y conducta de

elección

• Programas simples de refuerzo intermitente

– Programas de razón: Número de respuestas

–

Programas de intervalo: Tiempo transcurrido

– Comparación entre programas de razón e intervalo

– Programas de refuerzo de tasas de respuesta

• Conducta de elección: Programas concurrentes

– Medida de conducta de elección

– Ley de igualación

– Mecanismos de la ley de igualación

• Elección con com

romiso

– Programas concurrentes encadenados

– Estudio de “autocontrol”

• Comentarios finales

• Preguntas de prueba

• Términos clave

Descubre Apuntes de Psicología del Aprendizaje Universidad de Salamanca (USAL)

Documentos relacionados

Tema 6 Programas de refuerzo y conductas de elección

(2)

Programas de Refuerzo: Comparación IF y RF

(11)

Diferencias entre el aprendizaje con programas de refuerzo fijo y variable - Prof. José An

(15)

Programas de refuerzo aprendizaje

Programas en delincuencia

horarios programas

Práctica 6: El Condicionamiento Operante. Programas de Refuerzo

Refuerzo: mecanismos motivacionalesmotivacionalesTema 7 José Antonio González

examen

(11)

Practica: Efectos del castigo

(9)

Diapositivas tema 4

Experimento 3 Aprendizaje

(3)

Vista previa parcial del texto

¡Descarga programas de refuerzo y más Apuntes en PDF de Psicología del Aprendizaje solo en Docsity!

Programas de refuerzo y

conducta de elecciónconducta de elección

Tema 6

José A. González del Campo

Universidad de Salamanca

Programas de refuerzo y conducta de

elección

Programas simples de refuerzo intermitente
- Programas de razón: Número de respuestas
- Programas de intervalo: Tiempo transcurridoProgramas de intervalo: Tiempo transcurrido
- Comparación entre programas de razón e intervalo
- Programas de refuerzo de tasas de respuesta
Conducta de elección: Programas concurrentes
- Medida de conducta de elección
- Ley de igualación
- Mecanismos de la ley de igualación
Elección con compromiso

Programas concurrentes encadenados
Estudio de “autocontrol”
Comentarios finales
Preguntas de prueba
Términos clave

Programas de refuerzo

En muchas ocasiones de la vida diaria podemos comprobar que una respuesta raramente produce una consencuencia (reforzador) de un modo sistemático.
Programa de refuerzo: Es una regla que establece las condicionesPrograma de refuerzo: Es una regla que establece las condiciones (cómo y cuándo) en las que una respuesta irá seguido de un reforzador
Los programas determinan la forma en la que se aprende una respuesta y la forma en que se mantiene la respuesta aprendida
Criterios
- Tiempo transcurrido desde el último reforzador (programas de intervalo)

Número de respuestas desde el último reforzador (programas de razón)
Presencia de un estímulo que permite discriminar el inicio de cada programa (programas concurrentes)

Programas complejos 1

Programas concurrentesProgramas concurrentes
- Los programas concurrentes sirven para estudiar la conducta de elección simple entre dos programas activos simultáneamente que proporcionan el reforzador con probabilidades diferentes, o reforzadores de diferente magnitud o naturaleza o reforzadores de diferente magnitud y con diferentes demoras en la bt ió C d tili dif t it d

obtención. Cuando se utilizan diferentes magnitudes y diferentes intervalos de demora del reforzador se estudia la autocontrolada/impulsiva de elección.

Programas de razón

Un programa de razón proporciona el reforzador cuando el organismo ha emitido el número de respuestas exigidas en el criterio.
Programas de razón fija (RF 20; RF 50; RF 100):
- Cuando el programa es fijo pero puede variar el criterio fijo dentro de una misma sesión aumentando a medida que transcurre la misma..
- Si exige una respuesta se trata de un programa de refuerzo continuo.
- En los programas de razón se observa una pausa post-refuerzo.

Si la razón se incrementa de con un número elevado de respuestas se produce una tensión de la razón , con pausas muy largas o ausencia total de la respuesta.
Después de la pausa se producen todas las respuestas, fenómeno denominado carrera de razón.

Programas de razón

Programas variables (RV 20; RV 50):
- El número de respuestas exigido varía aleatoriamente dep g un refuerzo a otro, pero se describe con el valor promedio.
- Se produce una tasa de respuestas alta pero regular
Diferencias entre los programas de RF y RV:
- En ambos se produce una elevada tasa de respuestas; no obstante, en los de razón fija es irregular, mientras que los d ó i bl l

de razón variable es regular.

cumulativas

Razón fija^ Razón variable

Ti i (^) Ti i

Respuestas ac

Tiempo min (^) Tiempo min

Los programas de razón producen tasas altas de respuesta. Dentro de ellos los fijos producen pausas postrefuerzo, mientras que los variables no las producen. Curvas idealizadas.

Programas de intervalo

Un programa de intervalo proporciona el reforzador

cuando el organismo ha emitido una respuesta una vez

transc rrido el tiempo e igido en el criteriotranscurrido el tiempo exigido en el criterio.

Programas fijos (IF 30 s; IF 50s; IF 1):
- Generan una pausa post-refuerzo, pero el incremento de las respuestas es gradual. L d j ió l i i i d l t

La curva de ejecución es suave en el inicio de las respuesta y acusada al final del intervalo, por lo que se denomina efecto festón.
Existen varios ejemplos de la vida diaria con claras similitudes como los exámenes, o el pago de impuestos, etc.

Diferencias los programas R e I

Los programas de razón producen tasas altas de

respuesta, mientras que los programas de intervalop , q p g

producen tasas bajas de respuesta.

¿A qué se debe?
- Los programas de razón refuerzan tiempos inter- respuesta cortos, mientras que los programas de inter- respuesta largos. El tiempo no puede modificarlo el sujeto.

En los programas de razón, cuanto mayor sea el número de respuestas en una unidad de tiempo más rápido obtiene el reforzador. Al mecanismo se denomina función de feedback.

umulativas

Tasa RV= 5 respuestas/s 500

700

600

800

Respuestas acu

Tasa IV= 1 respuesta/s

100

300 200

400

f d

1 min Tiempo

reforzador

Registro acumulativo del picoteo de una paloma ante un programa RV y otra acoplada a aquella en un programa IV. La tasa de reforzadores fue la misma para ambas, pero la paloma de RV respondió con una tasa cuatro veces mayor que la paloma de IV. (Reynolds, 1975).

R MIN

100

80 intervalo

razón

0 1 2 3 4 5

TIRONES POR

Función de retroalimentación para un programa de razón con una probabilidad de un resultado de 0,05 y un programa de intervalo con una tasa de 3,4/min. El reforzador cuya función de retroalimentación se aproxima al origen depende del programa parti- cular de intervalo. Los puntos de los datos representan las tasas medias de la conducta de tirar de un cordón en ratas durante 5 sesiones (Dawson y Dickinson, 1990).

0 1 2 3 4 5 REFORZADORES POR MIN

Conducta de elección

La conducta estudiada mediante los programas simples proporciona información sobre la conducta en la que existe una clase de respuesta con un solo reforzadoruna clase de respuesta con un solo reforzador.
Lo que sucede normalmente es que los organismos manifiestan conductas variadas eligiendo entre las posibles alternativas.
En un principio la conducta de elección se estudiaba mediante el procedimiento de ensayos discretos (Laberinto en T), pero en la actualidad se usa el procedimiento de

operante libre (cámara operante con dos discos de respuesta o dos barras (manipulanda). El procedimiento consiste en un programa concurrente, que se compone de dos programas simples (IV 30s IV60)

Programa de refuerzo A Programa de refuerzo B

Dispositivo terminal

Dispositivo de

Tiempo

Diagrama de un programa concurrente encadenado. Al picar el disco A en el dispositivo de elección, se activa el programa A en el dispositivo terminal. Cuando pica sobre el disco B en el dispositivo de elección se activa el programa B en el dispositivo terminal.

Dispositivo de elección

Control del programa

Programa A o B

Di d t C d l l i b l di

Diagrama de un programa concurrente. Cuando la paloma pica sobre el disco de “control de programa” (disco de cambio) en un programa concurrente elige un cambio de programa. Después de un tiempo de demora pica en disco del lado derecho donde se ha activado el programa elegido. Este procedimiento es equivalente al procedimiento de elección en un laberinto en T. Cada vez que se coloca al animal en la caja de salida debe elegir un brazo, con una probabilidad de refuerzo diferente.

Comportamiento de elección

Conducta de elección: tasa relativa de respuestas.

La conducta depende del programa de refuerzo deLa conducta depende del programa de refuerzo, de

la clase de respuesta, del reforzador y de la especie

animal.

RA = Tasa de respuesta en el programa A
RB = Tasa de respuesta en el programa B

B p^ p^ g

 (^) A B

R +R

R Tasa relativa derespuesta en A =

Comportamiento de elección

Tasa relativa de refuerzo. Variable independiente

manipulada por el investigador.

r (^) A y r (^) B representan las tasas de refuerzo en el

programa A y B respectivamente.

( )

dereforzadoresenA

A B

r r

r Tasa relativa





RESPUESTAS

0 0 5 1

PROPORCIÓN DE R 0

0 0,5 1 PROPORCIÓN DE REFORZADORES Frecuencia relativa de respuesta a una alternativa en un procedimiento de elección binaria en función de la frecuencia relativa de refuerzo. Programas independientes de refuerzo controlados desde cada disco. La diagonal expresa igualación entre las frecuencias relativas. Adaptado de “On the Law of Effect” de R. J. Herrnstein, 1970, J. of the Experimental Analysis of Behavior , 13 , p. 253.

RESPUESTAS

1 Y = 0,028 + 0,891x

0 0 5 1

PROPORCIÓN DE R 0

0 0,5 1 PROPORCIÓN DE REFORZADORES

Frecuencia relativa de respuesta a una alternativa en una elección binaria en función de la frecuencia relativa de refuerzo. La línea discontinua expresa una igualación perfecta. La línea continua expresa la función mejor ajustada a los datos (S.M.). Adaptado de “Behavior of humanas in variable-interval schedules of reinforcement” de C: M. Bradshow, E. Szabadi y P. Bevan, 1976, J. of the Experimental Analysis of Behavior , 26 , p. 139.

RESPUESTAS

1 Y = 0,049 + 0,995x

0 0 5 1

PROPORCIÓN DE R 0

0 0,5 1 PROPORCIÓN DE REFORZADORES Frecuencia relativa de respuesta a una alternativa en una elección binaria en función de la frecuencia relativa de refuerzo. La línea discontinua expresa una igualación perfecta. La línea continua expresa la función mejor ajustada a los datos (A.M.). Adaptado de “Behavior of humanas in variable-interval schedules of reinforcement” de C: M. Bradshow, E. Szabadi y P. Bevan, 1976, J. of the Experimental Analysis of Behavior , 26 , p. 139.

Infraigualación, supraigualación y sesgo de respuesta

La conducta de los organismos, en ocasiones, se aleja de la igualación, por lo que fue necesario adaptar la expresión matemática de la ley a

estas características de la conducta. Aunque sigue siendo la tasa relativa

R (^) A b

 rA 

 

de refuerzo la principal causa de la distribución de las respuestas, existe el sesgo de respuesta ( b ), en ocasiones, y en otras un problema

de sensibilidad ( s ) de la tasa de re forzadores. Los parámetros se obtienen después de haber finalizado el experimento.

b representa el sesgo de la respuesta cuyo

R (^) B

 b

 rB

 

 b^ representa^ el sesgo de la respuesta cuyo efecto se traduce en diferente grado de preferencia cuando los reforzadores difieren en su naturaleza, magnitud o las respuestas son de diferente naturaleza o bien se trata de especies diferentes.

Igualación e infraigualación y sesgo

Rf/h A Rf/h B RfA/RfB Valor X log(RfA/RfB)

Pend. (s) Orden. log (b)

Valor Y

5 5 1 0,00 1 0,00 0,

30 5 6 0,78 1 0,00 0,

100 5 20 1,30 1 0,00 1,

600 5 120 2,08 1 0,00 2,

Infraigualación 5 5 1 0,00 0,5 0,00 0,

30 5 6 0,78 0,5 0,00 0, 100 5 20 1,30 0,5 0,00 0,

600 5 120 2,08 0,5 0,00 0,

Sesgo 5 5 1 0,00 1 1,50 1,

30 5 6 0,78 1 1,50 2, 100 5 20 1,30 1 1,50 2, 600 5 120 2,08 1 1,50 3,

Igualación

Si usamos la ecuación de la página 31 y aplicamos los datos de las tablas de la página 32 en su versión logarítmica podemos comprobar los valores de Ylogarítmica podemos comprobar los valores de Y. Debemenos tener en cuenta que los datos son ideales porque son ficticios. Los reales difícilmente producirían un

ajuste tan perfecto.

En la igualación, primera y cuarta filas, respectivamente, de datos obtenemos en Y los mismos valores de X.

2 , 08 0 1 * 2 , 08 32

0 0 1 * 0

log( / ) log [ *log( / )]

 

RA RB  b  s rA rB

Infraigualación

Utilizando la misma ecuación de la diapositiva 31 y aplicándola a los datos de la tabla de infraigualación de la 32 podemos comprobar que los resultados en Y son32 podemos comprobar que los resultados en Y son diferentes a los de igualación.
Si trabajamos con las filas primera y cuarta,

respectivamente, de datos que los resultados en Y disminuyen en relación con el valor de X.

0 , 14 0 0 , 5 * 2 , 08

0 0 0 , 5 * 0

log( / ) log [ *log( / )]

 

RA RB  b  s rA rB

Sesgo

Si realizamos la misma operación que en los ejemplos

anteriores pero con las filas primera y cuarta de la tabla de datos Sesgo observaremos que se produce un aumento endatos Sesgo observaremos que se produce un aumento en Y proporcional al valor de X. La comparación con igualación indica una curva paralela con un valor diferente en la ordenada en el origen.

3 , 58 1 , 50 1 * 2 , 08

1 , 50 1 , 50 1 * 0

log( / ) log [ *log( / )]

 

RA RB  b  s rA rB

Igualación y aquiescencia infantil

rM rPH

rM 

 A.M.  A.P. H.

A. M.

A.M. = aquiescencia materna y A.P.H. = aquiescencia paterna y de los hermanos
rM = tasa de refuerzos matenernos y rPH = tasa de refuerzos paternos y de los hermanos.
Si la obtención de refuerzos maternos (valoración, aprobación, atención …) es inferior a la tasa de refuerzos paternos, el aumento de la tasa de aquiescencia materna deberá ir acompañado de la tasa de reforzadores maternos. No obstante, para que se cumpla la tasa de reforzadores paternos debe permanecer inalterada. De lo contrario no se producirá un aumento de la tasa de obediencia a la madre. 37

Ley de igualación en otras

situaciones

Ley de igualación en los programas simples deLey de igualación en los programas simples de

refuerzo: un organismo elige entre responder en el

programa y emitir otras respuestas. Recientemente se ha

cuestionado esta idea.

Ley de igualación en programas de refuerzo negativo.

Los animales eligen entre dos programas de refuerzo en

el que postponen descargas programadas Programas

el que postponen descargas programadas. Programas

concurrentes con el procedimiento de Sidman (1953a,

1953b). A pesar de no evitar todas las descargas los

animales ajustan sus respuestas de modo que reducen la

proporción de descargas.

Mecanismos de igualación

La ley de igualación describe la distribución de

respuestas de elección, pero no explica cómo se

produce la conducta de elección

Igualación y maximización de las tasas de refuerzo
- Maximización molecular: explica la elección en función de las respuestas individuales
- Maximización molar: explica la de elección basándose

p en conjuntos de respuestas (una sesión experimental

Mejoramiento: explica la elección en función de la

tasa local de respuesta, que se calcula en el

momento en el que el animal emite esa respuesta

en concreto.

Maximización molecular

Los organismos eligen siempre el programa con mayor probabilidad de proporcionar el reforzador (Hinson y Staddon, 1983).
• Programa A (IV 1) Programa B (IV 2) Cuando una paloma picaPrograma A (IV 1) -Programa B (IV 2). Cuando una paloma pica sobre el programa del disco A durante un tiempo determinado, el reloj del programa del disco B sigue contando el tiempo; por tanto, ha aumentado la probabilidad del reforzador en dicho programa. Si cambia al programa B puede obtener el reforzador. Cuanto más tiempo pique sobre el programa B mayor es la probabilidad del obtener el reforzador en el programa A (Shimp,

El análisis sistemático del patrón de cambio de programa es diferente de propuesto por Shimp. Al mismo tiempo se ha comprobado que puede haber igualación sin que exista maximización momentánea (Williams, 1991).