Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


programas de refuerzo, Apuntes de Psicología del Aprendizaje

Asignatura: Psicologia del aprendizaje, Profesor: Jose antonio aprendizaje, Carrera: Psicología, Universidad: USAL

Tipo: Apuntes

2014/2015

Subido el 25/02/2015

arbolilla
arbolilla 🇪🇸

3.3

(12)

34 documentos

1 / 26

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
1
Programas de refuerzo y
conducta de elección
conducta
de
elección
Tema 6
José A. González del Campo
1
Universidad de Salamanca
Programas de refuerzo y conducta de
elección
Programas simples de refuerzo intermitente
Programas de razón: Número de respuestas
Programas de intervalo: Tiempo transcurrido
Programas de intervalo: Tiempo transcurrido
Comparación entre programas de razón e intervalo
Programas de refuerzo de tasas de respuesta
Conducta de elección: Programas concurrentes
Medida de conducta de elección
Ley de igualación
Mecanismos de la ley de igualación
Elección con com
p
romiso
2
p
Programas concurrentes encadenados
Estudio de “autocontrol”
Comentarios finales
Preguntas de prueba
Términos clave
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a

Vista previa parcial del texto

¡Descarga programas de refuerzo y más Apuntes en PDF de Psicología del Aprendizaje solo en Docsity!

Programas de refuerzo y

conducta de elecciónconducta de elección

Tema 6

José A. González del Campo

1

Universidad de Salamanca

Programas de refuerzo y conducta de

elección

  • Programas simples de refuerzo intermitente
    • Programas de razón: Número de respuestas
    • Programas de intervalo: Tiempo transcurridoProgramas de intervalo: Tiempo transcurrido
    • Comparación entre programas de razón e intervalo
    • Programas de refuerzo de tasas de respuesta
  • Conducta de elección: Programas concurrentes
    • Medida de conducta de elección
    • Ley de igualación
    • Mecanismos de la ley de igualación
  • Elección con compromiso

2

p

  • Programas concurrentes encadenados
  • Estudio de “autocontrol”
  • Comentarios finales
  • Preguntas de prueba
  • Términos clave

Programas de refuerzo

  • En muchas ocasiones de la vida diaria podemos comprobar que una respuesta raramente produce una consencuencia (reforzador) de un modo sistemático.
  • Programa de refuerzo: Es una regla que establece las condicionesPrograma de refuerzo: Es una regla que establece las condiciones (cómo y cuándo) en las que una respuesta irá seguido de un reforzador
  • Los programas determinan la forma en la que se aprende una respuesta y la forma en que se mantiene la respuesta aprendida
  • Criterios
    • Tiempo transcurrido desde el último reforzador (programas de intervalo)

3

  • Número de respuestas desde el último reforzador (programas de razón)
  • Presencia de un estímulo que permite discriminar el inicio de cada programa (programas concurrentes)

Programas complejos 1

  • Programas concurrentesProgramas concurrentes
    • Los programas concurrentes sirven para estudiar la conducta de elección simple entre dos programas activos simultáneamente que proporcionan el reforzador con probabilidades diferentes, o reforzadores de diferente magnitud o naturaleza o reforzadores de diferente magnitud y con diferentes demoras en la bt ió C d tili dif t it d

4

obtención. Cuando se utilizan diferentes magnitudes y diferentes intervalos de demora del reforzador se estudia la autocontrolada/impulsiva de elección.

Programas de razón

  • Un programa de razón proporciona el reforzador cuando el organismo ha emitido el número de respuestas exigidas en el criterio.
  • Programas de razón fija (RF 20; RF 50; RF 100):
    • Cuando el programa es fijo pero puede variar el criterio fijo dentro de una misma sesión aumentando a medida que transcurre la misma..
    • Si exige una respuesta se trata de un programa de refuerzo continuo.
    • En los programas de razón se observa una pausa post-refuerzo.

7

  • Si la razón se incrementa de con un número elevado de respuestas se produce una tensión de la razón , con pausas muy largas o ausencia total de la respuesta.
  • Después de la pausa se producen todas las respuestas, fenómeno denominado carrera de razón.

Programas de razón

  • Programas variables (RV 20; RV 50):
    • El número de respuestas exigido varía aleatoriamente dep g un refuerzo a otro, pero se describe con el valor promedio.
    • Se produce una tasa de respuestas alta pero regular
  • Diferencias entre los programas de RF y RV:
    • En ambos se produce una elevada tasa de respuestas; no obstante, en los de razón fija es irregular, mientras que los d ó i bl l

8

de razón variable es regular.

cumulativas

Razón fija^ Razón variable

Ti i (^) Ti i

Respuestas ac

9

Tiempo min (^) Tiempo min

Los programas de razón producen tasas altas de respuesta. Dentro de ellos los fijos producen pausas postrefuerzo, mientras que los variables no las producen. Curvas idealizadas.

Programas de intervalo

  • Un programa de intervalo proporciona el reforzador

cuando el organismo ha emitido una respuesta una vez

transc rrido el tiempo e igido en el criteriotranscurrido el tiempo exigido en el criterio.

  • Programas fijos (IF 30 s; IF 50s; IF 1):
    • Generan una pausa post-refuerzo, pero el incremento de las respuestas es gradual. L d j ió l i i i d l t

10

  • La curva de ejecución es suave en el inicio de las respuesta y acusada al final del intervalo, por lo que se denomina efecto festón.
  • Existen varios ejemplos de la vida diaria con claras similitudes como los exámenes, o el pago de impuestos, etc.

Diferencias los programas R e I

  • Los programas de razón producen tasas altas de

respuesta, mientras que los programas de intervalop , q p g

producen tasas bajas de respuesta.

  • ¿A qué se debe?
    • Los programas de razón refuerzan tiempos inter- respuesta cortos, mientras que los programas de inter- respuesta largos. El tiempo no puede modificarlo el sujeto.

13

j

  • En los programas de razón, cuanto mayor sea el número de respuestas en una unidad de tiempo más rápido obtiene el reforzador. Al mecanismo se denomina función de feedback.

umulativas

Tasa RV= 5 respuestas/s 500

700

600

800

Respuestas acu

Tasa IV= 1 respuesta/s

100

300 200

400

f d

14

1 min Tiempo

reforzador

Registro acumulativo del picoteo de una paloma ante un programa RV y otra acoplada a aquella en un programa IV. La tasa de reforzadores fue la misma para ambas, pero la paloma de RV respondió con una tasa cuatro veces mayor que la paloma de IV. (Reynolds, 1975).

R MIN

100

60

80  intervalo

razón

0 1 2 3 4 5

TIRONES POR

0

20

40 

15

Función de retroalimentación para un programa de razón con una probabilidad de un resultado de 0,05 y un programa de intervalo con una tasa de 3,4/min. El reforzador cuya función de retroalimentación se aproxima al origen depende del programa parti- cular de intervalo. Los puntos de los datos representan las tasas medias de la conducta de tirar de un cordón en ratas durante 5 sesiones (Dawson y Dickinson, 1990).

0 1 2 3 4 5 REFORZADORES POR MIN

Conducta de elección

  • La conducta estudiada mediante los programas simples proporciona información sobre la conducta en la que existe una clase de respuesta con un solo reforzadoruna clase de respuesta con un solo reforzador.
  • Lo que sucede normalmente es que los organismos manifiestan conductas variadas eligiendo entre las posibles alternativas.
  • En un principio la conducta de elección se estudiaba mediante el procedimiento de ensayos discretos (Laberinto en T), pero en la actualidad se usa el procedimiento de

16

operante libre (cámara operante con dos discos de respuesta o dos barras (manipulanda). El procedimiento consiste en un programa concurrente, que se compone de dos programas simples (IV 30s IV60)

Programa de refuerzo A Programa de refuerzo B

Dispositivo terminal

Dispositivo de

Tiempo

19

Diagrama de un programa concurrente encadenado. Al picar el disco A en el dispositivo de elección, se activa el programa A en el dispositivo terminal. Cuando pica sobre el disco B en el dispositivo de elección se activa el programa B en el dispositivo terminal.

Dispositivo de elección

Control del programa

Programa A o B

Di d t C d l l i b l di

20

Diagrama de un programa concurrente. Cuando la paloma pica sobre el disco de “control de programa” (disco de cambio) en un programa concurrente elige un cambio de programa. Después de un tiempo de demora pica en disco del lado derecho donde se ha activado el programa elegido. Este procedimiento es equivalente al procedimiento de elección en un laberinto en T. Cada vez que se coloca al animal en la caja de salida debe elegir un brazo, con una probabilidad de refuerzo diferente.

Comportamiento de elección

  • Conducta de elección: tasa relativa de respuestas.

La conducta depende del programa de refuerzo deLa conducta depende del programa de refuerzo, de

la clase de respuesta, del reforzador y de la especie

animal.

  • RA = Tasa de respuesta en el programa A
  • RB = Tasa de respuesta en el programa B

21

B p^ p^ g

 (^) A B

A

R +R

R Tasa relativa derespuesta en A =

Comportamiento de elección

  • Tasa relativa de refuerzo. Variable independiente

manipulada por el investigador.

  • r (^) A y r (^) B representan las tasas de refuerzo en el

programa A y B respectivamente.

22

( )

dereforzadoresenA

A B

A

r r

r Tasa relativa

RESPUESTAS

1

0 0 5 1

PROPORCIÓN DE R 0

0,

25

0 0,5 1 PROPORCIÓN DE REFORZADORES Frecuencia relativa de respuesta a una alternativa en un procedimiento de elección binaria en función de la frecuencia relativa de refuerzo. Programas independientes de refuerzo controlados desde cada disco. La diagonal expresa igualación entre las frecuencias relativas. Adaptado de “On the Law of Effect” de R. J. Herrnstein, 1970, J. of the Experimental Analysis of Behavior , 13 , p. 253.

RESPUESTAS

1 Y = 0,028 + 0,891x

0 0 5 1

PROPORCIÓN DE R 0

0,

26

0 0,5 1 PROPORCIÓN DE REFORZADORES

Frecuencia relativa de respuesta a una alternativa en una elección binaria en función de la frecuencia relativa de refuerzo. La línea discontinua expresa una igualación perfecta. La línea continua expresa la función mejor ajustada a los datos (S.M.). Adaptado de “Behavior of humanas in variable-interval schedules of reinforcement” de C: M. Bradshow, E. Szabadi y P. Bevan, 1976, J. of the Experimental Analysis of Behavior , 26 , p. 139.

RESPUESTAS

1 Y = 0,049 + 0,995x

0 0 5 1

PROPORCIÓN DE R 0

0,

27

0 0,5 1 PROPORCIÓN DE REFORZADORES Frecuencia relativa de respuesta a una alternativa en una elección binaria en función de la frecuencia relativa de refuerzo. La línea discontinua expresa una igualación perfecta. La línea continua expresa la función mejor ajustada a los datos (A.M.). Adaptado de “Behavior of humanas in variable-interval schedules of reinforcement” de C: M. Bradshow, E. Szabadi y P. Bevan, 1976, J. of the Experimental Analysis of Behavior , 26 , p. 139.

Infraigualación, supraigualación y sesgo de respuesta

La conducta de los organismos, en ocasiones, se aleja de la igualación, por lo que fue necesario adaptar la expresión matemática de la ley a

estas características de la conducta. Aunque sigue siendo la tasa relativa

R (^) A b

 rA 

 

S

de refuerzo la principal causa de la distribución de las respuestas, existe el sesgo de respuesta ( b ), en ocasiones, y en otras un problema

de sensibilidad ( s ) de la tasa de re forzadores. Los parámetros se obtienen después de haber finalizado el experimento.

b representa el sesgo de la respuesta cuyo

28

A

R (^) B

b

A

 rB

 

 b^ representa^ el sesgo de la respuesta cuyo efecto se traduce en diferente grado de preferencia cuando los reforzadores difieren en su naturaleza, magnitud o las respuestas son de diferente naturaleza o bien se trata de especies diferentes.

Igualación e infraigualación y sesgo

Rf/h A Rf/h B RfA/RfB Valor X log(RfA/RfB)

Pend. (s) Orden. log (b)

Valor Y

5 5 1 0,00 1 0,00 0,

30 5 6 0,78 1 0,00 0,

100 5 20 1,30 1 0,00 1,

600 5 120 2,08 1 0,00 2,

Infraigualación 5 5 1 0,00 0,5 0,00 0,

30 5 6 0,78 0,5 0,00 0, 100 5 20 1,30 0,5 0,00 0,

31

600 5 120 2,08 0,5 0,00 0,

Sesgo 5 5 1 0,00 1 1,50 1,

30 5 6 0,78 1 1,50 2, 100 5 20 1,30 1 1,50 2, 600 5 120 2,08 1 1,50 3,

Igualación

  • Si usamos la ecuación de la página 31 y aplicamos los datos de las tablas de la página 32 en su versión logarítmica podemos comprobar los valores de Ylogarítmica podemos comprobar los valores de Y. Debemenos tener en cuenta que los datos son ideales porque son ficticios. Los reales difícilmente producirían un

ajuste tan perfecto.

  • En la igualación, primera y cuarta filas, respectivamente, de datos obtenemos en Y los mismos valores de X.

2 , 08 0 1 * 2 , 08 32

0 0 1 * 0

log( / ) log [ *log( / )]

 

 

RA RBbs rA rB

Infraigualación

  • Utilizando la misma ecuación de la diapositiva 31 y aplicándola a los datos de la tabla de infraigualación de la 32 podemos comprobar que los resultados en Y son32 podemos comprobar que los resultados en Y son diferentes a los de igualación.
  • Si trabajamos con las filas primera y cuarta,

respectivamente, de datos que los resultados en Y disminuyen en relación con el valor de X.

33

0 , 14 0 0 , 5 * 2 , 08

0 0 0 , 5 * 0

log( / ) log [ *log( / )]

 

 

RA RBbs rA rB

Sesgo

  • Si realizamos la misma operación que en los ejemplos

anteriores pero con las filas primera y cuarta de la tabla de datos Sesgo observaremos que se produce un aumento endatos Sesgo observaremos que se produce un aumento en Y proporcional al valor de X. La comparación con igualación indica una curva paralela con un valor diferente en la ordenada en el origen.

34

3 , 58 1 , 50 1 * 2 , 08

1 , 50 1 , 50 1 * 0

log( / ) log [ *log( / )]

 

 

RA RBbs rA rB

Igualación y aquiescencia infantil

rM rPH

rM

 A.M.  A.P. H.

A. M.

  • A.M. = aquiescencia materna y A.P.H. = aquiescencia paterna y de los hermanos
  • rM = tasa de refuerzos matenernos y rPH = tasa de refuerzos paternos y de los hermanos.
  • Si la obtención de refuerzos maternos (valoración, aprobación, atención …) es inferior a la tasa de refuerzos paternos, el aumento de la tasa de aquiescencia materna deberá ir acompañado de la tasa de reforzadores maternos. No obstante, para que se cumpla la tasa de reforzadores paternos debe permanecer inalterada. De lo contrario no se producirá un aumento de la tasa de obediencia a la madre. 37

Ley de igualación en otras

situaciones

  • Ley de igualación en los programas simples deLey de igualación en los programas simples de

refuerzo: un organismo elige entre responder en el

programa y emitir otras respuestas. Recientemente se ha

cuestionado esta idea.

  • Ley de igualación en programas de refuerzo negativo.

Los animales eligen entre dos programas de refuerzo en

el que postponen descargas programadas Programas

38

el que postponen descargas programadas. Programas

concurrentes con el procedimiento de Sidman (1953a,

1953b). A pesar de no evitar todas las descargas los

animales ajustan sus respuestas de modo que reducen la

proporción de descargas.

Mecanismos de igualación

  • La ley de igualación describe la distribución de

respuestas de elección, pero no explica cómo se

produce la conducta de elección

  • Igualación y maximización de las tasas de refuerzo
    • Maximización molecular: explica la elección en función de las respuestas individuales
    • Maximización molar: explica la de elección basándose

39

p en conjuntos de respuestas (una sesión experimental

  • Mejoramiento: explica la elección en función de la

tasa local de respuesta, que se calcula en el

momento en el que el animal emite esa respuesta

en concreto.

Maximización molecular

  • Los organismos eligen siempre el programa con mayor probabilidad de proporcionar el reforzador (Hinson y Staddon, 1983).
  • • Programa A (IV 1) Programa B (IV 2) Cuando una paloma picaPrograma A (IV 1) -Programa B (IV 2). Cuando una paloma pica sobre el programa del disco A durante un tiempo determinado, el reloj del programa del disco B sigue contando el tiempo; por tanto, ha aumentado la probabilidad del reforzador en dicho programa. Si cambia al programa B puede obtener el reforzador. Cuanto más tiempo pique sobre el programa B mayor es la probabilidad del obtener el reforzador en el programa A (Shimp,

40

  • El análisis sistemático del patrón de cambio de programa es diferente de propuesto por Shimp. Al mismo tiempo se ha comprobado que puede haber igualación sin que exista maximización momentánea (Williams, 1991).