Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


Programas de Reforzamiento y Conducta de Elección: Tipos y Ejemplos - Prof. 90, Apuntes de Psicología

Los diferentes tipos de programas de reforzamiento y cómo influyen en la conducta de elección. Se abordan temas como programas de razón fija, variable, pausas posreforzamiento, intervalos interrespuesta y diferencial de tasas. Se incluyen ejemplos y experimentos para ilustrar los conceptos.

Tipo: Apuntes

Antes del 2010

Subido el 22/09/2010

ananakm
ananakm 🇪🇸

5

(3)

7 documentos

1 / 6

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
TEMA 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN.
Programa de reforzamiento: programa o regla que determina la forma en que se
relacionan las presentaciones del reforzador con las ocurrencias de la respuesta
instrumental. Determinan la tasa y el patrón de las respuestas instrumentales,
cómo y cuándo la ocurrencia de una respuesta va seguida de un reforzador.
Si incluyen relaciones similares entre E, R y reforzadores suelen producir patrones
similares de conducta.
Se investigan en cajas de Skinner: más información sobre los factores que controlan
el mantenimiento y realización de la conducta más que su adquisición.
Sirven como línea de base útil para el estudio de otros procesos conductuales:
drogas, cambios en la motivación… según Séller, los programas de reforzamiento
son el gigante durmiente del análisis de la conducta.
1. PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE.
En los programas “simples”, un solo factor determina qué ocurrencia de la
respuesta instrumental se refuerza.
1.1.. PROGRAMAS DE RAZÓN.
El reforzamiento depende sólo del número de respuestas.
Reforzamiento continuo (RFC): si el número requerido es uno, cada ocurrencia
de la R provoca la entrega del reforzador. Poco frecuente.
Reforzamiento parcial o intermitente: situaciones en las que la R se refuerza
sólo alguna vez.
a) Razón ja.
Programa de razón ja (RF): Hay razón ja entre el número de R realizadas y el
número de reforzadores conseguidos. Se da una tasa de R constante y alta una vez
que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar
el número requerido de respuestas.
El reforzamiento continuo es un programa de RF. En él los organismos suelen
responder a una tasa constante pero moderada, dándose pausas breves e
impredecibles.
Registro acumulativo: representación de la forma de repetirse una R a lo largo
del tiempo. Muestra el número total de respuestas que han ocurrido hasta un
momento determinado.
Pausa posreforzamiento: tasa cero de R tras un reforzamiento. Su longitud
depende del requerimiento de la razón subsiguiente (podría ser pausa pre-razón).
Carrera de razón: tasa de respuesta alta y estable que completa cada
requerimiento.
Tensión de la razón: si el requerimiento de la razón se incrementa un poco, la
tasa de R puede permanecer igual durante la carrera de la razón. Con mayores
requerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si es
muy grande, el animal deja de responder (no se debe aumentar la dicultad
demasiado rápido).
b) Razón variable.
Programa de razón variable (RV): variación en el número de R requerido para el
reforzamiento de una ocasión a la siguiente.
Las pausas predecibles en la tasa de R son menos probables con los
programas de RV que con los programas de RF.
Pueden darse pausas posreforzamiento.
La tasa global de R es similar siempre y cuando, como promedio, se
requieran números similares de R. sin embargo, la tasa global de R tiende a
distribuirse en un patrón de pausa-carrera en RF y de forma estable en RV.
1.. PROGRAMAS DE INTERVALO.
pf3
pf4
pf5

Vista previa parcial del texto

¡Descarga Programas de Reforzamiento y Conducta de Elección: Tipos y Ejemplos - Prof. 90 y más Apuntes en PDF de Psicología solo en Docsity!

TEMA 6: PROGRAMAS DE REFORZAMIENTO Y CONDUCTA DE ELECCIÓN.

Programa de reforzamiento: programa o regla que determina la forma en que se relacionan las presentaciones del reforzador con las ocurrencias de la respuesta instrumental. Determinan la tasa y el patrón de las respuestas instrumentales, cómo y cuándo la ocurrencia de una respuesta va seguida de un reforzador. Si incluyen relaciones similares entre E, R y reforzadores suelen producir patrones similares de conducta. Se investigan en cajas de Skinner: más información sobre los factores que controlan el mantenimiento y realización de la conducta más que su adquisición. Sirven como línea de base útil para el estudio de otros procesos conductuales: drogas, cambios en la motivación… según Séller, los programas de reforzamiento son el gigante durmiente del análisis de la conducta.

1. PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE.

En los programas “simples”, un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza.

1.1.. PROGRAMAS DE RAZÓN.

El reforzamiento depende sólo del número de respuestas. Reforzamiento continuo (RFC): si el número requerido es uno, cada ocurrencia de la R provoca la entrega del reforzador. Poco frecuente. Reforzamiento parcial o intermitente: situaciones en las que la R se refuerza sólo alguna vez.

a) Razón fija.

Programa de razón fija (RF): Hay razón fija entre el número de R realizadas y el número de reforzadores conseguidos. Se da una tasa de R constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar el número requerido de respuestas. El reforzamiento continuo es un programa de RF. En él los organismos suelen responder a una tasa constante pero moderada, dándose pausas breves e impredecibles. Registro acumulativo: representación de la forma de repetirse una R a lo largo del tiempo. Muestra el número total de respuestas que han ocurrido hasta un momento determinado. Pausa posreforzamiento: tasa cero de R tras un reforzamiento. Su longitud depende del requerimiento de la razón subsiguiente (podría ser pausa pre-razón). Carrera de razón: tasa de respuesta alta y estable que completa cada requerimiento. Tensión de la razón: si el requerimiento de la razón se incrementa un poco, la tasa de R puede permanecer igual durante la carrera de la razón. Con mayores requerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si es muy grande, el animal deja de responder (no se debe aumentar la dificultad demasiado rápido).

b) Razón variable.

Programa de razón variable (RV): variación en el número de R requerido para el reforzamiento de una ocasión a la siguiente.

• Las pausas predecibles en la tasa de R son menos probables con los

programas de RV que con los programas de RF.

• Pueden darse pausas posreforzamiento.

• La tasa global de R es similar siempre y cuando, como promedio, se

requieran números similares de R. sin embargo, la tasa global de R tiende a distribuirse en un patrón de pausa-carrera en RF y de forma estable en RV.

1.. PROGRAMAS DE INTERVALO.

Las respuestas se refuerzan sólo si ha transcurrido un cierto tiempo.

a) Intervalo fijo.

El tiempo no varía de una ocasión a la siguiente. Festón del intervalo: a medida que el tiempo para la disponibilidad del próximo reforzador se acerca, aumenta la tasa de R. Aceleración en el registro acumulativo hacia el final del IF. El intervalo determina sólo cuándo el reforzador está disponible, para la entrega se requieren las respuestas. ¿Cómo mejorar la habilidad del sujeto para controlar el tiempo? El estímulo reloj incrementa la duración de la pausa posreforzamiento y desplaza la respuesta más cerca del final del ciclo del IF. Aumenta la eficacia.

b) Intervalo variable.

Las respuestas se refuerzan si se dan tras haber transcurrido un IV desde la administración del reforzador previo o el comienzo del programa. Mantienen tasas de respuesta constantes y estables sin pausas regulares.

c) Programas de intervalo y espera limitada.

Fuera de laboratorio, los reforzadores suelen estar disponibles sólo durante periodos limitados. Espera limitada: restricción en cuanto al tiempo que permanece el reforzador disponible. Puede añadirse a programas de IF como IV.

2.. COMPARACIÓN DE LOS PROGRAMAS DE RAZÓN Y DE INTERVALO.

Semejanzas:

• RF e IF F 0 E 0pausa posreforzamiento tras la administración de cada reforzador.

• RF e IF F 0 E 0altas tasas de respuesta justo antes de la administración del

siguiente reforzador.

• RV e IV F 0 E 0tasas estables de respuesta, sin pausas predecibles.

Diferencias: activan diferentes cambios neuroquímicos. Experimento de Reynolds F 0 E 0incluso cuando los pájaros recibieron la misma frecuencia y distribución de reforzadores, la paloma reforzada con RV respondió a una tasa mucho más alta que la paloma reforzada con IV. Experimento de Raia y cols. F 0 E 0efectos del moldeamiento de la respuesta, las instrucciones y la presencia de una respuesta consumatoria sobre la ejecución en el procedimiento acoplado RV-IV. El individuo de cada pareja era que era reforzado según RV realizaba altas tasas de respuesta.

a) Reforzamiento diferencial del tiempo interrespuesta.

Tiempo interrespuesta (TIR): intervalo entre una respuesta y la siguiente. El intervalo entre sucesivas respuestas puede moldearse.

• TIR cortos F 0 E 0tasa repuesta alta. Favorecida por un programa de razón.

• TIR largos F 0 E 0tasa respuesta baja. Favorecidos por un programa de intervalo.

3.. PROGRAMAS DE REFORZAMIENTO DE TASAS DE RESPUESTA.

Los programas de razón y de intervalo no requieren una tasa específica de respuesta. Programas de tasas de respuesta: requieren que el organismo responda a una tasa particular para obtener el reforzador. Reforzamiento diferencial de tasas altas (RDA): una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierto tiempo tras la respuesta precedente. Fomenta tasas altas. Reforzamiento diferencial de tasas bajas (RDB): se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierto tiempo desde la respuesta previa. Fomenta que los sujetos respondan lentamente.

c) La ley de la igualación y los programas simples de reforzamiento.

Herrnstein F 0 E 0elección entre la respuesta especificada y ocuparse en otras posibles actividades. El reforzamiento total incluye recompensas extrínsecas programadas y no programadas.

Ra está relacionada con la tasa de reforzamiento para esa R de forma negativamente acelerada. La tasa de respuesta disminuirá a medida que aumente la tasa de otras fuentes de reforzamiento (ro). Responder en una situación de respuesta única es una función negativamente acelerada de la tasa de reforzamiento para esa R, pero se ha cuestionado la presuposición de Ra+Ro como constante.

2.3. MECANISMOS DE LA LEY DE LA IGUALACIÓN.

Ley de la igualación: no explica los mecanismos responsables de la distribución de respuesta.

• Teorías molares: ignoran qué ocurre a nivel de las respuestas individuales.

Explican agregados de respuestas. Distribución total de respuestas y reforzadores.

• Teorías moleculares: se centran en el nivel de las respuestas individuales y

consideran la relación de igualación como resultado neto de las elecciones individuales.

• Mejoramiento: intermedia.

a) Igualación y maximización de las tasas de reforzamiento.

Los organismos distribuyen sus acciones entre las alternativas de respuesta para recibir la máxima cantidad de reforzamiento.

i. Maximización molecular.

Shimp. Cuando dos programas, A y B, funcionan simultáneamente, el sujeto cambia del A al B a medida que la probabilidad de reforzamiento para el B aumenta. Énfasis: elegir una alternativa en función del reforzamiento por permanecer en una y el reforzamiento por cambiar a la otra.

ii. Maximización molar.

El organismo distribuye sus respuestas entre las alternativas para maximizar el reforzamiento que consiguen a la larga. Se centran en agregados de conducta sobre algún período de tiempo. Origen de la teoría: explicar la elección en programas concurrentes de razón. Responden exclusivamente en el componente de razón que requiere el menor número de respuestas. Dificultades:

• No explica por qué la conducta de elección se distribuye de forma tan

cercana a la relación de igualación en los programas concurrentes IV-IV.

• En estudios con elección entre un programa RV y uno IV, para el máximo

beneficio, los sujetos deben concentrar sus respuestas en la alternativa RV y responder ocasionalmente en IV.

iii. Mejoramiento.

Escala temporal intermedia entre la molar y molecular. Muchos aspectos de la conducta no son óptimos a l/p. Mejoramiento: elegir la mejor alternativa en ese momento (maximización molecular) o hacer que a largo plazo algo sea tan bueno como se pueda (maximización molar). Los beneficios están circunscritos a una situación limitada. Tasa local de respuesta y reforzamiento: calculadas sobre el periodo de tiempo que un sujeto dedica a una alternativa de respuesta. Es siempre mayor que su tasa global.

Los organismos cambian de una alternativa a otra para mejorarla hasta que obtiene la misma tasa local de recompensa en todas las alternativas. El mecanismo del mejoramiento da como resultado la igualación.

3. ELECCIÓN POR COMPROMISO.

Programa concurrente de reforzamiento estándar: varias alternativas disponibles al mismo tiempo y se puede alternar. En ocasiones, elegir una alternativa hace que las otras no estén disponibles y puede involucrar metas a l/p. La gente sin autocontrol elige una recompensa pequeña a c/p.

3.1. PROGRAMAS CONCURRENTES ENCADENADOS.

En la primera fase, eslabón de elección, se elige entre dos programas alternativos realizando una de dos respuestas. La oportunidad para el reforzamiento sucede sólo en el eslabón terminal. Implican elección de compromiso: una vez realizada la elección, el participante está comprometido con ella hasta el final del eslabón terminal. Resultados: los sujetos prefieren la alternativa de razón variable. Programa concurrente: aquél en que las respuestas al eslabón inicial se refuerzan por la presentación de un reforzador condicionado. Las diferencias en el valor del reforzador condicionado determinan la tasa relativa de cada respuesta de elección en el eslabón inicial.

3.2. ESTUDIOS DE “AUTOCONTROL”.

Autocontrol: elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. Es más fácil si la alternativa tentadora no está tan claramente disponible. Rachlin y Green. Si las recompensas se entregan rápidamente, los sujetos prefieren una recompensa pequeña inmediata, pero si se añade una demora constante a la entrega de ambas recompensas, muestran autocontrol.

a) Explicaciones del autocontrol.

Principio general: el valor de un reforzador se reduce en función de cuánto tiempo se tiene que esperar para obtenerlo. Función descontadota del valor: el valor de un reforzado (V) esta directamente relacionado con la magnitud de la recompensa (M) e inversamente relacionado con la demora de la recompensa (D). Función del decaimiento hiperbólico: Si el reforzador es entregado sin demora (D=0), el valor del reforzador está directamente relacionado con su magnitud. Cuando más se demora el reforzador, menor es su valor. ¿Cómo puede explicar la función descontadota el problema del autocontrol? Incrementar la demora de las recompensas grande y pequeña hace más fácil que se muestre el autocontrol seleccionando el reforzador más grande pero con más demora.

b) Las funciones descontadotas y los problemas de autocontrol en la adicción a

la droga. Cuanto más acusada sea la función descontadota de la demora de una persona, más dificultad tendrá para mostrar autocontrol. Madden y cols. F 0 E 0El abuso de sustancias frecuentemente refleja una serie de elecciones impulsivas. Los adictos deben mostrar funciones de descuento de la recompensa más acusadas que otros individuos.