






Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Los programas de reforzamiento, específicamente de razón fija y variable, y cómo afectan la conducta de elección de un organismo. Se discuten conceptos como tasa de respuesta, tasa relativa de respuesta y reforzamiento, y se comparan los patrones de respuesta observados en cada tipo de programa.
Tipo: Resúmenes
1 / 11
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!







Un programa de reforzamiento es un programa, o regla, que determina cómo y cuándo la ocurrencia de una respuesta irá seguida de un reforzador.
Los procesos que organizan y dirigen la ejecución instrumental se activan de diferentes formas por los distintos programas de reforzamiento. En los programas ‘simples’, un solo factor determina qué ocurrencia de la respuesta instrumental se refuerza.
La característica definitoria de un programa de razón es que el reforzamiento depende sólo del número de respuestas que el organismo realiza. Si este número es uno, cada ocurrencia de la respuesta instrumental provocará la entrega del reforzador. Este tipo de programa se denomina técnicamente reforzamiento continuo (RFC).
Las situaciones en las que la respuesta se refuerza sólo alguna vez involucran un reforzamiento parcial o intermitente.
Se da una tasa constante y alta una vez que la conducta se ha iniciado, pro se puede tardar un tiempo antes de comenzar el número requerido de respuestas. Estas características de la respuesta se muestran con claridad en un registro acumulativo de la conducta. Un registro acumulativo es una forma especial de representar la forma de repetirse una respuesta a lo largo del tiempo.
La tasa cero de respuesta que se observa justo después del reforzamiento se denomina pausa posreforzamiento. La tasa de respuesta alta y estable que completa cada requerimiento de la razón se denomina carrera de la razón.
Si el requerimiento de la razón se incrementa un poco, la tasa de respuesta puede permanecer igual durante la carrera de la razón. Con mayores requerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si el requerimiento de la razón sufre un incremento súbito y significativo es probable que el animal realice una pausa periódica cada vez que completa la razón requerida. Este efecto se denomina tensión de la razón. En casos extremos, la tensión de la razón puede ser tan grande que el animal deje completamente de responder.
Ejemplo. Entrenar a una paloma para realizar 10 respuestas para conseguir la primera recompensa, 13 para conseguir la segunda, 7 para la próxima, y así sucesivamente. El valor numérico del programa de RV indica que el número medio de respuestas requerido para conseguir el reforzador. En consecuencia, en este caso el procedimiento sería un programa de RV 10.
del laboratorio existe una restricción en cuanto al tiempo que permanece el reforzador disponible. A esto se le llama espera limitada.
Semejanzas
Diferencias
¿Cómo determinan los programas de intervalo y de razón el reforzamiento de los TIRs?
A pesar de que los programas de razón producen tasas de respuesta mayores que los programas de intervalo, ni uno ni otro requieren una tasa específica de respuesta para conseguir el reforzamiento. Sin
embargo, los programas de tasas de respuestas requieren específicamente que el organismo responda a una tasa particular para obtener el reforzador.
En el reforzamiento diferencial de tasas altas o RDA una respuesta se refuerza sólo si ocurre antes de que haya transcurrido cierta cantidad de tiempo tras la respuesta precedente. Fomentan que los sujetos respondan rápidamente.
En el reforzamiento diferencial de tasas bajas o RDB se refuerza una respuesta sólo si ocurre después de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa. Estos programas fomentan que los sujetos respondan lentamente.
La conducta es algo más que la repetición de respuestas individuales. La situación de elección más simple consta de dos respuestas alternativas, cada una de éstas seguida por un reforzador de acuerdo con su propio programa de reforzamiento.
Las aproximaciones recientes al estudio de la conducta de elección utilizan cajas de Skinner equipadas con dos manipulandos, como dos teclas de picoteo. En el experimento típico, responder en cada tecla es reforzado según algún programa de reforzamiento. Los dos programas funcionan al mismo tiempo (o concurrentemente), y el sujeto es libre de cambiar de una tecla de respuesta a la otra. Este tipo de procedimiento se denomina programa concurrente. Éste permite una medición continua de la elección porque el organismo el libre para cambiar de un lado a otro entre las alternativas.
La conducta de elección de un individuo en un programa concurrente se refleja en la distribución de su conducta entre dos respuestas alternativas. Esto se puede medir de varias formas. Una técnica común es calcular la tasa relativa de respuesta de cada alternativa. La tasa relativa de respuesta en la tecla A, por ejemplo, se calcula dividiendo la tasa de respuesta en la tecla A por la tasa de respuesta total (la tasa en la tecla A más la tasa en la tecla B):
R (^) A / (R (^) A + RB )
Donde R (^) A es la tasa de respuesta en la tecla A y RB es la tasa de respuesta en la tecla B.
Ejemplo: Si una paloma picotea igualmente en las dos teclas de respuesta, esta razón será 0,5. Si la tasa de respuesta en la tecla A es mayor que en la B, la razón será mayor que 0,5. Por el
de elección no se corresponde perfectamente con la relación de igualación pueden acomodarse añadiendo dos parámetros, b y s , a la ecuación:
R (^) A / R (^) B = b (rA / rB) s
RA / (RA + RO ) = rA / (r (^) A + r (^) O ) F 0 E 8 R (^) A = (R (^) A + R (^) O ) rA / (r (^) A + r (^) O)
Esta ecuación puede simplificarse si el investigador presupone que es igual a una constante que no guarda relación con el reforzador utilizado:
RA = k r (^) A / (r (^) A + r (^) O )
Esta ecuación predice que la tasa de respuesta (R (^) A) estará directamente relacionada con la tasa de reforzamiento para esa respuesta de una forma negativamente acelerada.
La ley de la igualación describe cómo los organismo distribuyen sus respuestas en una situación de elección pero no explica qué mecanismos son responsables de esta distribución de respuestas.
Ejemplo: una paloma trabajando en un programa concurrente IV – IV. A medida que la paloma picotea en A, el contador que controla el reforzamiento para la tecla B también está funcionando. Cuanto más tiempo permanezca la paloma en la tecla A, más probabilidad habrá de que transcurra el requisito del intervalo para la tecla B y que el reforzamiento esté disponible por el picoteo de B. Al alternar, la paloma puede obtener el reforzador en la tecla B. Ahora, cuanto más tiempo continúe picoteando la tecla B, más probable será que la tecla A esté lista para el reforzamiento.
Ejemplo: En un programa concurrente RF20 – RF10, el organismo es probable que responda sólo en la alternativa RF10. De esta forma maximiza su tasa de reforzamiento con el mínimo esfuerzo. La maximización molar no puede explicar por qué la conducta de elección se distribuye de forma cercana a la relación de igualación en los programas concurrentes IV – IV y no de otras formas igualmente efectivas.
Dadas las diferencias entre RV y IV, para el máximo beneficio en un programa concurrente RV – IV, los sujetos deberían concentrar sus repuestas en la alternativa de RV y responder sólo
Una característica importante del programa concurrente encadenado es que una vez que el participante ha realizado la elección, está comprometido con esa elección hasta el final del eslabón terminal del programa. Por tanto, los programas concurrentes encadenados implican elección con compromiso.
Ejemplo: si la paloma selecciona la alternativa A, su patrón de picoteo durante el componente terminal será semejante al patrón normal de respuesta para un programa de RV10. Si la paloma selecciona la alternativa B, su patrón de picoteo durante el componente terminal será característico de un programa de RF10.
Los estudios de este tipo han mostrado que los sujetos prefieren la alternativa de RV. La preferencia por este programa está guiada por el hecho de que ocasionalmente un programa de RV proporciona reforzamiento por un número relativamente pequeño de respuestas.
La consecuencia inmediata de una respuesta en un eslabón inicial es un estímulo que está asociado con el eslabón terminal elegido. Como este estímulo está presente cuando se proporciona el reforzador primario, el estímulo del eslabón terminal se convierte en un reforzador condicionado. Por tanto, se puede caracterizar un programa concurrente como aquél en que las respuestas al eslabón inicial se refuerzan por la presentación de un reforzador condicionado. Las diferencias en le valor del reforzador condicionado determinarán entonces la tasa relativa de cada respuesta de elección en el eslabón inicial.
V = M / (1 + KD)
Donde K es el parámetro de la tasa descontadora. Esta ecuación se denomina función del decaimiento hiperbólico. De acuerdo con esta ecuación, si el reforzador es entregado sin demora (D = 0), el valor del reforzador está directamente relacionado con su magnitud (los reforzadores más grandes tiene valores mayores). Cuanto más se demora el reforzador, menor es su valor.