



























Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Los diferentes tipos de programas de reforzamiento y cómo influyen en la conducta de elección. Se incluyen ejemplos prácticos y soluciones a preguntas relacionadas.
Tipo: Diapositivas
1 / 35
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




























En la vida real, no siempre que damos una respuesta aparecerá el reforzador. n1, n2, n3... El programa de reforzamiento determina cuándo la ocurrencia de la respuesta va a ir seguida de un reforzador.
El número de respuestas necesarias para obtener un reforzador es siempre el mismo. Ej: RF5 = Cada 5 respuestas, me dan un premio. El programa de RF1 es un programa de reforzamiento continuo. Produce pausas post-reforzamiento.
El reforzador se otorga en función del número de respuestas.
El número de respuestas necesarias para obtener un reforzador va variando. Ej: RV5 = Cada 5 respuestas en promedio , me dan un premio.
El reforzador se entrega en función del tiempo que ha transcurrido desde el último reforzador ( pero todavía hay que responder al menos 1 vez para obtener el reforzador)
El tiempo que pasa entre dos reforzamientos es siempre el mismo. Por ejemplo: IF5: cada cinco segundos, el reforzador está disponible (cada 5 segundos, si respondo me dan un premio Produce pausas post-reforzamiento y aceleración pre-reforzamiento (patrón “festoneado”).
El tiempo que pasa entre dos reforzadores va variando. Por ejemplo IV5: cada 5 segundos en promedio , el reforzador está disponible.
Pregunta: Las máquinas tragamonedas ¿Qué programa de reforzamiento utilizan? Solución: Un programa de Razón Variable. Por eso son tan adictivas, producen una tasa de respuesta estable y persistente.
Pregunta: Un vendedor de frutos secos que saca un beneficio por cada bolsa de pasitas vendida. ¿Qué programa de reforzamiento sería? Solución: Un programa de Razón Fija, de hecho es un programa de reforzamiento continuo.
Los programas que más respuestas producen son los de razón (porque en los de intervalo, el reforzador se obtiene por esperar al momento idóneo, no por dar un número determinado de respuestas).
Los programas fijos producen menos respuestas que los variables porque son más predecibles. Además son más fáciles de extinguir. De modo que los programas más efectivos para crear respuestas son los de razón variable (Ej: las máquinas tragamonedas por eso son tan “adictivas” y peligrosas)
Ahora queremos investigar la conducta de elección. Si te dejan elegir ¿qué prefieres hacer? En los programas concurrentes se deja elegir al animal entre dos programas de reforzamiento
Para saber que programa prefiere seguir la paloma recurrimos a la tasa relativa de respuesta. Si la paloma no tiene ninguna preferencia especial, la tasa relativa se queda en 0,
La tasa de respuesta = tasa de reforzamiento O sea, que la paloma responde más en el programa que más reforzadores le proporcionan. Si te dejan escoger entra pasar una tarde en el cine o paseando con un amigo, escogerás probablemente la actividad más reforzante. A B
Infraigualación, supraigualación y sesgo de respuesta A veces la ley de la igualación no se cumple, y en esos casos se cumple esta norma: El parámetro b es el sesgo (bias) de respuesta. Es una preferencia por uno de los dos programas en particular, incluso aunque proporcione la misma tasa de reforzamiento que el otro (por ejemplo, la respuesta en sí puede ser más cómoda). Ir al gimnasio podría ser más reforzante que ver la televisión (porque produce un beneficio a largo plazo), pero como la respuesta es costosa, puede que prefiramos quedarnos en casa (sesgo de respuesta). El parámetro s es la sensibilidad de la conducta de elección a las tasas de reforzamiento (“cuánto me afecta la tasa de reforzamiento de este programa”). Una buena comida es reforzante, pero si no me gustan los pescados a lo mejor no elegiría ese menú (sensibilidad).