





Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Asignatura: Aprendizaje, Profesor: Psicologia Psicologia, Carrera: Psicología, Universidad: UDIMA
Tipo: Apuntes
1 / 9
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!






En estos programas SIMPLES 1 solo factor determina qué ocurrencia de la respuesa instrumental se refuerza.
El reforzamiento depende sólo del número de respuestas que el organismo realiza. Se cuenta en n. de respuesta ocurridas y entregar el reforzador cada vez que se alcance el n. requerido. REFORZAMIENTO CONTINUO (RFC). Sólo sucede en el laboratorio.
REFORZAMIENTO PARCIAL O INTERMITENTE: las respuestas se refuerzan sólo alguna vez.
RAZÓN FIJA: predictible (número predecible de respuestas para cada refuerzo).
Cuando cada 10 respuestas “apretar una palanca” por cada reforzador RF 10. (pagar por el número de piezas que montan), etc..Es decir, un programa de reforzamiento continuo es también un programa de razón fija. Es un programa de reformaziento continuo RFC (razón fija continua). Los organismos sueles responder a una tasa constante PERO moderada, sólo se dan pausas breves e impredecibles. (una paloma, al principio picoteará más para conseguir comida y luego lo hará más lentamente a medida que sacie el apetito).Se da una tasa constante y alta una vez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar. Esta caracteristica de la respuesta se puede observar en un REGISTRO ACUMULATIVO DE LA CONDUCTA: representa la forma de repetirse una respuesta a lo largo del tiempo. (n. respuestas totales o acumuladas en un momento determinado de tiempo). La pendiente de la linea trazada por este registro representa la TASA DE RESPUESTA del sujeto. La tasa 0 de respuesta que se observa justo después del reforzamiento se llama PAUSA POSREFORZAMIENTO. La longitud de esta pausa está controlada por el requerimiento de la razón subsiguiente. Por eso de llama también PAUSA PRE-RAZÓN
LA CARRERA DE LA RAZÓN: es la tasa de respuesta ALTA y ESTABLE que completa cada requerimiento de la razón. Si el requerimiento de la razón se incremente un poco (de RF 120 a RF 150), la tasa de respuesta puede permanecer igual durante la carrera de razón, Con aumentos considerables
ocurren pausas posreforzamiento más largas. Este efecto se llama TENSIÓN DE LA RAZÓN por eso no hay que aumentar la razón requerida demasiado rápido, puede desistir por completo.
Un programa intermitente de razón fija: se da un patrón de respuestas muy diferentes. No es probable pausas en medio de la acción de marcar un número de teléfono,
RAZÓN VARIABLE: IMPREDECIBLE mediante la variación del número de respuestas requerido para el reforzamiento de una ocasión a la siguiente. Sigue siendo de “razón” porque el reforzamiento depende del n. de respuestas que realiza el organismo. Este RV ( aqui se utiliza el número MEDIO (la media) de respuestas requerido, al principio 13, luego 7, etc... por eso RV 10): Como es impredecible las pausas son menos probables con esos programas RV (hay una tasa claramente estable). Se pueden dar pausas posreforzamiento pero son menos intensas
Tras cierta cantidad de TIEMPO
(cantidad FIJA de tiempo)
IF 4 minutos el tiempo establecido no varia de una ocasión a otra. El patrón de respuesta se llama FESTÓN DEL INTERVALO FIJO.
Un IF 4 minutos no garantiza que el reforzador se proporcionará en algún momento a los largo del intervalo de tiempo. Se requieren respuestas como en RAZÓN. El intervalo determina sólo cuándo el reforzador está disponible, NO cuándo se entrega (programación de los exámenes se parecen al IF, al principio se dedica poco tiempo al estudio, se estudia más una semana antes del exámen, la tasa se incremente cuando se aproxima el día de examen).
IV tiempo impredecible para dispensar el reforzador. Es un intervalo MEDIO (la media) IV 2 minutos. Se tiene que realizar una respuesta. Los reforzadores no se dan “gratis”. No hay pausas con tasas de respuestas CONSTANTES.
Son programas FUERA de laboratorio, el reforzador está disponible SÓLO durante PERIODOS LIMITADOS. (horario restaurantes). Este tipo de
respuesta será de 12 por minuto o mayor RDA (Reforzamiento diferencial de tasas altas). Fomenta tasas altas de respuesta. En RDA una respueta se refuerza sólo si ocurre ANTES de que haya transcurrido cierta cantidad de tiempo TRAS la respuesta precedente.
EL reforzamiento diferencial de tasas bajas RDB fomentan que los sujetos respondan lentamente, pues se refuerza una respuesta SOLO si ocurre DESPUES de que haya transcurrido cierta cantidad de tiempo desde la respuesta previa.
( al mismo tiempo 2 ó más programas)
La situación de elección más simple = 2 respuestas alternativas, cada una de éstas seguidas por un reforzador de acuerdo con su propio programa de reforzamiento.
Se empezó estudiando la conducta de elección utilizando LABERINTOS en T especialmente. Actualmente se utilizan cajas de Skinner equipadas con 2 manipulandos, como 2 teclas de picoteo. Los 2 programas ocurren al mismo tiempo (o concurrentemente) El sujeto es libre de cambiar de una tecla de respuesta a la otra PROGRAMA CONCURRENTE que permiten una medición continua de la elección.
Programa A (IV 60 seg.) Programa B (RF 10)
Tecla A Tecla B
Entre 2 respuesta alternativas. Hay 2 formas de medición:
1.- calcular la TASA RELATIVA DE RESPUESTA de cada alternativa. Es decir de la tecla A se divide su tasa de respuesta por la tasa total de respuesta:
RA/ (RA + RB)
La forma de distribución de la conducta entre las 2 alternativas de respuesta está muy influida por el programa de reforzamiento que funciona en cada respuesta.
2.- calcular la TASA RELATIVA DE REFORZAMIENTO conseguido para cada alternativa de rspuesta se calcula igual que la anterior:
rA/ (rA + rB)
La tasa relativa de respuesa y la tasa relativa de reforzamiento son iguales. Herrnstein establece esta relación como una ley de conducta.
La primera expresión matemática:
RA/(RA +RB) = rA/rA + rB)
Como antes RA y RB = tasas de respuesta en las teclas A y B
rA y rB = tasas de reforzamiento conseguidas en cada alternativa de respuesta.
La segunda expresión matemática:
RA/RB = rA/rB
Representan el mismo principio básico: Las tasas relativas de respuesta se IGUALAN con las tasas relativas de reforzamiento
La Ley de igualación indica que las elecciones NO se hacen de forma caprichosa (son una función ordenada de las tasas de reforzamiento). Actualmente las tasas relativas de respuesta NO SIEMPRE se igualan exactamente con las tasas relativas de reforzamiento. Se añaden 2 parámetros b, s a la fórmula
RA/RB = b(rA/rB)”elevado el parentesis a s)
S= representa la SENSIBIIDAD de la conducta a la elección a las tasas relativas de reforzamiento. Cuando existe una igualación perfecta s = 1, las tasas relativas de respuesta son una función DIRECTA de las tasas relativas de reforzamiento.
INFRAIGUALACIÓN:un tipo de desviación perfecta incluye una sensibilidad reducida de la conducta de elección a las tasas relativas de reforzamiento y se acomoda dando al exponente s un valor MENOR a 1. Se encuentra la infraigualación más a menudo que la supraigualación. Hay muchas variables que influyen. Hacer más difícil el cambio de una alternativa de respuesta a otra INCREMENTE el parámetro de sensibilidad.
La conducta de elección : se basan en la idea de que los organismos DISTRIBUYEN sus acciones entre las alternativas de respuestas para recibir la MÁXIMA cantidad de reforzamiento posible. Esta idea de que los organismos MAXIMIZAN el reforzamiento se utiliza para explicar la conducta de elección en los distintos análsis: Los mecanismos son:
Se die a la gente que carecce de AUTOCONTROL si elige una recompensa pequeña a corto plazo en lugar de esperar para conseguir un beneficio mayor pero más demorado
Programa A (RV 10) Programa B (RF 10)
Eslabon terminal Eslabón terminal
TECLA A TECLA B Eslabón de elección(no es el reforzador primario)
Hay 2 fases o eslabones: Durante la primera fase el ESLABON DE ELECCIÓN elige entre 2 programas alternativos. Responder a este eslabon de elección NO PROPORCIONA RESULTADOS, sólo cuando se encuentre en le ESLABON TERMINAL. Cuando se escoge A o B está comprometido hasta el final del eslabón terminal del programa por eso implican ELECCIÓ CON COMPROMISO
Se prefiere la alternativa de razón variable. RV. La variedad parece ser la SAL DE LA VIDA. El eslabón terminal se convierte en REFORZADOR CONDICIONADO,
La conducta de elección está gobernada tanto por los programas de eslabón terminal como por cualquier programa que funcione en el enlace inicial.
Autocontrol: es elegir una recompensa grande demorada sobre una recompensa pequeña inmediata. El autocontrol es más fácil si la alternativa tentadora (un pastel) no está tan claramente disponible (en la carta hay pastel y verduras).
Una propiedad general de la conducta de elección: Si las recompensas se entregan rápidamente tras una rspuesta de elección, los sujetos generalmente PREFIEREN una recompensa pequeña inmediate más que una recompensa grande demorada. Sin embargo, si se añade una demora CONSTANTE a la entrega de ambas recompensas, los sujetos muestran autocontrol y prefieren la recompensa grande demorada.
Principio general: el valor de un reforzador se REDUCE en función de cuánto tiempo se tiene que esperar para obtenerlo. La fórmula para esta reducción en el valor se llama FUNCIÓN DESCONTADORA DEL VALOR.
V= M/(1+ KD) FUNCIÓN DEL DECAIMIENTO HIPERBÓLICO
M= magnitud de la recompensa
D= demora de la recompensa