Docsity
Docsity

Prepara tus exámenes
Prepara tus exámenes

Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity


Consigue puntos base para descargar
Consigue puntos base para descargar

Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium


Orientación Universidad
Orientación Universidad


reforzamiento, Apuntes de Ciencias de la Educación

Asignatura: funcion, Profesor: , Carrera: Educación Primaria, Universidad: Deusto

Tipo: Apuntes

2015/2016

Subido el 15/09/2016

ugonzalez02
ugonzalez02 🇪🇸

4 documentos

1 / 11

Toggle sidebar

Esta página no es visible en la vista previa

¡No te pierdas las partes importantes!

bg1
Tema5_Aprendizaje_Programas y Teorías del Reforzamiento
PROGRAMAS DE REFORZAMIENTO
Programas básicos de reforzamiento
Están constituidos por la forma en que se programan los reforzadores
contingentemente con las respuestas, es decir, la regla que determina
las condiciones en las que la respuesta puede ser reforzada
Reforzamiento continuo o parcial o intermitente (más difícil de extinguir)
Tipos de programas parciales
Programas de razón
Debe haber un número de respuestas antes de que la última de
ellas sea reforzada
Razón fija (RF): el número requerido es siempre el mismo
Razón variable (RV): el requerimiento varía en torno a un
promedio
Programas de intervalo
Debe pasar un tiempo desde la consecución del reforzador
anterior antes de que la respuesta sea de nuevo reforzada
Intervalo fijo (IF): el tiempo requerido no varía
Intervalo variable (IV): el tiempo varía alrededor de un promedio
Cada programa produce un tipo de ejecución que se puede mostrar en
un registrador acumulativo
Se marcan la tasa de respuestas (su número, tiempo entre
respuestas (TER), etc.), los reforzadores y los estímulos
discriminativos
RV: tasas altas y constantes
IV: tasa constante, pero no tan alta como RV
RF
Cuando el requisito de la razón es alto, se da una pausa post-
reforzamiento, una tasa alta de respuesta posterior (carrera
de razón)
Si el requisito de la razón es demasiado alto, se puede dejar
de responder por completo, lo que se llama tensión de la
razón
IF
Pausa post-reforzamiento y aceleración gradual posterior:
patrón festoneado
Refleja un proceso de discriminación temporal (se responde
cuando es altamente probable la consecución del reforzador)
pf3
pf4
pf5
pf8
pf9
pfa

Vista previa parcial del texto

¡Descarga reforzamiento y más Apuntes en PDF de Ciencias de la Educación solo en Docsity!

Tema5_Aprendizaje_Programas y Teorías del Reforzamiento

▼ PROGRAMAS DE REFORZAMIENTO

▼ Programas básicos de reforzamiento

• Están constituidos por la forma en que se programan los reforzadores

contingentemente con las respuestas, es decir, la regla que determina las condiciones en las que la respuesta puede ser reforzada

• Reforzamiento continuo o parcial o intermitente (más difícil de extinguir)

▼ Tipos de programas parciales

▼ Programas de razón

• Debe haber un número de respuestas antes de que la última de

ellas sea reforzada

• Razón fija (RF): el número requerido es siempre el mismo

• Razón variable (RV): el requerimiento varía en torno a un

promedio

▼ Programas de intervalo

• Debe pasar un tiempo desde la consecución del reforzador

anterior antes de que la respuesta sea de nuevo reforzada

• Intervalo fijo (IF): el tiempo requerido no varía

• Intervalo variable (IV): el tiempo varía alrededor de un promedio

▼ Cada programa produce un tipo de ejecución que se puede mostrar en

un registrador acumulativo

• Se marcan la tasa de respuestas (su número, tiempo entre

respuestas (TER), etc.), los reforzadores y los estímulos discriminativos

• RV: tasas altas y constantes

• IV: tasa constante, pero no tan alta como RV

▼ RF

• Cuando el requisito de la razón es alto, se da una pausa post-

reforzamiento, una tasa alta de respuesta posterior (carrera de razón)

• Si el requisito de la razón es demasiado alto, se puede dejar

de responder por completo, lo que se llama tensión de la razón

▼ IF

• Pausa post-reforzamiento y aceleración gradual posterior:

patrón festoneado

• Refleja un proceso de discriminación temporal (se responde

cuando es altamente probable la consecución del reforzador)

• A veces en los programas de intervalo hay un tiempo limitado

para conseguir el reforzador (duración limitada)

▼ La duración de la pausa post-reforzamiento depende más del

intervalo temporal entre reforzadores que del propio requisito del programa

▼ Programas múltiples de RF con claves discriminativas que los

identifican: corto-corto, corto-largo, largo-largo, largo-corto.

• La duración de la pausa post-reforzamiento está mejor

predicha por el programa RF que va a ocurrir que por el que ha ocurrido

▼ Razón frente a intervalo: funciones de retroalimentación

▼ Si se igualan las tasas y patrones de reforzamiento (se acoplan)

la tasa de respuesta es mayor en los programas de razón que en los de intervalo

▼ Explicaciones

▼ Molecular

• En los de intervalo se refuerzan TER largos porque el

mero paso del tiempo aumenta la probabilidad de reforzamiento

• En los de razón se refuerzan TER cortos

• Se centra en cada relación respuesta-reforzador

▼ Molar

• En RV hay una correlación directa entre tasa de respuesta

y de reforzamiento, cosa que no pasa en IV

• Se observan periodos largos de tiempo, haciendo más

énfasis en la correlación que en la contigüidad

▼ Funciones de retroalimentación

• Las relaciones entre la conducta y el ambiente, como las

establecen los programas de reforzamiento se describen en términos de funciones de retroalimentación

• Son una descripción de la forma en que el ambiente (p.e.

frecuencia, magnitud o demora de reforzamiento) está en función de una conducta

• La relación conducta-ambiente es de influencia, no de causa-

efecto

▼ Función de retroalimentación: R=B/N

• R: tasa de reforzamiento obtenido

• B: tasa de respuesta emitida

• N: respuestas por reforzador (requisito de la razón)

• En general, hay teorías moleculares (que se centran en los

emparejamientos locales respuesta-reforzador); y teorías molares, que observan un periodo más largo

▼ Programas compuestos de reforzamiento

• Aplicación de dos o más programas básicos. Se pueden dividir en dos

tipos: secuenciales y simultáneos

▼ Programas alternantes y secuenciales

▼ Programa mixto

• Se presentan dos o más programas básicos que se alternan al

azar cada cierto tiempo fijado, independientemente de la conducta del sujeto

• Por ejemplo, cada 60s cambia de un IF60 a un RF 50

▼ Programa múltiple

• Igual que el mixto pero cada componente se señala con una

clave discriminativa distinta (p.e. un sonido o luz) que dura todo el periodo

• Los programas con un Ed y un EΔ (no hay refuerzo) son

múltiples

▼ Programa tándem

• Se debe completar el primer programa para poder pasar al

siguiente y así sucesivamente. en el último programa se consigue el reforzador.

▼ Programa encadenado

• Igual que el tándem pero unos Eds señalan los cambios de

programa

▼ Programas simultáneos

▼ Programas concurrentes

• Se puede cambar de un programa a otro sin haber completado

un tiempo o un número de respuestas

• Se mide la proporción de respuestas en cada opción (p.e.

palancas)

• Lo normal es que haya dos programas de intervalo

▼ Cuando se combinan un programa de razón y uno de intervalo

hay tres posibilidades

• Programa alternativo: se refuerza una respuesta cuando se

cumple con el requisito de la razón o del intervalo

• Programa conjuntivo: se refuerza una respuesta cada vez

que se cumple al mismo tiempo con el requisito de la razón y del intervalo

• Programa entrelazado: los programas se influyen entre sí (

respuestas, o 7 respuestas y 3 segundos, o 3 respuestas y 7 segundos, o 10 segundos

▼ CONDUCTA DE ELECCIÓN

• En los programas concurrentes, la elección entre alternativas se calcula

por la tasa relativa de respuesta: Ra/Ra+Rb (Ra: tasa de respuesta a la alternativa a)

▼ Los programas concurrentes sirven para mostrar las preferencias de los

sujetos

• Anteriormente se usaban programas de premios concurrentes (se daba

a elegir a los sujetos entre dos actividades diferentes, p.e. correr o beber)

• Sin embargo, en los programas concurrentes se usa la misma

respuesta operante para obtener diferentes premios. Podríamos llamarlo respuestas instrumentales concurrentes

▼ La ley de igualación

▼ Herrnstein: la tasa relativa de respuesta entre dos alternativas es igual

a la tasa relativa de reforzamiento asociada a cada alternativa

• Ra y Rb son las tasas de respuesta a las alternativas a y b

• Fa y Fb son las tasas (frecuencias) de reforzamiento asociadas

a las alternativas a y b

▼ Además de igualar las tasas de respuesta a la tasa de

reforzamiento, los animales también la igualan a otros parámetros del reforzador: magnitud o inmediatez

▼ Maximización: elección entre programas concurrentes de razón

• Cuando se elige entre programas de razón los animales sólo responden

al mejor, al que tiene un requisito de razón más bajo. Eso es la maximización.

• Esto cumple la ley de igualación

• Cuando se combina un programa RV y otro IV se dedica más tiempo al

primero probando ocasionalmente en el segundo

▼ Igualación temporal

• Además de igualar la tasa de respuestas con la de reforzamiento,

igualan el tiempo que pasan en cada alternativa con la tasa de reforzamiento de las mismas.

▼ Experimento de Findley

• Cuando Fa/Fb es menor que 1, el programa b es mejor que el a

▼ Baum: nueva fórmula con sobre e infra y sesgos

▼ K: constante que representa los sesgos relativos y s la

sensibilidad a los programas

• Cundo son 1 la ecuación es igual a la de Herrnstein

• Cuando s<1 hay infraigualación

• Cuando s>1 hay sobreigualación

▼ Teorías de la igualación

• La ley de la igualación no nos habla de los mecanismos por la que se

cumple

▼ Tipos de explicaciones

▼ Molecular

• El cambio de una alternativa a otra se da cuando la probabilidad

momentánea de reforzamiento es mayor en la otra alternativa

• Ejemplo IV45 - IV

▼ Molar

• Los animales distribuyen sus respuestas conforme a un cálculo

global de las tasas de reforzamiento, eligiendo la alternativa que proporciona una mayor tasa de reforzamiento

• La teoría molecular es más precisa en sus predicciones y explica

mejor los programas concurrentes RV-IV que la molar

▼ Mejoramiento

• Es una síntesis de la molecular y la molar

• Se responde de manera que se igualan las tasas locales de

reforzamiento, respondiendo a la alternativa que en un momento dado presenta una mejor tasa local de reforzamiento

• No se refiere a tasas globales de reforzamiento (molar), sino

locales (durante un periodo limitado)

• Se cumple también la ley de igualación temporal (se pasa menos

tiempo en la alternativa peor)

▼ Impulsividad y autocontrol: la elección con compromiso

▼ Cadenas concurrentes de respuesta (o programa concurrente

encadenado)

• Con este procedimiento se mide la elección entre diferentes fuentes

de premio (no entre premios ni entre respuestas instrumentales)

▼ Dos fases

• Eslabón inicial de elección entre dos alternativas idénticas

• Eslabón terminal donde se dan los reforzadores por responder a

la alternativa elegida en el eslabón inicial. Se permanece un tiempo en el programa elegido antes de volver al eslabón inicial.

• Este procedimiento mide mejor la elección (descontaminada de los

propios efectos del reforzamiento sobre la tasa de respuesta)

• Se parece a la vida cotidiana: elegir una alternativa te compromete

por un tiempo antes de poder cambiar de opción (p.e. matricularse de asignaturas)

▼ Rachlin y Green

• Elegir entre una recompensa pequeña inmediata y otra mayor

demorada

• Cuando se usaba un programa concurrente simple, se prefería el

premio pequeño inmediato (impulsividad)

• Cuando se utilizó un programa concurrente encadenado, con un

tiempo constante de espera para pasar a la fase dos, se prefería el premio mayor demorado (autocontrol)

▼ Los estudios sobre autocontrol muestran que las características de los

reforzadores (frecuencia, magnitud, demora...) no pesan todos igual

• Por tanto, la ecuación de la ley de igualación que vimos antes

▼ Se debería quedar así

• los exponentes de la sensibilidad (s) a cada característica del

reforzador son diferentes para la frecuencia (sf) y para la magnitud (sm). (La duración se obvia)

• Parece que sm es menor que sf, es decir, que la magnitud

influye menos que la frecuencia de reforzamiento

▼ La noción de valor de los reforzadores

• Es una aproximación complementaria a la ley de igualación para

analizar la conducta de elección

• El valor del reforzador deriva del cociente magnitud/demora (p.e. IV

e IV20 con el doble de reforzador en el primero)

▼ Si añadimos un tiempo de demora antes de entregar el reforzador, los

comportamientos impulsivos se pueden hacer autocontrolados

▼ Mazur: función hiperbólica para explicar esto: Va/Ma/(1+kDa)

• Va: valor del reforzador; Ma, magnitud; Da, demora; k es una

constante que representa la tasa de descuento de la demora para cada individuo y situación

• El valor aversivo de un castigo también cambia mediante una función

hiperbólica parecida

▼ La tasa de respuesta en relación a la ley de igualación

▼ La ley de igualación se puede aplicar cuando solo hay una alternativa.

Siempre hay elección (Herrnstein): entre responder o no responder, o mejor dicho, entre responder a la respuesta operante explícita o a otras actividades que implican reforzadores implícitos

• Las respuestas que acompañan a los estímulos reforzadores (p.e.

comer) son más probables que las instrumentales.

• Por tanto, los reforzadores dependen de las relaciones de

contingencia, no de características intrínsecas. Cualquier evento (estímulo, respuesta, actividad) puede ser un reforzador

• Dos supuestos para que una actividad pueda ser reforzadora: ser

preferida (en la línea de base, es decir, espontáneamente) y que la probabilidad de ocurrencia se restrinja y se haga depender de (se haga contingente a) la actividad menos preferida (la respuesta instrumental)

▼ Experimentos

• Ratas: correr o beber pueden ser refuerzo o instrumental

dependiendo de la privación de agua previa del animal.

• Niños: línea de base: comer golosinas o jugar a maquinitas. Los

niños que preferían una de ellas podían aumentar la otra si se hacía contingente.

• Principio de Premack sobre el castigo: la actividad menos probable

puede castigar a la más probable cuando se hagan contingentes. La menos probable disminuirá.

• La teoría de Premack está en línea con Skinner: no se explica por qué

se prefieren unas conductas a otras ni los mecanismos últimos de las asociaciones. No importa si la conducta provoca placer, reduce una necesidad, provoca activación o es característica de la especie.

• ¿Cómo medir la preferencia por una actividad? Premack sugirió que por

el tiempo dedicado a ella.

▼ Teoría de la privación de respuesta

• El propio Premack vio que, además de la mayor probabilidad de la

actividad reforzadora, ésta tiene que estar restringida (limitadas las posibilidades de ejecutar la respuesta)

• Karpman y Trattner (1967) proponen una hipótesis más radical: sólo se

exige el segundo requisito de Premack: la limitación de la actividad reforzadora (no que sea más o menos preferida o probable)

▼ La hipótesis de privación de respuesta (Allison y Timberlake) propone

eso mismo: sólo es necesario restringir la respuesta reformadora en relación con su ocurrencia en el punto de bienestar (o línea de base sin restricciones)

• I/R > Oi/Or (la proporción entre una actividad instrumental (I) y una

reforzadora (R) debe ser mayor que la proporción entre esas dos actividades en el punto de bienestar)

▼ Ejemplo: correr o beber

• Se prefiere beber a correr (400/200)

• Si se restringe beber y se hace contingente con correr (línea

diagonal). Progreama RF1. El animal trata de acercarse lo más posible al punto de bienestar

• Si se restringe correr (diferencia con Premack, porque es la

actividad menos probable) y se hace contingente con beber (línea más inclinada). Programa RF4 (cuatro lametones para poder correr)

▼ Aplicaciones de la hipótesis de privación de respuesta

• La ley de igualación: con intervalos más largos entre

reforzadores, la respuesta será menor (línea de puntos de la figura)

▼ Hipótesis de privación: relación de U-invertida entre la tasa de

respuesta y de reforzamiento: aumenta hasta cierto punto la respuesta y luego disminuye

• Al inicio, cuando el requerimiento del programa es mayor (de

razón o intervalo), el número de respuestas debe aumentar, porque el beneficio del reforzador compensa el coste de responder. Pero llega un momento en el que ya no compensa por ser demasiado baja la tasa de reforzamiento

• Ejemplo con rata: comer/presionar palanca (100/10)

• Con requisitos muy altos (RF25) no hay un punto o área de

contingencia mejor que otro

• Que la relación entre tasa de respuesta y de reforzamiento sea

lineal (como predice la ley de igualación) o bitónica / U invertida (como predice la hipótesis de privación), puede depender de la longitud de la sesión experimental: cuando es corta, función lineal; cuando es larga, función bitónica.