



Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Prepara tus exámenes
Prepara tus exámenes y mejora tus resultados gracias a la gran cantidad de recursos disponibles en Docsity
Prepara tus exámenes con los documentos que comparten otros estudiantes como tú en Docsity
Encuentra los documentos específicos para los exámenes de tu universidad
Estudia con lecciones y exámenes resueltos basados en los programas académicos de las mejores universidades
Responde a preguntas de exámenes reales y pon a prueba tu preparación
Consigue puntos base para descargar
Gana puntos ayudando a otros estudiantes o consíguelos activando un Plan Premium
Comunidad
Pide ayuda a la comunidad y resuelve tus dudas de estudio
Ebooks gratuitos
Descarga nuestras guías gratuitas sobre técnicas de estudio, métodos para controlar la ansiedad y consejos para la tesis preparadas por los tutores de Docsity
Conceptos básicos del aprendizaje instrumental y operante, incluyendo la respuesta instrumental, suceso meta, relación entre ellos, conducta dirigida a una meta, procedimientos de moldeamiento y el efecto de reforzamiento. Se abordan conceptos relacionados con la variabilidad conductual, sistemas de conducta y limitaciones en el condicionamiento instrumental.
Tipo: Apuntes
1 / 7
Esta página no es visible en la vista previa
¡No te pierdas las partes importantes!




Condicionamiento instrumental: las presentaciones de los estímulos dependen de la ocurrencia previa de respuestas específicas. Elementos fundamentales:
Conducta dirigida a una meta: situaciones de aprendizaje en las que los estímulos a los que se enfrenta un organismo son resultado directo de su conducta. Conducta instrumental: la que sucede debido a que ha servido previamente como instrumento para producir ciertas consecuencias. ¿Cómo puede investigarse la conducta instrumental? Buscando ejemplos de CDM en el ambiente natural, aunque no es probable que tenga resultados definitivos.
Thorndike comenzó estudiando qué capacidades intelectuales humanas están presentes en los animales. Procedimiento: gato hambriento en una caja problema con algo de comida fuera de la vista. Debía aprender cómo salir. Con la práctica, las latencias eran cada vez más cortas. Contribuciones:
por un suceso satisfactorio, la asociación entre el E-R se fortalece. Si la respuesta es seguida por un suceso molesto, la asociación E-R se debilita.
Thorndike utilizó 15 cajas problema. Algunas estándar para facilitar la comparación.
Acaba con la retirada del animal del aparato y la RI se realiza sólo una vez durante cada ensayo. Siglo XX, W.S. Small: el laberinto aprovecharía la propensión de las ratas a los pasadizos pequeños y tortuosos. Formas de cuantificar la conducta de elección:
con ensayos de entrenamiento repetidos.
empezar a desplazarse por el pasadizo. Se hacen más cortas a medida que progresa el entrenamiento.
En un laberinto en T las oportunidades para responder son programadas por el experimentador. Operante libre (Skinner): se repite la respuesta instrumental sin restricciones. La conducta en curso es un continuo. Operante: forma de dividir la conducta en unidades medibles con significado.
Respuesta operante: se define a partir del efecto que produce en el ambiente. Las actividades que provocan el mismo efecto ambiental se consideran ejemplos de la misma respuesta operante. El elemento fundamental es la forma en que se “opera” en el ambiente.
el comedero por condicionamiento clásico (sonido).
sucederá por sí misma la respuesta que produce el reforzador. Moldeamiento: incluye reforzamiento de aproximaciones y no reforzamiento de las formas de respuesta más tempranas. La forma en que el organismo cumple la función no importa, pero los pasos en el moldeamiento afectan a esta forma. Con entrenamiento prolongado, la respuesta llega a ser más eficiente e involucra menos gasto de energía.
El moldeamiento aprovecha la variabilidad inherente de la conducta F 0 E 0El condicionamiento instrumental incluye la construcción o síntesis de una nueva unidad conductual a partir de componentes de respuesta preexistentes en el repertorio del sujeto. El moldeamiento puede producir nuevas formas de respuesta F 0 E 0A medida que el criterio para el reforzamiento es gradualmente modificado, las respuestas varían de forma correspondiente y, eventualmente, aparecen conductas que nunca habían aparecido.
Los métodos de operante libre permiten observación continua. El organismo determina la frecuencia de su respuesta instrumental y se observan los cambios en la probabilidad de la conducta a lo largo del tiempo. Tasa de ocurrencia: más probable, tasa alta; improbable, tasa baja.
Estímulo apetitivo = consecuencia placentera. Estímulo aversivo = consecuencia molesta. Contingencia positiva: la respuesta instrumental puede proporcionar el estímulo. Contingencia negativa: la respuesta instrumental puede retirar o eliminar un estímulo. El aumento o disminución en la tasa de respuesta depende de la contingencia respuesta-consecuencia y de la naturaleza de la consecuencia.
Procedimiento en que la respuesta aproxima o produce un estímulo apetitivo. Contingencia positiva entre la respuesta y el estímulo positivo. Produce un aumento en la tasa de respuesta.
La respuesta instrumental produce o aproxima un estímulo molesto o aversivo. Contingencia positiva respuesta-consecuencia. Disminución en la tasa de respuesta.
Deriva instintiva: las respuestas extras que se desarrollan en situaciones de reforzamiento con comida, son actividades que los animales realizan instintivamente cuando obtienen comida. Estas respuestas naturales son muy fuertes y compiten con las respuestas requeridas.
Consecuente con los sistemas de conducta : cuando un animal está privado de comida y se encuentra en una situación donde podría encontrarla, su sistema de alimentación se activa y se dedica a actividades relacionadas con la comida.
compatibilidad de la RI con la organización preexistente del sistema.
conductuales del sistema que se activa.
determinado reforzamiento.
un sistema de conducta. Estudio con hámsters de Shettleworth F 0 E 0la teoría de los sistemas de conducta predice que el reforzamiento de comida podría producir incrementos en actividades como cavar, escarbar o erguirse, pero no en lavarse la cara y rascarse. Condicionamiento clásico F 0 E 0otra forma de diagnosticar si una R es parte de un sistema de conducta. Experimento de Timberlake y cols. F 0 E 0la deriva instintiva se desarrolla con CC y CI. Representa l aintrusión de respuestas apropiadas al sistema de conducta activado durante el CI.
Varios efectos del reforzador determinan sus efectos sobre el aprendizaje y la ejecución de la conducta instrumental.
Un cambio en la cantidad del reforzador puede hacerlo cualitativamente distinto.
respuesta.
dependen del programa de reforzamiento y otros factores.
La efectividad de un reforzador depende de sus propiedades y de cómo se compara con otros experimentados por el individuo. Fundamentación del modelo Rescorla-Wagner
una recompensa mala
recompensa. Crespi F 0 E 0los efectos de una nueva recompensa aumentaron por la experiencia previa con una recompensa contrastada. Contraste positivo: alta respuesta por recompensa favorable resultado de una experiencia anterior con una consecuencia menos atractiva (pareciendo especialmente buena si se ha experimentado una consecuencia peor). Contraste negativo: respuesta disminuida por una recompensa desfavorable por una experiencia anterior con una consecuencia mejor (pareciendo especialmente mala si se ha experimentado una recompensa mejor). Contraste conductual simultáneo: se dan si las condiciones de recompensa se modifican una y otra vez con una clave diferente señalando cada condición de recompensa. Los diferentes efectos de contraste están mediados por diferentes mecanismos:
obtención de una recompensa inesperadamente pequeña.
Los efectos emocionales de este cambio no se dan inmediatamente y son seguidos por una acomodación a la continua disponibilidad de sólo una recompensa pequeña.
Un organismo debe organizar su conducta organizando su tiempo y energía. Para ser eficiente hay que ser sensible a la relación respuesta-reforzador:
Tipos de relaciones respuesta-reforzador:
respuesta.
para la ocurrencia del reforzador.Los factores temporales y causales son independientes.
El reforzamiento inmediato es preferible al demorado. El aprendizaje instrumental se altera demorando el reforzador tras la ocurrencia de la respuesta instrumental. La respuesta decae bastante rápido con incrementos en la demora del reforzamiento. ¿Por qué es el condicionamiento instrumental tan sensible a la demora del reforzamiento? Porque para asociar el R1 con el reforzador, el organismo tiene que poder distinguir de alguna forma R1 de otras respuestas que realiza durante el intervalo de demora. Cómo resolverlo: conectando mejor la RI con el reforzador demorado, mediante:
previamente asociado con el reforzador).
las otras. No puede explicarse por reforzamiento secundario o condicionado porque el estímulo de marcado se presenta tras respuestas correctas e incorrectas. ¿Cuáles son las consecuencias del reforzamiento independiente de la respuesta que podrían contribuir a los efectos perjudiciales del reforzamiento demorado?
contexto experimental sin ser señalado por la respuesta, lo que bloqueará la asociación. Los procedimientos que interrumpen el condicionamiento de claves contextuales ayudan a neutralizar los efectos perjudiciales del reforzamiento demorado en el CI.
Incluso con una relación causal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durante demasiado tiempo. La contigüidad es el factor crítico, más que la contingencia.
Conducta supersticiosa: responder como si la conducta controlara la entrega del reforzador, cuando es proporcionado independientemente de la conducta. Explicación: reforzamiento accidental o adventicio: emparejamiento accidental de una respuesta con la entrega del reforzador. Skinner sugería que una contingencia positiva respuesta-reforzador no es necesaria para el CI.
Contigüidad puesta en duda por Staddon y Simmelhag. Respuestas terminales y de ínterin. No encontraron reforzamiento accidental. La entrega de comida influía sólo en la fuerza de las respuestas terminales.
Déficit de aprendizaje porque los animales aprenden a ser inactivos. La descarga inescapable disminuye el movimiento motor y a esto se deben los posteriores déficits de actuación. Hay también situaciones en las cuales los efectos de aprendizaje no son debidos a la supresión del movimiento.
La descarga inescapable hace que los animales presten menos atención a sus acciones. Experimento Maier, Jackson y Tomie F 0 E 0se enfrentan al mismo problema que un animal que recibe reforzamiento demorado. Podría ser manipulado con los mismos procedimientos:
interrumpido su escape posterior si cada R es marcada con un estímulo externo. Conclusión: una de las funciones del déficit de aprendizaje es una reducción de la atención a las respuestas que el animal realiza.
¿Por qué la exposición a la descarga no es tan dañina si el animal puede realizar respuestas de escape? Conducta de escape: la respuesta instrumental tiene como consecuencia la terminación de un estímulo aversivo. Pero también hay relaciones especiales estimulares:
por la R experimentados al comienzo de la R de escape, justo antes de que la descarga se retire.
experimentados cuando el animal completa la R, justo después de que la descarga se haya retirado al comienzo del intervalo entre ensayos. Son seguidas por el intervalo entre ensayos (ausencia de descarga), por lo que se convierten en inhibidores condicionados del miedo Es más probable que las claves contextuales de la cámara en la que se administran las descargas queden condicionadas para elicitar miedo cuando las descargas son inescapables. Respuesta de escape: indica que la descarga se está terminando. Las diferencias en cómo los animales afrontan la estimulación aversiva puede ser resultado de diferencias en las relaciones de señal.