Scarica Plasticità e apprendimento - Parte 2 e più Appunti in PDF di Psicologia dell'Apprendimento solo su Docsity! Le cause che portano un animale a diventare un sign tracker piuttosto che un goal tracker non sono chiare, ma è possibile siano coinvolte differenze genetiche. Autoshaping: super salienza del CS Sebbene non esista una spiegazione univoca del autoshaping, si ipotizza che il CS acquisisca una salienza o valore motivazionale spropositato tanto da innescare comportamenti consumatori compulsivi (come quelli presenti nella dipendenza). Questa interpretazione è coerente con la presenza dell’autoshaping anche nella procedura di omissione. Bolles (1972) propone che l’azione del reward non riguardi principalmente rinforzare la relazione tra S e R o tra S e S: il reward porterebbe l’animale ad imparare che esiste uno stimolo (CS) che anticipa l’arrivo di un altro stimolo (il reward stesso) con proprietà edoniche e motivazionali. Rispetto a Pavlov enfatizza il fatto che il CS genera un’aspettativa di tipo edonica e motivazionale circa l’arrivo del reward. La teoria degli incentivi motivazionali viene ulteriormente sviluppata da Bindra (1978) – secondo Bindra l’apprendimento della relazione CS - Reward riguarda il fatto che CS acquisisce le stesse proprietà edoniche e motivazionali del reward, CS evoca nell’animale lo stesso stato motivazionale evocato dal reward ← questo spiega perché, nell’autoshaping, l’animale tenti di consumare CS, come farebbe con il reward – CS diventa un incentivo ad agire, così come lo è il reward (prima di esser consumato!) Attraverso meccanismi di tipo Pavloviano le caratteristiche incentivanti (proprietà motivazionali ed edoniche) del reward vengono acquisite dal CS – Il CS è percepito come se fosse un reward. Toates (1986) e la teoria degli incentivi: sottolinea il fatto che i reward edonici sono l’oggetto della nostra motivazione: il reward edonico è quindi uno stimolo incentivante che produce sensazioni piacevoli quando ottenuto ( un buon cibo, una bibita rinfrescante, un partner sessuale attraente, etc) esempio: pizza = US l'odore di pizza = CS CS sta funzionando da motivatore prima di essere consumato; tutti questi eventi o stimoli motivano all'azione prima di essere conseguiti. La prospettiva: l'azione non è guidata solo dato che c'è stato un rinforzo quando l'ho fatta in passato, bensì funge anche da motivatore perché mi spinge ad agire. Toates nota che il valore edonico degli incentivi non è assoluto, ma dipende dallo stato motivazionale: - quanto ci può piacere un cibo dipende dal fatto che siamo affamati o meno, cioè dallo stato motivazionale: se abbiamo fame un panino sembra buonissimo; se abbiamo appena pranzato un panino può essere nauseante. Cabanac (1979) infatti aveva dimostrato che i soggetti umani giudicano la stessa soluzione zuccherina più o meno buona a seconda del livello di fame. Toates aggiunge un aspetto importante alla teoria originariamente sviluppata da Bolles e Bindra: se le pulsioni o motivazioni aumentano il potere incentivante del reward, allo stesso modo il reward può aumentare il livello di motivazione ← ecco perché assaggiare una patatina può portare a mangiare tutto il pacchetto, anche se non avevamo fame. Inoltre, il proprio stato può essere alterato dal reward degli incentivi, l'effetto è bidirezionale. Come abbiamo visto, però, anche i CS possono assumere le proprietà di un reward, quindi, anche un CS può essere in grado di funzionare come incentivo che genera una motivazione. I simboli pubblicitari funzionano in questo modo: sono dei CS che innescano un desiderio per il reward. Quando un CS innesca un desiderio e la motivazione (Weingarten, 1983) Weingarten nota che normalmente si ritiene che un organismo cerchi il cibo quando ha fame, cioè è in uno stato di deficienza nutrizionale: simile alla teoria drive-reduction di Hull Alcune teorie (Toates, Bindra) suggeriscono però che non sia solo la fame a motivare l’animale a mangiare, ma anche alcuni stimoli esterni associati al cibo. Weingarten vuole quindi testare questa ipotesi, cioè che dei CS possano controllare quando e se l’animale cerca e consuma il cibo, a prescindere dallo stato di fame: – Prima fase (11 giorni) di condizionamento Pavloviano: • CS+ (suono) precede rilascio del latte (US) in una ciotola – Seconda fase di test (21 giorni): il ratto ha pieno accesso al cibo tramite un dispenser durante tutto il giorno, ma una volta al giorno viene presentato anche il CS+ e rilasciato altro latte nella ciotola I risultati mostrano che pur essendo sazio il ratto consuma il cibo rilasciato nella ciotola quando è preceduto dal CS+ Conduce poi un secondo esperimento simile al primo, ma nella fase di test ci sono giorni in cui il CS+ è presente e giorni in cui è assente. La quantità di latte assunto è simile nei due giorni, ma nei giorni in cui è presente il CS+ il 20% del latte viene assunto dalla ciotola dopo il CS+ Il ratto quindi compensa la quantità di cibo ingerito in funzione di quella assunta tramite l’incentivo CS. I risultati del lavoro di Weingarten dimostrano in modo convincente che la motivazione ad assumere cibo non è determinata solo dalla fame, ma anche da stimoli ambientali (incentivi) che hanno acquisito un loro valore motivazionale attraverso un condizionamento Pavloviano. La teoria degli incentivi: conclusioni – Il ruolo principale del reward non è quello di rinforzare una risposta ma di promuoverla – Il reward è quindi un incentivo all’azione – Il livello di motivazione modula il potere edonico del reward – Il reward però può alterare il livello di motivazione – Stimoli condizionati (CS) possono assumere le stesse proprietà del reward, innescando un desiderio (motivazione) per il reward Reward, Incentivi e Rinforzi: riassunto – Il reward è un oggetto che ha un valore edonico positivo per un organismo: il reward può essere primario (cibo) o condizionato (soldi) attraverso meccanismi pavloviani; può essere inteso sia come incentivo sia come rinforzo – L’incentivo è un oggetto che genera un desiderio o motivazione nell’animale: l’incentivo può essere primario o condizionato – Il rinforzo è un oggetto che aumenta la probabilità che l’animale emetta una risposta: il rinforzo può essere primario o condizionato Incentivi, reward, pulsioni e motivazione Possiamo concludere che la motivazione può essere innescata da tre fattori: Per esempio, se penso il concerto sarà fantastico, posso esser disposto a fare 1000 km per vederlo oppure, posso esser disposto a pagare 200 euro per un vino che mi aspetto sia eccellente. Quindi spendere o investire (tempo, denaro, affetti) molto per ottenere qualcosa che ci aspettiamo ci piaccia molto è assolutamente razionale – se poi l’aspettativa non sarà soddisfatta questo non cambia la razionalità del comportamento nel momento in cui è stato messo in atto. Un comportamento è irrazionale quando non è giustificato dall’aspettativa di quanto potrà piacere il risultato. Decidere di spendere 1000 euro per una pizza, quando non stiamo morendo di fame, non è un comportamento razionale, dato che la pizza non può mai valere quella cifra. Decidere di mangiare una torta intera se soffriamo di diabete non è sensato → Si osserva quando l’azione che si compie non giustificata dal risultato atteso. – decision utility: la scelta di agire per ottenere un certo risultato – predicted utility: aspettativa circa il valore del risultato Comportamento razionale – Decision utility = Predicted utility La decisione di agire è commisurata al valore atteso del risultato Comportamento irrazionale – Decision utility > Predicted utility La decisione di agire è spropositata dato il risultato atteso La dipendenza si caratterizza spesso per il fatto che i soggetti fanno spesso scelte irrazionali: decision utility > predicted utility: il soggetto “dipendente” può decidere di rubare nel posto di lavoro per ottenere i soldi per la droga, a costo di perdere il lavoro: se chiesto ad un dipendente di eroina da tanti anni quanto provi ancora piacere nell’assumerla, dirà che molto poco, nonostante ciò, non smette di farlo. Vantaggi del modello Teleologico: I riflessi controllano parte del nostro comportamento, e lo fanno in modo veloce, però il sistema teleologico fornisce un grosso vantaggio all’organismo, perché consente un controllo flessibile del comportamento. Consente di cambiare rapidamente il comportamento in funzione di come variano gli stati motivazionali e il valore degli obiettivi; consente quindi un comportamento razionale perché adatto alla situazione e ai suoi cambiamenti. Flessibilità del modello teleologico: quando lo stato motivazionale cambia → un animale, quando era assetato, ha appreso due rotte diverse per raggiungere due diverse sorgenti d’acqua, una con molto sale e una povera di sale. Se l’animale ora si trova senza sali minerali, è in grado di scegliere la rotta verso la pozza salata? Se le sue azioni sono controllate da un meccanismo S-R la rotta presa sarà determinata solo dagli stimoli ambientali. Se opera un modello teleologico saprà invece quali sono le conseguenze delle sue azioni, e quindi saprà cosa aspettarsi da una rotta rispetto all’altra. La rivalutazione degli obiettivi - l’animale ha appreso due diverse rotte per raggiungere la stessa pozza d’acqua; Successivamente arrivando alla pozza dalla rotta A scopre che l’acqua è ora inquinata. Cosa accade se l’animale si trova sulla rotta B? • Un meccanismo S-R lo porterà nuovamente alla pozza • Un sistema teleologico non lo farà proseguire perché l’animale sa che arriverebbe alla pozza inquinata. Il sistema teleologico consente quindi una grande flessibilità nel controllo del comportamento e nell’interazione con l’ambiente, quindi non è solo l’ambiente che controlla il comportamento (S-R), ma se ho un modello teleologico, sono le motivazioni e le conoscenze circa le conseguenze delle proprie azioni a determinare come l’animale agisce nell’ambiente. Gli umani sono capaci di comportamenti teleologici: per esempio possiamo decidere di non mangiare il nostro dolce preferito se scopriamo di avere la glicemia alta. Sapere se gli animali sono capaci di azioni e non di risposte è cruciale per due motivi: – per poter usare i modelli animali per lo studio della dipendenza anche nell’essere umano – per capire il ruolo di motivazioni, azioni e abitudini nella dipendenza Criteri per definire il condizionamento strumentale un’azione e non una risposta L’animale deve possedere una rappresentazione della relazione causale tra la sua azione e la comparsa del reward. Deve “sapere” che agendo in quel modo otterrà il reward. L’animale deve possedere una rappresentazione del valore motivazionale del reward → deve “desiderare” quel reward perché soddisfa un suo bisogno Come possiamo capire se l’animale sa che agendo in un certo modo otterrà il reward? – il problema è che non possiamo interrogare verbalmente l’animale. La soluzione al problema è stata proposta da Adams & Dickinson (1981) attraverso il paradigma di svalutazione del rinforzo Instrumental responding following reinforcer devaluation Il paradigma di svalutazione del rinforzo: la pressione della leva è un gesto automatico (risposta) alla presenza della leva (stimolo) che è stato rinforzato, oppure è un’azione dettata dalla conoscenza della relazione causale tra pressione leva e arrivo del reward? L’esperimento è diviso in 4 fasi coinvolge 2 gruppi di ratti (Paired e Unpaired) Fase 1: condizionamento classico per premere una leva, con reward in cibo rosa o blu (rispettivamente A o B) Nella fase 2 il cibo diventa un CS predittore di uno stato di malessere: a tutti i ratti viene causato il malessere dopo la presentazione del cibo rosa, ovvero reward A. Diventa quindi un CS avversivo . Fase 3: test in estinzione, ripresento al ratto la leva e vedo se la preme. Fase 4: gli lascio premere la leva, e gli do il reward se la preme, come nella fase 1. La logica – Se nel condizionamento strumentale esiste una rappresentazione della relazione A->O, allora non c’è ragione per emettere un’azione se porta ad ottenere un outcome spiacevole. – Se invece si tratta di una mera relazione S->R, la risposta evocata dallo stimolo è indipendente dal fatto che il rinforzo sia stato svalutato dopo l’apprendimento. Risultati: I ratti del gruppo P (reward svalutato) non sono interessati a premere la leva per ottenere un alimento che è diventato un CS avversivo. Questo è evidente sia in fase di estinzione sia in fase di riacquisizione del learning. I ratti che sanno che premendo quella leva arriverà probabilmente un cibo che gli fa star male, evitano di premerla. I ratti A non sono disposti a premere la leva per ricevere un cibo che hanno imparato a diffamare. Si noti che l’animale non ha mai avuto occasione di associare la pressione della leva con il malessere causato dalla iniezione di LiCl. L’animale non ha mai messo in relazione in malessere con la pressione della leva, bensì ha creato un nesso mentale: NO: premo la leva - sto male BENSI’: premo la leva - arriva un cibo che mi fa star male Conclusioni: • I risultati suggeriscono che i ratti sanno che premendo la leva arriverà un certo reward. Infatti, quando in un secondo momento questo reward viene reso indesiderabile, i ratti riducono molto la pressione della leva. • Questo significa che posseggono una rappresentazione che associa tra loro stimolo (la leva) risposta (pressione della leva) e conseguenze dell’azione (arrivo di un certo outcome). Quindi anche un semplice ratto è in grado di mostrare un comportamento strumentale guidato in modo teleologico – tuttavia nemmeno per gli esseri umani si può sostenere che tutti i comportamenti siano vere azioni. Anche noi mostriamo comportamenti stereotipati del tipo S-R. In alcuni casi è addirittura necessario che ci siano tali gesti automatici, come quando impariamo a guidare l’auto in modo efficiente. Nella letteratura sull’essere umano si distingue tra processi controllati e automatici. Dalle azioni alle abitudini: il ruolo della pratica – è possibile che nel condizionamento strumentale il passaggio da un comportamento controllato di tipo teleologico ad uno automatico regolato dalle abitudini avvenga attraverso una pratica estesa → la ripetizione di un’azione può trasformarla in una risposta. Scoprire se la pratica può trasformare un comportamento guidato da conoscenze e aspettative, in uno automatico o abitudinario che è indipendente dal valore del rinforzo, è potenzialmente importante per spiegare in parte la dipendenza – quando un’azione diventa un’abitudine quest’ultima potrebbe essere meno sensibile al valore dell’obiettivo o rinforzo che la segue. L’abitudine rende quindi insensibili al reward? Un lavoro di Adams (1982) tenta di dare una risposta a questa domanda: LA TEORIA EDONICA A DUE STATI – esistono varie formulazioni della teoria, che vanno sotto i nomi di: • Teoria del piacere/dolore • Teoria dei rinforzi positivi/negativi • Teoria dell’omeostasi edonica • Teoria dei processi opponenti • Teoria della dis-regolazione edonica Il principio guida di questa teoria è che le persone assumano la droga per due motivi: • per il piacere legato all’assunzione della droga • per evitare i sintomi spiacevoli dell’astinenza In particolare, i due processi controllerebbero fasi distinte: - le persone iniziano a drogarsi per provare il piacere della droga → successivamente continuano in modo compulsivo per evitare il malessere legato all’astinenza La teoria edonica e astinenza – i sintomi da astinenza variano in funzione del tipo di droga e possono comprendere reazioni sia di tipo neurovegetativo sia affettivo: • Tremore • Depressione • Aumento sudorazione • Ansia • Aumento frequenza e • Irritabilità pressione cardiaca • Dolore (crampi allo stomaco) • Apatia Un caso specifico: la teoria dei processi opponenti (Solomon & Corbit, 1974) L’assunzione di droga genera dei processi fisiologici (rilascio di neurotrasmettitori, tipo DA) e psicologici (reazione di piacere), che sono seguiti da processi in direzione opposta (riduzione DA, e malessere). Questi processi opposti, almeno a livello fisiologico, sono tentativi di ristabilire l’equilibrio o omeostasi nel sistema (p.e. quello dopaminergico). Con l’assunzione ripetuta i processi positivi si riducono (assuefazione) mentre quelli negativi si amplificano (sensibilizzazione) nel tempo. La dipendenza si sviluppa come tentativo di ridurre gli effetti negativi, con il risultato di distruggere sempre più l’omeostasi nel sistema DA. Molte evidenze neurobiologiche indicano che le droghe sono in grado di produrre due tipi di plasticità neurale, che agiscono contemporaneamente e portano a due tipi di adattamenti: • assuefazione (abituazione), per cui le sensazioni di piacere diminuiscono nel tempo, portando ad un aumento graduale della dose; • sensibilizzazione, per cui la stessa dose produce nel tempo effetti sempre maggiori, per esempio aumentando sia i sintomi da astinenza, sia la risposta di desiderio della droga alla vista di alcuni stimoli che sono collegati alla droga. La causa principale della dipendenza sarebbe il fatto che la droga altera permanentemente l’equilibrio del sistema DA. Con l’uso prolungato si crea assuefazione (tolleranza) ai sintomi piacevoli, ma aumentano quelli legati all’astinenza, che portano il soggetto a cercare altra droga (e dosi maggiori). Il sistema DA e affettivo/emotivo perde il suo equilibrio. Un punto chiave di questa teoria è che la DA è ritenuta essere il neurotrasmettitore del piacere (Wise, 1985) - vedi ultima lezione basi neurali Disregolazione del sistema del piacere: assuefazione al piacere della dose, più sensibilizzazione nella risposta di compensazione inibitoria della DA con aumento del malessere. Sintomi dolorosi dell’astinenza. Dal punto di vista cognitivo la teoria chiama in causa meccanismi di condizionamento strumentale L’assunzione della droga sarebbe regolata da meccanismi di rinforzo positivo e negativo. Il meccanismo di rinforzo positivo è predominante all’inizio dell’uso della droga, la quale agisce come rinforzo positivo producendo una sensazione piacevole dopo l’uso e quindi rinforzandolo. Il meccanismo di rinforzo negativo entra in gioco con l’uso prolungato, quando diventano dominanti i sintomi spiacevoli dell’astinenza. In questo caso la droga agisce come rinforzo negativo eliminando la condizione spiacevole. La spiegazione che invoca i due meccanismi di rinforzo, positivo e negativo, è intuitiva e coerente con il senso comune: • ci si droga per piacere • si continua per evitare i sintomi spiacevoli dell’astinenza. Questa spiegazione presenta tuttavia alcuni problemi… Spiegazione del rinforzo negativo: evidenze critiche Gli psicostimolanti, come anfetamine o derivati, e gli allucinogeni (LSD), generano una forte dipendenza psicologica (desiderio della droga) a fronte di scarsi sintomi fisici da astinenza. Il forte desiderio di droga non dipende dal fatto che si stia particolarmente male senza. critiche. Farmaci che possono produrre forti sintomi da astinenza, come gli antidepressivi, non generano dipendenza e uso compulsivo. Le ricadute sono frequenti anche dopo che i sintomi da astinenza sono terminati da molto tempo. Quindi il meccanismo di rinforzo negativo non pare in grado di spiegare il bisogno di drogarsi quando la condizione spiacevole causata dall’astinenza è finita. Reinstatement of heroin self-administration habits: morphine prompts and naltrexone discourages renewed responding after extinction - Stewart & Wise, 1992 Stewart & Wise (1992) discutono la possibilità che nella dipendenza la droga sia assunta per eliminare i sintomi da astinenza – secondo la teoria dell’omeostasi edonica il meccanismo del rinforzo negativo è molto potente perché agirebbe curando i sintomi. Ipotesi: se è vero che la dipendenza è mantenuta attraverso un meccanismo di rinforzo negativo, allora sostanze che inducono sintomi di astinenza dovrebbero essere in grado di promuovere l’uso della droga. L’esperimento comprende 3 fasi: allenamento, estinzione, riacquisizione Nell’allenamento (cond strumentale) gli animali imparano a autosomministrarsi dell’eroina. In estinzione viene tolta la droga Prima della riacquisizione vengono iniettate 3 diverse sostanze: • Soluzione salina • Eroina (basso dosaggio) • Naltrexone: antagonista dell’eroina che si lega fortemente ai recettori degli oppiacei producendo sintomi di astinenza Conclusioni Contrariamente a quanto predetto dalla teoria degli processi opponenti non sembrano essere i sintomi di astinenza che motivano l’uso continuativo della droga. Questi risultati sono un grosso problema per la spiegazione basata sul meccanismo di rinforzo negativo. Eliminare i sintomi di astinenza non è la ragione principale nel mantenimento della dipendenza e nelle ricadute dopo fine astinenza. Un risultato importante è il fatto che l’iniezione priming era basata su una piccola dose di eroina, che però ha favorito la ripresa dell’uso di eroina: – questo indica che è illusorio e pericoloso, per un individuo disintossicato, pensare di poter controllare l’assunzione della droga con bassi dosaggi senza diventarne ancora dipendente. • dopo la disintossicazione anche una sola piccola dose di droga, o una sigaretta, o un bicchiere di alcol, può reinnescare la dipendenza; • in realtà come vedremo basta molto meno… Spiegazione del rinforzo positivo: evidenze critiche Quando si considera una possibile spiegazione del perché le droghe producono dipendenza bisogna evitare un argomento circolare del tipo: le persone assumo droga perché la droga è un rinforzo positivo L’argomento è chiaramente tautologico, perché equivale a dire: le persone assumo droga perché la droga promuove l’assunzione della droga. Spiegare la dipendenza dicendo che la droga è un forte rinforzo è solo una ri-descrizione del risultato, non una spiegazione dello stesso. La spiegazione che deve esser data è “perché” la droga è un rinforzo positivo Tipicamente la spiegazione che viene data è che la droga è un rinforzo positivo perché induce uno stato edonico (piacere/euforia), quindi la persona per riprovare lo stato di piacere continua ad assumere la droga → i sono tuttavia una serie di problemi legati alla spiegazione dell’effetto edonico (euforia/piacere). 1) Se consideriamo la quantità di problemi che la dipendenza comporta, come distruzione relazioni affettive, perdita lavoro, disgregazione familiare, problemi economici e di salute, etc., è difficile credere che la dipendenza (ricerca compulsiva della droga) sia motivata dal raggiungimento di un breve stato di benessere. 2) Ci sono droghe, ad esempio la nicotina, la cui assunzione non produce un grande stato di piacere/euforia, ma che sono in grado di produrre notevole dipendenza. 3) Alcune ricerche dimostrano che c’è una scarsa correlazione tra lo stato soggettivo edonico e l’assunzione di droga: • lo stato edonico tipicamente diminuisce con l’uso prolungato, mentre il bisogno o desiderio di droga aumenta - quindi il desiderio di droga dovrebbe esser maggiore all’inizio, quando il piacere è maggiore, e non dopo un uso prolungato quando il piacere diminuisce. 4) Lamb et al. (1991) hanno dimostrato che le persone sono disposte a lavorare per dosi di morfina così basse che non producono effetti piacevoli: The reinforcing and subjective effects of morphine in post- addicts: a dose-response study Nello studio sono stati coinvolti 5 tossicodipendenti da eroina In ogni sessione i soggetti ricevano 6 iniezioni, 4 di morfina e 2 di placebo. I soggetti non sapevano quale iniezione venisse loro fatta. della siringa, del posto dove si consuma la droga, delle persone che spacciano, etc.) Dickinson e colleghi si chiedono quindi se è vero che le droghe, per esempio l’alcol, facilitino lo sviluppo di abitudini. Dato che la rappresentazione del reward non ha alcun ruolo nei meccanismi S-R, una insensibilità al valore dell’outcome suggerisce la presenza di una abitudine – viceversa, una sensibilità alla svalutazione dell’outcome suggerisce la presenza di un comportamento teleologico guidato da obiettivi. Il condizionamento strumentale rinforzato dalle droghe è più resistente alla svalutazione dell’outcome rispetto a quello rinforzato da altri reward naturali, come il cibo? Gli autori mettono quindi a confronto due tipi di reward, dei pellet di cibo contro una soluzione con etanolo, e vogliono vedere in che modo agiscono i ratti quando avviene una svalutazione del reward. All'inizio è un gruppo unico, imparano a premere una leva per ottenere il pellet di cibo e un'altra per il pellet di alcol. Post training abbiamo i ratti divisi in due gruppi e abbiamo la svalutazione del reward con iniezione di cloruro di sodio. Dopo, i due gruppi vengono messi di fronte al CS (la leva). Risultati: osservazione preliminare Durante il condizionamento strumentale i ratti rispondono maggior- mente al pellet che all’etanolo. Quindi bisogna tener conto di questa differenza per intepretare i dati dopo la svalutazione del rinforzo. Baseline: i due reward non sono analoghi nella loro capacità di risposta, inizialmente. I ratti per quali è stato svalutato il reward pellet premono meno la leva corrispondente rispetto ai ratti del gruppo ethanolo. Risentono quindi della svalutazione del reward. I ratti etanolo continuano a premere la leva per il cibo perché non gli è mai stata svalutato questo reward. I ratti per quali è stato svalutato il reward ethanolo premono la leva corrispondente tanto quanto I ratti del gruppo pellet. Non risentono quindi della svalutazione del reward ma cercano di riottenerlo La svalutazione dell'etanolo non ha cambiato la disponibilità dei ratti (alcolisti) ad ottenere il reward, è uguale a quella dei ratti con svalutazione per cibo (se non hanno subito la svalutazione per l'etanolo, quindi la premono senza timore -fungono da baseline per paragonare il gruppo etanolo). Conclusioni – la differente resistenza alla svalutazione con i due tipi di rinforzi, dimostra che rispetto alla ricerca del cibo, la ricerca dell’alcol è più facile si trasformi in un’abitudine governata da meccanismi S-R. In questo modo, anche se poi l’alcol perde di valore perché piace meno o addirittura crea malessere viene assunto lo stesso. Nell’ottica della dipendenza questo può significare che la dipendenza da alcol si può mantenere anche quando l’assunzione di un alcolico non è più vissuta come un’esperienza desiderabile e piacevole. Apprendimento anomalo implicito: evidenze critiche di un ruolo dell’abitudine Robinson & Berridge (2003) discutono varie ragioni per cui la dipendenza non si basa su un meccanismo SR 1) assumere che un’abitudine equivalga a un automatismo obbligatorio è sbagliato. Un’abitudine, per quanto forte, non implica una compulsione. Ci sono molti esempi di comportamenti automatici o abitudinari che mettiamo in atto quotidianamente ma che non sono compulsioni: guidare l’auto, lavarsi i denti, leggere, allacciare le scarpe… 2) Nessuno sacrificherebbe la sua vita, le sue relazioni affettive, i suoi guadagni, la sua salute per un’abitudine, mentre questo avviene nella dipendenza 3) Il comportamento di un drogato quando deve cercare e procacciarsi la droga non è necessariamente così stereotipato come nel caso di una risposta automatica quale potrebbe diventare quella di un ratto che in laboratorio preme una leva per una iniezione di eroina… • spesso la ricerca della droga richiede di coordinare attività complesse, come rubare o elemosinare soldi, vendere dei beni, cercare uno spacciatore, etc. Queste attività richiedono una pianificazione e quindi un sistema flessibile → non possono essere sostenute da una abitudine. Apprendimento anomalo implicito: S-S Un’altra possibilità è che la dipendenza si basi su di un meccanismo di condizionamento Pavloviano, per cui alcuni CS ambientali attivano la rappresentazione della droga (US) e delle relative sensazioni edoniche (CR). Una volta che il CS ha attivato le reazioni tipiche prodotte da US, nel soggetto nasce il desiderio di renderli reali → mette quindi in atto dei comportamenti per riprovare (edonia) o evitare (sintomi da astinenza) quelle sensazioni. Evidenze da studi sugli animali, il lavoro di Ciccocioppo et al. (2001) • Obiettivo: verificare se uno stimolo condizionato può attivare il desiderio di droga anche dopo astinenza: Cocaine-predictive stimulus induces drug-seeking behavior and neural activation in limbic brain regions after multiple months of absence: reversal by D1 antagonists. Allenano dei ratti a premere una leva per ottenere cocaina: • se assieme alla leva è presente un CS rosso allora la pressione porta ad una iniezione di Cocaina; • se è presente un CS verde la pressione porta ad una iniezione di soluzione salina (placebo). Dopo estinzione, quindi dopo disintossicazione, verificano la forza del CS nel promuovere il desiderio di cocaina - viene valutato come disponibilità alla pressione della leva. Il lavoro di Ciccocioppo et al. (2001) – Conclusioni Stimoli presenti durante la fase di somministrazione della droga funzionano come potenti promotori del comportamento di ricerca della droga quando vengono incontrati, anche dopo molti mesi di disintossicazione Importanti implicazioni per la dipendenza: • è facile ricadere nell’uso di droga anche dopo disintossicazione se si è esposti a stimoli (frequentazione di luoghi/oggetti o persone) presenti quando ci si drogava; • questi stimoli funzionano come CS che attivano il desiderio della droga attraverso un meccanismo Pavloviano – Attenzione: Secondo questa teoria il desiderio nasce dall’attivazione del ricordo delle sensazioni piacevoli(spiacevoli) La modulazione della sensibilizzazione – Alcuni studi hanno dimostrato un ruolo dei processi di apprendimento associativo nella sensibilizzazione agli psicostimolanti (p.e. cocaina, anfetamine) – Abbiamo già visto che la droga può dar luogo ad un processo di adattamento neurale che è noto come tolleranza o assuefazione La sensibilizzazione si riferisce al processo opposto, e quindi al fatto che la ripetuta somministrazione di droga può portare all’aumento di alcuni effetti della droga. Questo avviene perché alcuni neuroni cambiano le loro sinapsi a causa della somministrazione della droga, che quindi induce plasticità neurale nel sistema. Lo studio di Anagnostaras & Robinson (1996): Sensitization to the psychomotor stimulant effects of amphetamine: modulation by associative learning Gli autori voglio studiare se gli effetti di sensibilizzazione prodotti dalla cocaina dipendono dall’ambiente nel quale viene assunta la droga. In altre parole, se gli effetti sensibilizzanti della droga sulla locomozione sono contesto dipendenti Importante per capire quando gli stimoli ambientali possano modulare gli effetti della droga. • Una prima fase di trattamento e una seconda di test In entrambi le fasi i ratti vengono messi in un rotatore per misurare la loro attività motoria Sono usati 3 gruppi di ratti Ratti che dalla gabbia (H) vengono portati nel rotatore (R) e qui ricevono una iniezione salina (R-H-). Ratti che dalla gabbia vengono portati nel rotatore e qui ricevono una iniezione di cocaina (R+H-). Ratti che dalla gabbia vengono portati nel rotatore. Poi quando sono riportati in gabbia ricevono iniezione di cocaina (R-H+) • Nella fase di test i ratti ricevono nel rotore una iniezione di cocaina prima di iniziare il test. 1) la somministrazione ripetuta (ogni giorno per 10 giorni) della cocaina provoca un effetto di sensibilizzazione: la stessa dose ogni volta che viene somministrata fa aumentare la risposta psicomotoria dell’animale Teoria SM: il desiderio viscerale → un concetto fondamentale della teoria è quello di desiderio viscerale (inconsapevole) o “wanting”: desidero una cosa, ma posso anche non sapere perché! Posso anche desiderare una cosa che non mi piace!!! Secondo gli autori questo concetto va distinto dal desiderio consapevole che è determinato dalla dall’aspettativa che un certo reward ci piaccia. • voglio il gelato perché so che mi piace • in generale, desidero una cosa perché mi piace. La teoria della SM assume che desiderio viscerale e piacere siano due processi distinti e indipendenti: – non è sperimentalmente facile separare desiderio e piacere, ma alcuni lavori hanno fornito evidenze a favore di questa potenziale separazione. Abbiamo già visto il lavoro di Lamb et al. (1991), in cui gli autori hanno dimostrato che le persone sono disposte a lavorare per dosi di morfina così basse da non produrre effetti piacevoli: The reinforcing and subjective effects of morphine in post- addicts: a dose-response study Nel lavoro di Lamb et al. (1991), le persone mostrano il loro desiderio viscerale per la droga decidendo di lavorare (premere la leva) anche se affermano di non essere in grado di apprezzare gli effetti piacevoli della droga. Un ulteriore lavoro di Winkelman et al. (2005) condotto sugli esseri umani dimostra che il desiderio di bere può essere manipolato senza che le persone ne siano consapevoli e senza che ci sia un cambiamento nel loro stato emotivo: Unconscious affective reactions to masked happy vs angry faces influence consumption behavior and judgments of value I partecipanti devono eseguire un compito di classificazione di genere in merito a delle facce – prima della faccia target è presentata una faccia prime, con una espressione positiva, neutra o negativa; – alla fine del compito i soggetti sono invitati a versarsi da bere e bere se lo desiderano, e a valutare il loro stato d’animo. Risultati: Le persone assetate si versano più liquido e ne consumano di più dopo un prime positivo; le persone però non riportano cambiamenti di stato d’animo Le persone non sanno il perchè bevono di più, ma queste facce hanno attivato un maggiore reward nel sistema mesolimbico, non bevono di più perchè si sentono più felici, come si vede dalle dichiarazioni sull'arousal: non c'è un cambiamento consapevole. Conclusioni: si può aumentare il livello di attivazione di strutture del sistema limbico/ricompensa senza che il soggetto ne sia consapevole, e questa maggior attivazione si traduce in un aumento di desiderio inconsapevole di bere. Si aumenta quindi il desiderio viscerale inconscio, senza che la persona abbia un desiderio consapevole di consumare una maggior quantità di bevanda. Teoria SM: desiderio e piacere Non c’è dubbio che di solito il desiderio (viscerale o consapevole) correla con il piacere Abbiamo visto però che può, almeno quello viscerale, essere indipendente. A favore della distinzione tra desiderio e piacere sono anche i risultati di alcuni esperimenti farmacologici condotti sui ratti da Berridge & Robinson (1998): what is the role of dopamine in reward: hedonic impact, reward, learning, or incentive salience? Obiettivi: verificare se la dopamina è il neurotrasmettitore del piacere o del desiderio. – per molti anni la DA era stata considerata il neurotrasmettitore del piacere (Wise, 1985) – gli autori ritengono che invece la DA sia collegata al desiderio del reward, non al piacere. Attraverso la somministrazione di 6-OHDA (idrossidopamina) distruggono nei ratti il sistema dopaminergico del NAcc e del Corpo Striato (Caudato + Putamen) - questo genera totale afagia (i ratti non provano più desiderio per gli alimenti). Verificano quindi se questo si accompagna anche a una riduzione del piacere. Se così fosse allora la mancanza di piacere potrebbe spiegare l’afagia e la DA sarebbe il neurotrasmettitore del piacere. Somministrano ai ratti due sostanze, una soluzione di zucchero (dolce) e una di chinina (amara), e verificano se i ratti mostrano piacere e disgusto per le due sostanze. Per avere queste indicazioni usano i “pattern di reattività al gusto” (reazioni facciali, fisiche), che sono simili in molte specie animali, come l’uomo e il ratto. più’ la soluzione è dolce e più’ piace, anche ai 6-OHDA anche i 6-OHDA discriminano tra dolce e amaro - aumentando la dopamina, aumenta il desiderio del reward, non del piacere provato post assunzione. Conclusioni: I ratti che hanno subito la distruzione del sistema DA mostrano reazioni edoniche appropriate agli stimoli. La DA non è quindi implicata negli stati edonici di piacere/disgusto. Questo risultato dimostra soprattutto che il sistema neurale del desiderio è distinto da quello del piacere. Infatti, i ratti sono afagici (non desiderano il cibo), ma sanno apprezzarlo (piacere) se viene assunto oralmente. I lavori che abbiamo visto sinora ci dicono che piacere e desiderio, soprattutto se viscerale, non sono la stessa cosa. Sebbene i due stati cerebrali spesso correlano (vogliamo quello che ci piace), i due processi sono indipendenti. Questo significa che si può desiderare qualcosa che razionalmente diciamo di non volere o che non ci piace. Sensibilizzazione e desiderio Secondo la teoria l’uso ripetuto della droga provoca, in alcune persone, una sensibilizzazione dei circuiti neurali che mediano il desiderio, soprattutto quello viscerale. Da un punto di vista farmacologico la sensibilizzazione consiste in un aumento degli effetti di una sostanza dopo utilizzo ripetuto: è un processo opposto alla tolleranza e può essere presente in contemporanea, agendo su risposte diverse. Sensibilizzazione da droghe: è prodotta da, anfetamine, cocaina, oppiacei (eroina, morfina), alcol, nicotina. È maggiore se la droga è assunta rapidamente, in modo intermittente, e in dosi progressive – La sensibilizzazione è molto persistente!!! Può durare mesi o anche anni, e questo può spiegare perché le ricadute avvengono anche dopo molti mesi di disintossicazione – è modulata da fattori genetici, ambientali, e da stress Le droghe che producono dipendenza sensibilizzano due principali tipi di risposta: psicomotori e di salienza motivazionale (wanting = desiderio viscerale). Le droghe possono anche produrre effetti di cross-sensibilizzazione: • per esempio, la cocaina può sensibilizzare all’alcol • la droga può rendere ipersensibili allo stress, ma anche viceversa La sensibilizzazione da droghe a livello neurale si traduce in cambiamenti morfologici e funzionali nei circuiti del reward, che cambiano la connettività sinaptica: • una volta sensibilizzati questi circuiti rispondono alla droga liberando più dopamina nel NAcc • i recettori DA dei neuroni del NAcc rispondo in modo più potente • aumenta la lunghezza dei dendriti e il numero di sinapsi L’espressione comportamentale della sensibilizzazione è tuttavia modulata da fattori contestuali • la sensibilizzazione è più evidente in contesti in cui la droga viene assunta (Anagnostaras & Robinson, 1996). Teoria SM: sensibilizzazione psicomotoria Tra gli effetti psicomotori che possono essere sensibilizzati dalla droga troviamo: • Aumento dello stato di attivazione (arousal); • Attenzione; • Attività motoria (agitazione) • Locomozione e esplorazione; • Approccio; • Movimenti stereotipati Un punto cruciale della teoria della salienza motivazionale è che l’uso ripetuto della droga provoca una sensibilizzazione dei circuiti neurali che mediano il desiderio viscerale. Una serie di lavori hanno fornito evidenze coerenti con l’ipotesi della teoria, mostrando che la ricerca di droga aumenta con la sensibilizzazione del “wanting”. Il lavoro di Pierre & Vezina (1998): D1 dopamine receptor blockade prevents the facilitation of amphetamine self-administration by prior exposure to the drug Effetto di sensibilizzazione indotto da nicotina. Il condizionamento funziona anche se l’animale è stato trattato con nicotina e poi rinforzato con morfina. Il naloxone, antagonista degli oppiacei, blocca l’effetto del Fentanyl ma non quello della nicotina. Effetto di sensibilizzazione indotto da Fentanyl, che è un oppioide sistentico Conclusioni • La somministrazione prolungata alla morfina crea sensibilizzazione alla droga. • La sensibilizzazione richiede alcuni giorni prima di manifestarsi comportamentalmente. • Evidenza di cross-sensibilizzazione: da nicotina a morfina - il circuito, che è sempre lo stesso, una volta alterato, è alterato anche per altre sostanze che producono lo stesso effetto • La cross-sensibilizzazione è coerente con altri studi e con le osservazioni cliniche che riportano il fatto che la dipendenza da droghe porta anche ad altre dipendenze: alcol, sesso, soldi, gioco d’azzardo. La droga altera il nucleo accumbens, la stanza acquisisce, per via del condizionamento pavloviano, le caratteristiche di CS, e al ritorno nella stanza, provo un forte desiderio di assumere di nuovo la droga, anche se questo bisogno non era presente prima dell'entrata. A questo punto ribadiamo l’idea principale della teoria della salienza motivazionale: • La droga sensibilizza in modo durevole i circuiti del reward, che attribuiscono valore motivazionale agli stimoli. Una volta che questi circuiti sono stati sensibilizzati rispondono in modo esagerato sia alla droga, sia, attraverso meccanismi di condizionamento S-S, agli stimoli che sono collegati alla droga. • Da un punto di vista psicologico questi stimoli assumono un valore motivazionale enorme, creando desiderio viscerale per la droga e il suo uso compulsivo. Le evidenze viste sinora supportano l’idea principale della teoria della salienza o sensibilizzazione motivazionale. Tuttavia, per esser sicuri che il desiderio viscerale per un reward (come per la droga) nasca dalla sensibilizzazione e dalla percezione di un cue del reward, devono essere escluse spiegazioni alternative. Bisogna escludere che la compulsione sia determinata dal fatto che: • il cue alteri aspetti edonici del reward • il cue crei aspettative cognitive del reward • il cue inneschi abitudini • il cue funzioni come un reward condizionato (cioè rinforzi il comportamento di ricerca della droga): escludibile abbastanza facilmente perché: un rinforzo è tale solo se appare dopo l'emissione di una risposta, quindi il CS non può funzionare come un reward condizionato. Le condizioni sperimentali adeguate sono state proposte nel lavoro di Wyvell & Berridge (2000) Gli autori combinano l’iniezione di anfetamina nel NAcc per produrre un rilascio amplificato di DA, come avviene nella sensibilizzazione, con un paradigma del tipo PIT (Pavlovian Instrumental Transfer) Questo gli consente di valutare l’impatto di un cue (CS) nel generare desiderio viscerale per un reward (US) in una condizione analoga alla sensibilizzazione: Intra-accumbens amphetamine increases the conditioned incentive salience of sucrose reward: enhancement of reward “wanting” without enhanced “liking” or response reinforcement • Prima fase di condizionamento strumentale, con due leve: solo la pressione di una porta allo zucchero: ovvero al reward • Seconda fase di condizionamento pavloviano per due gruppi di ratti: per un gruppo una luce (CS+) precede sistematicamente lo zucchero (condizion), per l’altro gruppo la luce (CSR) viene data in modo random, e quindi non è predittiva dello zucchero (no condizion): la luce deve diventare CS • Terza fase test in estinzione con paradigma PIT, in cui ai ratti, i momenti diversi, viene iniettata l’anfetamina o una salina di controllo: secondo il modello di Rescola, non deve esserci condizionamento, perché la luce qui non è predittore del reward, l'apparizione è casuale. i ratti sono messi di solo se fronte a luci preme in paradigma la leva PIT blu riceve zucchero qui non dobbiamo aspettarci PIT, perché la luce non predice l’iniezione Nella condizione PIT: mentre il ratto si trova davanti alle barre, dovrebbe premerla di più quando la luce si accende; intanto a volte gli viene iniettata anfetamina, altre volte salina. Il PIT sarà potenziato dalla droga? In altre parole, la maggior motivazione indotta al CS può essere resa eccessiva dalla droga? Già nella condizione di PIT di base lui lavora di più per ottenere lo zucchero quando vede la luce, ma iniettandogli anfetamina nel nucleo accumbens, la sua motivazione esploderà per ottenere lo zucchero? (ovvero diventa matto a premere la leva?) L'iniezione di anfetamina mima il processo di sensibilizzazione per il reward zucchero. Risultati: La presentazione del CS+ genera l'effetto PIT: la presenza di CS aumenta la motivazione del ratto a lavorare per il reward. L’effetto si osserva normalmente (iniezione di Salina) È proprio la vista dello stimolo , in una condizione di sensibilizzazione del nucleo accumbens, che comincia a premere esageratamente la barra. In un secondo esperimento gli autori hanno trovato che l’iniezione di anfetamina non aumentava la reazione edonica al reward zuccherato. Le reazioni edoniche o avversive non variano in funzione della dose, l'iniezione dell'anfetamina non aumenta la piacevolezza del desiderio. Nell'esperimento passato si vedeva l'aumento del desiderio, qui viene verificato l'aumento o meno della piacevolezza (che rimane uguale). Conclusioni • La microiniezione di anfetamina nel NAcc aumenta la capacita di un cue Pavloviano di potenziare il lavoro che l’animale è disposto a fare per ottere il reward. • Questo effetto è specifico per il cue (CS+) che era predittivo del reward, ed è specifico per la leva associata al reward. • Quindi, dopo l’aumento del livello di DA nel NAcc, simile a quello prodotto dalla sensibilizzazione, un cue del reward è in grado di innescare nel ratto un desiderio viscerale di ottenerlo, come evidenziato dalla pressione ossessiva della leva. I risultati non possono essere spiegati: • da alterazioni edoniche elicitate dal CS e prodotte dall’anfetamina (vedi Exp 2), visto che l’anfetamina non altera neppure la reazione al reward (lo zucchero). • dal fatto che l’anfetamina alteri le proprietà del reward, dato che il test è effettuato in estinzione. • da potenziamento di abitudini, visto che il CS+ diventa tale durante il condizionamento pavloviano. • dal fatto che il CS+ funzioni come un reward condizionato, dato che è presentato prima della risposta. Neuroleptic-induced “Anhedonia” in rats: Pimozide blocks reward quality of food Conclusioni: “our animals pick up, handle and eat food with normal facility; thus it is not all sensory aspects of food that lose their impact under pimozide treatment. Rather, pimozide selectively blocks only those properties which give food reward value for hungry animals. In introspective language we would say that neuroleptics appear to take the pleasure out of normally rewarding brain stimulation, take the euphoria out of normally rewarding amphetamine, and take the “goodness” out of normally rewarding food. Nonostante il lavoro di Wise ebbe una grande influenza, successivamente l’idea che la DA mediasse il piacere entrò in crisi. Negli ultimi 10 anni molte evidenze hanno dimostrato che il ruolo principale della DA non è quello di mediare la sensazione di piacere: la DA non è il neurotrasmettitore del piacere, non è indispensabile per la risposta edonica se misurata attraverso i pattern di reattività al gusto (Berridge & Robinson, 1998) Pazienti con malattia di Parkinson, che hanno una estesa riduzione del livello di DA, danno normali giudizi di piacevolezza alle sostanze dolci. Persone che sono in uno stato di blocco dei recettori DA, o di forte deplezione del livello della DA, forniscono giudizi normali di piacevolezza a seguito di iniezioni di cocaina – ratti che a seguito di una mutazione genetica non hanno il sistema dopaminergico mostrano di preferire reward dolci. Iniezioni di anfetamina nel NAcc producono un forte elevazione del livello di DA. Tuttavia, ratti in questo stato non cambiano il loro pattern di reattività al gusto delle sostanze dolci. La stessa condizione si osserva anche dopo stimolazione elettrica del sistema mesolimbico, che sappiamo essere fondamentale per la DA. Esistono quindi molte evidenze che la DA non è cruciale per l’esperienza del piacere. Visto che la DA non media il piacere, sono state proposte altre possibili spiegazioni su quale potrebbe essere il suo ruolo nella rappresentazione del reward – Tra queste quelle del rinforzo, della motivazione e del prediction error. DA: l’ipotesi del rinforzo Un rinforzo è un reward che, dato in risposta ad una azione, concorre a memorizzare la relazione tra un particolare stimolo e una certa risposta: prescindere dagli aspetti edonici, il reward può agire favorendo la formazione della relazione S-R, e quindi l’apprendimento di nuove abitudini: la DA media il rinforzo, non necessariamente il piacere. Wise & Schwartz (1981): se la DA è implicata nel meccanismo di rinforzo prodotto da un reward, allora una riduzione del livello di DA dovrebbe interferire con l’apprendimento di un compito attraverso condizionamento strumentale Pimozide attenuates acquisition of level-pressing for food in rats Paradigma: • Somministrazione di placebo oppure di 3 possibili dosi di Pimozide (0.25mg/kg; 0.5mg/kg; 1mg/kg) 4 ore prima del condizionamento operante • Sessioni di training durante le quali il ratto riceve del cibo se preme una leva • I risultati dimostrano che all’aumentare della dose di antagonista della DA diminuisce la capacità dell’animale di apprendere in un compito di condizionamento operante • Una volta escluso il ruolo della DA come mediatore del piacere, questo risultato è compatibile con l’ipotesi di un ruolo della DA nel reward in quanto mediatore del meccanismo di rinforzo della relazione S-R Un possibile ruolo della DA nel rinforzo emerge anche nel condizionamento Pavloviano, ed in particolare è stato osservato nel Conditioning Place Preference. Il CPP, è una misura di condizionamento Pavloviano, e in particolare della risposta di approccio verso un luogo (CS) che è stato associato alla presentazione di un US. Spyraki et al. (1982): Attenuation by haloperidol of place preference conditioning using food reinforcement Paradigma • Fase di pre-trattamento, durante la quale viene valutata la preferenza spontanea dell’animale in merito ad uno di due locali (nero vs bianco) • Fase di trattamento e condizionamento, durante la quale un gruppo riceve un placebo e altri due gruppi un’iniezione di aloperidolo (0.1 mg/kg, 0.2mg/kg), e poi vengono messi nel luogo meno preferito dove riceveranno il cibo (CPP) • Fase test in estinzione, durante la quale si osserva la scelta spontanea dell’animale per il luogo punto di equilibrio speso nelle due posizioni gruppo aloperidolo 0.1mg/kg gruppo aloperidolo 0.2mg/kg Solo il gruppo trattato con placebo mostra evidenza di CPP. L’aloperidolo, bloccando i recettori DA, impedisce il condizionamento. Esistono quindi evidenze sperimentali che sono congruenti con l’ipotesi che la DA sia implicata nel processo di rafforzamento di una associazione, che può essere sia di tipo S-R, come nel caso del condizionamento strumentale, sia del tipo S-S come nel caso del condizionamento pavloviano. In entrambi i casi il reward svolge la funzione di rinforzo, e la DA medierebbe il processo di rafforzamento. DA: l’ipotesi degli incentivi motivazionali Sappiamo che il reward può agire come un rinforzo, ma può far riferimento anche al ruolo incentivante o motivazionale di uno stimolo: quindi, il cibo, se dato dopo una risposta in presenza di un certo stimolo agirà come rinforzo dell’associazione S-R, ma se visto prima della risposta funziona da incentivo ad emettere la risposta → una situazione classica è il gatto di Thorndike dentro alla gabbia che vede il cibo all’esterno (incentivo) e poi lo consuma quando riesce ad uscire (rinforzo). Sappiamo che CS associati al reward possono acquisire le proprietà motivazionali del reward stesso (Bindra 1978; Toates, 1986): la DA medierebbe questo apprendimento. Spyraki, Fibiger&Phillips: Attenuation of heroin reward in rats by disruption of the mesolimbic dopamine system L’idea è quella di usare il Conditioning Place Preference come indicazione del fatto che uno stimolo (luogo) ha acquisito una proprietà motivazionale La motivazione è quella di andare in un luogo per ottenere il reward → si noti che lo stesso paradigma era stato usato per dimostrare, sempre dallo stesso autore (Spyraki et al. 1982), che la DA è implicata nel mediare il rinforzo nell’apprendimento S-S Paradigma: 1) determinare il luogo meno preferito 2) si esegue il CCP con la droga come US 3) si valuta la preferenza indotta dal luogo che era associato alla droga