Scarica Appunti di Plasticità e Apprendimento (M. Turatto) e più Appunti in PDF di Psicologia dell'Apprendimento solo su Docsity! 1 Plasticità e Apprendimento Massimo Turatto INDICE ed articoli fondamentali Il sistema visivo (1) .………………………..……………………………………………………………………2 Dalla retina al Nucleo Genicolato Laterale Il sistema visivo (2) ……………………..……………………………………………………………………….5 La Corteccia Visiva Primaria Cellule semplici e cellule complesse Organizzazione funzionale della corteccia Plasticità (1) ……………………………………………………………………………………………………...8 Pascual-Leone et al. (1995-1996) Pascual-Leone & Hamilton (2001) Plasticità (2) …………………………………………………………………………………………………….11 Hubel & Wiesel, i 6 lavori fondamentali sulla plasticità cerebrale nella fase di sviluppo (1963-1965) Plasticità (3) – Deprivazione visiva e periodo critico …………………………...……………………………..14 Blakemore & Van Sluyters (1974) Mastropasqua et al. (2015) Rosenzweig Plasticità (4) – Remapping corticale da deafferentazione ……………………..…………………………...…..19 Merzenich Kaas et al. (1990) Chino et al. (1992) Plasticità (5) – Remapping corticale da stimolazione ………………………………...………………………..23 Jenkins e collaboratori (1990) Elbert et al. Recanzone et al. (1992) Recanzone et al. (1993) Thomas et al. (2020) Plasticità (6) – Plasticità e condizionamento …….……………………………………………………………..27 Bao, Chan & Merzenich (2001) Teoria di Hebb per l’apprendimento (1949) Frègnac et al. (1988) Bakin & Weinberger (1990) Perceptual Learning (1) – Specificità dell’input sensoriale ………………...………………………………….30 Fiorentini & Berardi (1981) Ball & Sekuler (1987) Perceptual Learning (2) – Specificità dell’input sensoriale ……………………………………...…………….35 Karni & Sagi (1991) Schoups, Vogel & Orban (1995) Perceptual Learning (3) – Attenzione e apprendimento percettivo …………………………………………….38 Shiu & Pashler (1992) Ahissar & Hochstein (1993) Huang, Lu et al. (2007) Perceptual Learning (4) – Specificità VS trasferimento ………………………………………………………..42 Xiao, Zhang et al. (2008) Mastropasqua et al. (2015) Mastropasqua & Turatto (2015) 2 Introduzione alla dipendenza (1) – Condizionamento classico ed operante ………….…………………….….46 Kamin (1968) Rescorla (1967) Introduzione alla dipendenza (2) – Apprendimento e Motivazione ……………………………………………49 Clark Hull (1943): la Drive-reduction Theory Olds & Miller (1954) Bolles (1972) Bindra (1978): la teoria degli incentivi motivazionali Toates (1986): la teoria degli incentivi Weingarten (1983) Le dipendenze – Dalle azioni alle abitudini ……………………………………..……………………………..53 Modello S-R e modelo teleológico Adams & Dickinson (1981): il paradigma di svalutazione del rinforzo Adams (1982) Teoria edonica della dipendenza ……………………………………………………………………….………57 Solomon & Corbit (1974): la teoria dei processi opponenti Stewart & Wise (1992) Lamb et al. (1991) Teoria dell’apprendimento anomalo …………………..………………………………………………………..60 Dickinson, Wood & Smith (2002) Robinson & Berridge (2003) Ciccocioppo et al. (2001) Anagnostaras e Robinson (1996) Teoria della salienza motivazionale (1) ……………………………………………………………….………..64 Winkelman et al. (2005) Berridge & Robinson (1998) Pierre e Vezina (1998) Shippenberg et al. (1996) Wyvell & Berridge (2000) Wyvell & Berridge (2001) Salienza motivazionale e attenzione – Abituazione e dipendenza ……………………..………………………71 De Tommaso, Mastropasqua & Turatto (2017) De Tommaso & Turatto (2021) De Tommaso, Mastropasqua & Turatto (2018) Siegel et al. (1982) Dopamina e reward …………………………………………………………………………………..…………74 Wise et al. (1978) Wise & Schwartz (1981) Spyraki et al. (1982) 5 NB: il sistema periferico si chiama magnocellulare (campi recettivi grandi, risposte transienti ma rapidissime), mentre quello centrale si chiama parvocellulare (campi recettivi piccoli, risposte più lente e sostenute). RIASSUNTO – Le cellule gangliari e del NGL hanno campi recettivi con organizzazione centro ON o OFF. Sono attivate solo da punti di luce (o loro spegnimento). La luce diffusa produce una risposta debole. Nel NGL ogni neurone ha una risposta solo monoculare. Ogni strato ha neuroni che rispondono tutti ad un solo occhio. Il NGL sinistro mappa il campo visivo destro, e quello destro il campo visivo sinistro. 6 Sistema visivo (2) La corteccia visiva primaria o striata (V1) – È la sede della prima analisi corticale dell’informazione visiva. Afferenze principali dal NGL. Rispetto al NGL conta circa 200 milioni di neuroni. È una struttura multistrato con uno spessore di circa 2 mm (6 strati distinti). Tipi di cellule in V1 – Da un punto di vista della risposta fornita agli stimoli, i neuroni nella corteccia visiva striata possono essere distinti in almeno tre tipi: cellule granulari (o del primo strato, 4c); cellule semplici; cellule complesse. Nella corteccia nessun tipo di cellule è attivato da una luce diffusa (mentre una risposta debole può essere osservata nel NGL). Neuroni del primo strato – Gli assoni che arrivano dal NGL fanno sinapsi nello strato 4 (nello specifico nello strato 4c), dove le cellule hanno un’organizzazione funzionale centro/periferia simile a quelle osservate nella retina e nel NGL (campi recettivi circolari organizzati in centro ON oppure centro OFF). In altre parti dello strato 4 si trovano cellule semplici che rispondono a linee e bordi. I neuroni sono strettamente monoculari (come quelli nel NGL). Negli anni 50-60 del secolo scorso Hubel e Wiesel compiono una serie di lavori fondamentali per capire l’organizzazione anatomica e funzionale della corteccia visiva primaria. Registrano la risposta dei neuroni in V1 agli stimoli visivi (in gatti e scimmie). Le loro scoperte hanno avuto un enorme valore teorico, ma anche applicativo. È grazie al loro lavoro che oggi, per esempio, sappiamo trattare (in parte) un grave difetto visivo come l’ambliopia, o si possono progettare e sperimentare protesi elettroniche in grado di simulare l’analisi della corteccia visiva per le persone non vedenti. In due lavori (1959, 1962) scoprono in V1 del gatto l’esistenza di due tipi di cellule: semplici e complesse. Le stesse cellule sono presenti anche nelle scimmie e nell’uomo. Le cellule semplici – Come le cellule gangliari, quelle del NGL e quelle granulari dello strato 4c, le cellule semplici hanno campi recettivi in cui un punto luminoso produce una risposta eccitatoria oppure inibitoria. I campi recettivi delle cellule semplici hanno una geometria diversa rispetto a quelle dei livelli precedenti (4c in V1, NGL, gangliari nella retina). Muovendo un punto luminoso, i due ricercatori hanno mappato il campo recettivo delle cellule semplici. In funzione della risposta possono essere identificati tre tipi di campi recettivi in cui la zona eccitatoria ed inibitoria sono sempre separate da una linea dritta. - X risposta inibitoria allo spot di luce - ∆ risposta inibitoria allo spot di luce Cellula di tipo centro OFF: quando la luce è accesa al centro dà una risposta inibitoria. Quando viene spenta diventa eccitatoria. La stessa risposta eccitatoria si osserva anche quando la luce viene accesa nella periferia, sia a destra sia a sinistra della zona verticale centrale. Nessuna risposta con illuminazione diffusa. Questo è il meccanismo di base per rilevare i bordi. Maggiore è l’area stimolata, maggiore sarà la risposta neurale (effetti di sommazione spaziale nel campo recettivo). Stimolazioni contemporanee di aree eccitatorie ed inibitorie riducono la risposta cellulare (effetti antagonistici). Quindi, lo stimolo più efficace per attivare la risposta del neurone è una piccola barra di luce (non un puntino), ma posizionata ed orientata correttamente. Vi sono neuroni selettivi per tutti gli orientamenti. Scostamenti (entro i 20°) dall’orientamento preferenziale provocano un declino nella risposta neurale. Le dimensioni del campo recettivo variano ovviamente in funzione del fatto che la cellula mappi porzioni del campo visivo centrale oppure più periferico. Nella parte foveale o parafoveale le dimensioni più piccole individuate corrispondono a 0.25° x 0.25° di angolo visivo, con una parte centrale avente una ampiezza di pochi minuti di arco. A 57 cm di distanza dall’osservatore un centimetro corrisponde ad 1° di angolo visivo. Quindi a questa distanza la parte centrale del campo recettivo copre pochi millimetri. Afferenze dal NGL e forma del campo recettivo – I due ricercatori hanno proposto come potrebbero essere collegati i neuroni del NGL o dello strato 4c con le cellule semplici per spiegare il campo recettivo di quest’ultime. 7 RIASSUNTO DELLE CARATTERISTICHE: - Selettività spaziale: ogni neurone risponde per una zona molto piccola del campo visivo. - Selettività per l’orientamento: ogni neurone risponde solo per un dato orientamento dello stimolo. - Risposta ON oppure OFF. - Campo recettivo diviso in zone eccitatorie ed inibitorie: le regioni eccitatorie ed inibitorie non sono concentriche e circolari, ma sono ampie aree separate da bordi lineari. - Risposta ottimale a barre di luce (chiare o scure). Risposta meno ottimale solo a punti di luce o buio. - Non particolarmente sensibili al movimento. - Campo recettivo monoculare o binoculare. - Afferenze dalle cellule del NGL tramite quelle dello strato 4c. Le cellule complesse – Sono cellule che si trovano inframmezzate con quelle semplici nei vari strati della corteccia. Rispetto alle cellule semplici, da cui ricevono le afferenze, hanno alcune proprietà di risposta particolari. Rispondono, come le semplici, a barre luminose orientate in modo appropriato, non a punti né a condizioni di illuminazione diffusa. Nel campo recettivo la distinzione tra zone ON e OFF (ed eccitatoria/inibitoria) non è così netta come nelle cellule semplici. Geometria del campo: una barra di luce stazionaria con orientamento appropriato evoca una risposta che è indifferenziata rispetto alla posizione dello stimolo. La geometria del campo può essere molto complessa e particolare. Può esserci una risposta ON nella parte superiore ed una OFF in quella inferiore. Risposta ai bordi: alcune cellule complesse non rispondono a linee sottili, ma solo a bordi tra aree chiare e scure. Il bordo deve essere orientato correttamente. Il movimento: lo stimolo ottimale per evocare la risposta di una cellula complessa è una barra che si muove nel campo recettivo. Selettività direzionale: una parte delle cellule complesse risponde solo ad una direzione di movimento; altre non presentano alcuna selettività rispondendo ad ogni direzione. RIASSUNTO DELLE CARATTERISTICHE: - Selettività spaziale. - Selettività per l’orientamento. - Campo recettivo complesso dove le zone ON e OFF non sono sempre nettamente demarcate. - Lo stimolo ottimale è in movimento. - Alcune selettive per la direzione di movimento, altre no. - Risposta ottimale a barre e bordi, in qualsiasi punto del campo. - Nessuna risposta a luce (o buio) diffusa. - Campo recettivo monoculare o binoculare. - Afferenze soprattutto dalle cellule semplici. La convergenza binoculare – Le informazioni arrivano alle aree visive da due occhi. Possiamo quindi chiederci quale sia il primo stadio di analisi in cui i segnali provenienti da un occhio e quelli provenienti dall’altro si combinano. La prima struttura in cui c’è la possibilità di una interazione è il NGL (tuttavia nel NGL i neuroni sono monoculari). Anche i neuroni dello strato 4 di V1 hanno campi recettivi strettamente monoculari. La convergenza si osserva invece in alcuni neuroni degli strati supragranulari (2 e 3). Qui troviamo sia neuroni monoculari sia neuroni binoculari. 10 1. Una rapida espansione dell’area corticale coinvolta nel controllo motorio a seguito dell’allenamento settimanale. Ma questo cambiamento veniva in gran parte perso durante il fine settimana di riposo. 2. Un cambiamento più lento attraverso l’area coinvolta nell’apprendimento (aumenta settimana dopo settimana in modo stabile). Un gruppo di soggetti fu invitato semplicemente ad immaginare di eseguire il compito. In questo studio anche il mero allenamento mentale può indurre una modifica cerebrale, comparabile a quella prodotta dal reale esercizio fisico. La plasticità corticale nel sistema motorio – Rapida riorganizzazione motoria indotta da TMS. Compito: stringere ritmicamente il pugno della mano destra ogni secondo, mentre si trova nello scanner fMRI. Ad un gruppo è applicata rTMS per interferire con l’attività neurale della M1. Risultati: attivazione della M1 controlaterale e della SMA: la stimolazione di M1 con rTMS a 1Hz riduce l’eccitabilità della corteccia. L’attivazione di M1 controlaterale e della SMA rimane invariata: attività in M1 controlaterale diminuisce, mentre come compensazione per mantenere efficiente il compito, appare un’attivazione di M1 ipsilaterale e un aumento di attività in SMA. Gli studi TMS che abbiamo appena visto ci dimostrano che: - L’esecuzione ripetuta di un certo gesto motorio determina una modifica dell’area corticale coinvolta nel controllo di tale gesto; - Se una certa area necessaria per un movimento viene “esclusa”, il cervello recluta altre aree per eseguire il movimento. La corteccia motoria presenta quindi elevata plasticità e capacità riorganizzativa piuttosto rapide. Plasticità corticale e cecità – L’essere umano è un organismo prettamente visivo. La perdita della vista comporta quindi per l’individuo ha necessità di un adattamento ad una situazione di deficit sensoriale. Tipicamente le persone cieche sviluppano diverse abilità compensatorie, migliorando la loro sensibilità nelle altre modalità sensoriali, specialmente nell’udito e nel tatto. Esistono ormai evidenze consolidate che nelle persone non vedenti, le aree deputate all’analisi visiva siano attivate anche durarne l’elaborazione di stimoli da altre modalità. Questo potrebbe spiegare perché le persone non vedenti hanno abilità uditive e tattili superiori a quelle delle perso e normo-vedenti. Già negli anni 90 alcuni studi PET hanno dimostrato un’attivazione di V1 in soggetti ciechi dalla nascita mentre eseguivano la lettura braille. L’attivazione era però assente nel caso in cui le dita venivano mosse passivamente sui simboli braille, una condizione in cui la “lettura” non era richiesta. L’attivazione nelle aree visive osservata durante la lettura braille non è comunque prova di un ruolo causale di tale attivazione per la lettura. Potrebbe trattarsi di un’attivazione non necessaria. Ma il caso di una paziente nata cieca ha fornito prova del ruolo causale dell’attivazione occipitale. Dopo un ictus in zona occipitale, la paziente che prima era un’ottima lettrice braille, perse la sua abilità di lettura. Il danno non riguardò la corteccia somato-sensoriale che si rappresenta la mano e quindi codifica le informazioni tattili necessarie nella lettura Braille (le sue abilità tattili rimasero intatte). Il ruolo fondamentale dell’attività occipitale nella capacità discriminatoria tattile in persone nate cieche è stato dimostrato anche attraverso l’uso della TMS. Cohen et al. (1997) hanno stimolato le aree occipitali in un gruppo di ciechi congeniti, i quali dopo tale stimolazione non riuscivano più a leggere i simboli Braille. Ruolo delle aree visive della discriminazione tattile in persone affette da cecità congenita – Stimolazione di una mano con stimoli braille. A vari ISI dallo stimolo braille viene stimolata con TMS l’area somatosensoriale oppure l’area occipitale. Risultati: - TMS in occipitale dopo circa 60ms dallo stimolo tattile impedisce il riconoscimento dello stimolo braille, ma non la sua detezione. - TMS in somatosensoriale impedisce sia detezione sia identificazione. Plasticità corticale indotta nei normo-vedenti – Gli esperimenti con persone cieche mostrano come le aree visive non rimangano inattive, ma vengano invece reclutate per processare informazioni in altre modalità. Possiamo chiederci se un simile fenomeno di 11 plasticità sia riproducibile anche in soggetti normo-vedenti. È possibile che le aree visive siano usate per compiti non visivi in persone sane? Pascual-Leone e Hamilton (2001) – Bendano per 5 giorni delle persone normo-vedenti. Durante i 5 giorni l’attività corticale delle persone mentre eseguono compiti di discriminazione tattile di oggetti viene registrata tramite fMRI. Durante questi giorni alcuni dei soggetti hanno iniziato ad avere allucinazioni visive. Ai soggetti viene messo in mano un oggetto (stimolo tattile) e si osserva attività anche in V1. Appena tolti i bendaggi si osserva una forte riduzione dell’attività in V1 alla presentazione di stimoli tattili. Tale esperimento dimostra l’elevata plasticità della corteccia, indicando inoltre che: - Sono sufficienti 5 giorni di totale deprivazione per indurre la corteccia visiva ad iniziare a processare informazioni tattili; - Bastano poche ore in cui la vista viene riattivata per riportare la corteccia visiva a rispondere solo alle informazioni visive. La rapidità dei cambiamenti funzionali rende improbabile che la deprivazione abbia creato nuove connessioni tra le aree somatosensoriali e quelle visive. È più probabile che queste connessioni esistano normalmente, e che la deprivazione tramite bendaggio abbia creato le condizioni per metterle in luce. I veloci cambiamenti nella risposta delle aree occipitali durante il bendaggio mettono inoltre in luce la capacità del cervello di adattarsi velocemente ai cambiamenti ambientali (nell’esperimento la deafferentazione visiva). Plasticità corticale e sistema sensoriale – Gli esperimenti sui ciechi, così come quelli sulla deprivazione indotta tramute bendaggio degli occhi, dimostrano l’elevato grado di plasticità del cervello e nello specifico della corteccia visiva. Questa può essere coinvolta nell’analisi di informazione tattile. La plasticità può essere di natura transitoria o più definitiva, in funzione del tempo per il quale avviene la deprivazione sensoriale. Nel primo caso sarebbe dovuta all’emergere di connessioni già presenti ma silenti in condizioni normali. Nel secondo caso è dovuta a modificazioni strutturali, sinaptiche. Questione della plasticità VS stabilità – Abbiamo visto sinora la plasticità come una proprietà intrinseca della corteccia (e del cervello in generale). Una questione interessante è come sia possibile per un sistema essere sufficientemente malleabile da poter acquisire nuove informazioni, ma allo stesso tempo non eccessivamente modificabile da qualsiasi informazione in ingresso. In altre parole, come fare ad essere contemporaneamente sensibile a nuove informazioni senza che queste possano modificare interamente quelle già esistenti? Un meccanismo attraverso il quale la plasticità viene regolata e limitata alle informazioni rilevanti è l’attenzione. Vedremo quindi il ruolo dell’attenzione nel regolare quali stimoli portino ad apprendimento e quali siano esclusi. Un altro meccanismo è il rinforzo. 12 Plasticità (2) Un modo per studiare la plasticità cerebrale è quella di alterare il normale input sensoriale (tramite deprivazione o iperstimolazione) e vedere come il cervello risponde. Hubel e Wiesel sono stati tra i maggiori esponenti di questo approccio metodologico, e i particolare la loro tecnica consisteva nell’indurre una robusta alterazione dell’input tramite deprivazione sensoriale. Dal 1963 al 1965 pubblicarono una serie di 6 lavori fondamentali sulla plasticità cerebrale nella fase di sviluppo. Da questi lavori emerse il concetto di periodo critico, che negli anni a venire influenzò profondamente la psicologia e le neuroscienze. (1) Effect of visual deprivation on morphology and physiology of cells in the cat’s lateral geniculate body. Nel sistema visivo questo aspetto era stato studiato esaminando gli effetti della deprivazione sensoriale generale (binoculare) sul sistema visivo. Non erano emerse grandi modifiche. Hubel e Wiesel si concentrano però su deprivazioni selettive. Lo scopo del primo lavoro della serie è quello di estendere queste conoscenze studiando gli effetti della deprivazione monoculare sulle cellule del NGL, a livello della risposta fisiologica e morfologica. Per valutare gli effetti della deprivazione la tecnica usata è quella della registrazione da singole unità (neuroni) e dell’esame anatomico della struttura (post mortem). Metodo: o Soggetti: 9 gattini e 1 gatto adulto o Durata deprivazione: variabile da 1 a 4 mesi o Tipo deprivazione; monoculare, sutura delle palpebre di un occhio (i gattini vengono deprivati alla nascita o qualche mese dopo; il gatto adulto ovviamente da adulto) o Sito di registrazione: NGL sinistro (da uno strato con afferenze dall’occhio deprivato; da uno strato con afferenze dall’occhio aperto) Cambiamenti fisiologici nel NGL: o Tutte le cellule (34) registrate, sia dall’occhio chiuso sia aperto, mostrano il classico campo recettivo concentrico organizzato in centro ON periferia OFF o viceversa. o La dimensione della parte centrale del campo recettivo era normale. o Se ne deduce che l’input sensoriale non è necessario per lo sviluppo normale dei campi recettivi dei neuroni del NGL. o Tuttavia, alcune cellule mostrano una risposta meno pronta e precisa alla luce: il centro del loro campo recettivo era molto più grande di quello delle altre cellule nel NGL, anche più grande di quello delle cellule del gatto adulto. o A parte queste eccezioni, in generale la deprivazione monoculare non sembra aver modificato in modo sostanziale la risposta fisiologica delle cellule del NGL. Cambiamenti morfologici nel NGL: o A seguito della deprivazione, in tutti i gattini sono emersi profondi cambiamenti morfologici nei neuroni del NGL. o I neuroni che ricevevano l’input dall’occhio chiuso sono risultati marcatamente atrofici. o Gli strati dell’occhio deprivato risultano più sottili degli altri, assottigliamento causato principalmente dalla atrofia delle cellule. o La deprivazione monoculare non sembra aver modificato la struttura e le cellule in retina, nervo ottico e collicolo superiore: i cambiamenti morfologici sembrano aver luogo solo nel NGL. Deprivazione monoculare in animali con precedente esperienza visiva: o È stata valutata in gattini deprivati a 2 mesi di età (uno deprivato per 4 mesi e uno per 1 mese). o L’atrofia era presente, anche se meno marcata di quella generata quando la deprivazione avveniva sin dalla nascita – questo può far pensare che tanto più precoce è la deprivazione tanto maggiore l’effetto della stessa. Deprivazione monoculare in animale adulto: o Un gatto adulto deprivato per 3 mesi – nessuna differenza tra gli strati nel NGL che ricevevano afferenze dall’occhio aperto e dal quello chiuso. o Normale spessore degli strati e grandezza delle cellule in essi contenute. o Questo risultato conferma il ruolo importante dell’età nella quale avviene la deprivazione. 15 Plasticità (3) Deprivazione visiva e periodo critico Nel quarto lavoro della serie vengono comparati gli effetti della deprivazione monoculare con quelli della deprivazione binoculare. Dai lavori precedenti è emerso che la deprivazione monoculare precoce causa notevoli cambiamenti nel sistema visivo, mentre una breve deprivazione binoculare non produce grossi danni. Nella deprivazione monoculare, quando l’attività del NGL e della corteccia è registrata 3 mesi dopo la chiusura delle palpebre, quello che si osserva è una marcata riduzione dei neuroni che in V1 rispondono all’occhio deprivato. Nel NGL le cellule rispondono perlopiù normalmente, sia all’occhio deprivato sia a quello aperto, anche se è presente una marcata atrofia per quelle che ricevono afferenze dall’occhio chiuso. Abbiamo visto che una deprivazione monoculare è senza dubbio la condizione che crea maggiori problemi nel sistema visivo, mentre quella binoculare non sembrava sortire particolari effetti. Ma è proprio vero che una deprivazione binoculare non porta a nessun danno per i neuroni di V1? Cosa accade se la deprivazione binoculare è sostenuta? Cosa succede allungando il periodo di deprivazione binoculare? Anche in questo caso il deficit sarà quasi nullo? (4) Comparison of the effects of unilateral and bilateral eye closure on cortical unit responses in kittens. Metodo: o Soggetti: 7 gattini o Durata deprivazione: circa 4 mesi. Nello studio precedente la deprivazione era di una settimana. o Inizio deprivazione: una settimana circa dopo la nascita o Tipo deprivazione: monoculare in 2 animali, binoculare in 5 animali o Sito di registrazione: V1 Risultati della deprivazione monoculare prolungata: o In sostanza confermano quelli del lavoro precedente: in V1, dove la maggior parte dei neuroni risponde binocularmente, i neuroni rispondono solo all’occhio aperto. Sono quasi assenti neuroni che rispondono all’occhio deprivato (stessi effetti che si erano osservati con una deprivazione di più breve durata). o La morfologia dei neuroni è però normale (perché almeno dall’occhio non deprivato le informazioni continuano ad arrivare a questi neuroni). Risultati della deprivazione binoculare prolungata: o Quasi la metà delle cellule studiate risponde in modo normale. o Tuttavia, la corteccia non era normale, in quanto il rimanente 50% delle cellule rispondevano in modo anomalo, e presentavano campi recettivi mal definiti, senza specificità di risposta per l’orientamento. o Una piccola percentuale non rispondeva affatto. o Risultati da 126 cellule di 4 animali: la distribuzione gaussiana viene un po’ persa = molti neuroni cominciano ad essere monoculari. Evidentemente un’esperienza visiva bilaterale effettiva consente anche di definire nella maggior parte dei neuroni una preferenza binoculare. Risultati istologici nel NGL: o A livello del NGL si conferma che gli strati con afferenze dall’occhio deprivato mostrano neuroni atrofici. o Lo stesso grado di atrofia si manifesta anche nel caso di deprivazione binoculare sostenuta, la quale produce quindi atrofia in tutti gli strati di entrambi i NGL. Effetti comportamentali: o Quando uno dei due occhi viene aperto, dopo 4 mesi di deprivazione binoculare, non emersero indicazioni che il gatto vedesse dall’occhio, né che seguisse oggetti in movimento che gli venivano presentati (con deprivazioni lunghe quindi il deficit si osserva anche se la deprivazione è binoculare). o Quattro mesi di deprivazione binoculare avevano reso l’animale cieco: quindi una deprivazione binoculare precoce e sostenuta crea danni anche in V1. 16 (6) Extent of recovery from the effects of visual deprivation in kittens. Nell’ultimo lavoro della serie gli autori indagano un altro aspetto della plasticità del sistema visivo, e cioè la capacità di recupero dai deficit indotti dalla deprivazione visiva. Gli effetti della deprivazione da luce per alcuni mesi portano a marcate anomalie nelle vie visive. La cecità è accompagnata da cambi morfologici nel NGL e alla distruzione di connessioni con la corteccia visiva, che creano anormalità nella risposta binoculare dei neuroni. Questa forma di plasticità (maladattamento o adattamento disfunzionale) indotta dalla deprivazione sembra essere riscontrabile solo nei primi mesi di vita. Un gatto adulto deprivato per lo stesso periodo di tempo non mostra alcun deficit. Metodo: o Soggetti: 7 gattini o Deprivazione: 3 mesi di deprivazione dalla nascita, 6 gattini monoculari e 1 binoculare o Recupero: periodo da 3 a 18 mesi (a 2 dei monoculari viene aperto l’occhio che era chiuso; a 4 dei monoculari viene aperto l’occhio chiuso e chiuso quello aperto; al binoculare viene riaperto uno dei due occhi). Effetti comportamentali: o Ad un primo gatto è stato aperto l’occhio chiuso da 3 mesi ed è stata testata la visione coprendo l’altro occhio: se testato subito sull’occhio chiuso l’animale risultava cieco; testato dopo altri 3 mesi riusciva a seguire per qualche secondo gli oggetti, ma la visione non è mai tornata normale, sbattendo ancora contro oggetti piccoli (per esempio le gambe delle sedie). o Ad un secondo gatto è stato aperto l’occhio chiuso da 3 mesi, ed è stata testata la visione dopo 18 mesi, coprendo l’altro occhio: nessun miglioramento particolare rispetto al primo gatto. o Quindi anche allungando di oltre 15 mesi il potenziale periodo di recupero non si osserva nessun beneficio particolare. o Ad altri 4 gatti durante il periodo di recupero è stato chiuso l’occhio che era rimasto aperto durante la deprivazione monoculare. Questo per verificare se il recupero potesse essere indotto forzando l’animale ad usare l’occhio prima deprivato. o Anche dopo 18 mesi il recupero era molto modesto. Un gatto che era leader del gruppo diventò sottomesso quando fu costretto ad usare l’occhio deprivato. o Gli stessi effetti sono stati osservati anche nel gatto con deprivazione binoculare. Risposte dei neuroni in V1 – recupero dopo deprivazione monoculare: o In 3 animali dopo 3 mesi di chiusura dell’occhio destro questo fu aperto e fu chiuso quello sinistro per altri 3 mesi. o Dopo questi 3 mesi la registrazione mostra che i neuroni rispondono ancora solo all’occhio sinistro (quello inizialmente non deprivato). La deprivazione durante il periodo iniziale sembra essere cruciale (nessun effetto nelle registrazioni fatte a 6 mesi). Risposte dei neuroni in V1 – recupero dopo deprivazione binoculare: o Nel gatto che aveva subito la deprivazione binoculare per 3 mesi è stato riaperto l’occhio destro. o Dopo 18 mesi è stata registrata l’attività dei neuroni in V1: la distribuzione della dominanza oculare non era particolarmente alterata, come ci si poteva aspettare da una deprivazione binoculare (iniziale). o Nei neuroni che rispondevano (circa la metà), si sono osservate risposte anomale soprattutto in quelli che rispondevano all’occhio riaperto. Morfologia dei neuroni nel NGL: o L’iniziale deprivazione monoculare per 3 mesi ha causato la nota atrofia delle cellule del NGL che ricevono afferenze dall’occhio chiuso. o Anche dopo 18 mesi dalla riapertura dell’occhio inizialmente chiuso non si è osservato nessun recupero dell’atrofia indotta dalla deprivazione iniziale. o Si conferma che il periodo iniziale è cruciale nell’indurre una modifica morfologica, che non pare essere poi recuperabile. 17 CONCLUSIONI GENERALI: Nella serie dei lavori che abbiamo visto, Hubel e Wiesel hanno dimostrato una forma di plasticità del sistema visivo. Attraverso la deprivazione monoculare e binoculare hanno messo in luce come esista un periodo critico, che nei gatti corrisponde alle prime settimane di vita, durante il quale il sistema visivo può essere fortemente modificato a livello funzionale, morfologico e strutturale. La deprivazione monoculare induce: ➢ Atrofia nei neuroni del NGL che ricevono afferenze dall’occhio deprivato, ma modesti cambiamenti funzionali. ➢ Pochi cambiamenti morfologici ma sostanziali cambiamenti funzionali nelle proprietà di risposta dei neuroni in V1. I neuroni rispondono solo all’occhio non deprivato. ➢ La deprivazione monoculare sembra indurre deficit maggiori di quella binoculare. ➢ Se la deprivazione dura più di 3 mesi non è possibile nessun recupero funzionale e morfologico. ➢ I deficit prodotti dalla deprivazione monoculare non sono dovuti al mancato normale sviluppo, quanto ad una distruzione di connessioni esistenti già dalla nascita. Il grado di recupero dipende dal periodo della deprivazione. Se la deprivazione supera il periodo critico il recupero possibile in termini comportamentali, fisiologici e morfologici è veramente modesto, se non assente. Il grado di deficit prodotti dalla deprivazione dipende dal fatto che sia binoculare o monoculare, e quindi dalle interazioni corticali tra le afferenze dei due occhi. La deprivazione monoculare è sempre pià drammatica di quella binoculare. Reversal of the physiological effects of monocular deprivation in kittens: further evidence for a sensitive period (Blakemore & Van Sluyters, 1974) – ulteriori evidenze circa la presenza del periodo critico, rispetto al grado di recupero dopo deprivazione monoculare. Metodo: o La deprivazione monoculare era invertita tra i due occhi dopo un periodo di tempo variabile (da 5 a 14 settimane). o Segue un periodo fisso di 9 settimane in cui l’occhio deprivato era invertito. La parte in rosa ci dice per quanto tempo è rimasto chiuso il primo occhio, la parte verde quanto è rimasto chiuso il secondo occhio quando il primo viene riaperto. o Più dura la deprivazione iniziale, più quando inverto i neuroni continuano a rispondere all’occhio che era rimasto aperto (è quello che mi aspetto di trovare). Riassunto dei punti cruciali del lavoro: Niente di nuovo fino a qui: hanno confermato i risultati dei lavori precedenti di Hubel & Wiesel. Ma cosa accade quando fanno l’inversione della sutura? Se viene fatta dopo 5 settimane, sono in grado di cambiare drasticamente e completamente la preferenza monoculare. Misurato a 14 settimane (con inversione fatta a 5 settimane) i neuroni rispondono tutti all’altro occhio: plasticità totale – inversione delle colonne di dominanza. A 5 settimane il sistema è completamente plastico. Ma basta una settimana in più (inversione a 6 20 Plasticità (4) Remapping corticale da deafferentazione Gli studi di Hubel e Wiesel (1963-1965) hanno dimostrato la presenza di un periodo critico post-natale durante il quale il sistema visivo mostra un elevato grado di plasticità a seguito di deprivazione sensoriale. Oltre tale periodo critico, i deficit prodotti dalla deprivazione non possono più essere recuperati, ma nemmeno indotti. La plasticità della corteccia visiva pareva quindi ristretta al periodo critico. Lo studio della plasticità corticale è stato successivamente rivolto anche agli effetti della riduzione o eliminazione dell’input sensoriale in aree corticali diverse da quella visiva. Una delle prime dimostrazioni della plasticità corticale nell’età adulta ha riguardato il sistema somatosensoriale dei primati (scimmie adulte). Pioniere di questo tipo di studi sulla plasticità della corteccia somatosensoriale nei primati non umani è stato Michael Merzenich. Assieme ai suoi collaboratori ha condotto una serie di studi nei quali ha testato la riorganizzazione delle aree corticali di rappresentazione della mano (aree di Brodmann 3b e 1), a seguito di deafferentazione dell’input cutaneo tramite taglio nel nervo mediano della mano. Lo studio è stato guidato da una serie di domande: - Quali conseguenze si osservano nella corteccia somatosensoriale a seguito di un danno ai nervi periferici? - I settori corticali delle aree 3b e 1 che non ricevono più input sensoriale rimangono silenti o iniziano a rispondere ad input da altre regioni cutanee? - In altre parole: a seguito della denervazione periferica i settori corticali che si rappresentano la parte di cute denervata continuano a rappresentarsi tale distretto corporeo o sono riutilizzati da altri input sensoriali? Topographic reorganization of somatosensory cortical areas 3B and 1 in adult monkeys following restricted deafferentation. o Soggetti: scimmie adulte o Tecnica: registrazione. Tramite microelettrodi, della risposta corticale (aree 3b e 1 della corteccia somatosensoriale) alla stimolazione cutanea di varie parti della mano. Sezione del nervo mediano della mano. Il nervo mediano nella scimmia innerva la parte palmare della mano, che va da pollice a metà del dito medio. Rappresentazione corticale della mano nella corteccia SI (aree 3b e 1) nella scimmia, dopo sezione del nervo mediano: Evidenze da un altro studio di Merzenich – In grigio scuro le aree che si rappresentano la parte dorsale della mano /nervo radiale e ulnare); in bianco quelle che si rappresentano la parte palmare (nervo mediano) →Normal. Le aree che si rappresentano la parte dorsale della mano invadono le aree palmari; in nero le aree silenti immediatamente dopo la sezione del nervo mediano →0 Days. La riorganizzazione è completa e non esistono quasi più aree silenti, che ora rispondono a input provenienti dai nervi radiale e ulnare →22 Days. I risultati mostrano che l’area corticale che riceve afferenze dall’area della mano denervata non continua a rappresentarsi la stessa porzione di mano. L’area viene reclutata dall’input proveniente dalle zone della cute adiacenti rimaste innervate. Si osserva quindi un’espansione dell’area corticale che risponde sia al nervo radiale sia a quello ulnare, a scapito di quella che prima rispondeva al nervo mediano. Dopo qualche mese dalla lesione l’occupazione è completa, e non rimangono aree corticali silenti che si rappresentano zone della mano denervate. 21 Dinamicità delle mappe corticali – i risultati dei lavori di Merzenich dimostrano che anche nei soggetti adulti le mappe corticali non sono statiche, ma dinamiche. La rappresentazione corticale di una certa superficie corporea non è fissa e le aree coinvolte possono essere dedicate ad altri segnali se queste smettono di essere stimolate dall’input sensoriale. Questo suggerisce che nella corteccia sensoriale normale sono in atto processi di competizione tra input sensoriali. Le rappresentazioni corticali dei distretti corporei hanno mappe non statiche, ma che sono mantenute stabili da processi competitivi tra i vari input sensoriali. Dopo aver visto gli studi sulla plasticità corticale indotta da deafferentazione nel sistema somatosensoriale di primati adulti passiamo a vedere studi analoghi nel sistema visivo. La domanda fondamentale cui hanno cercato di dare una risposta questi studi è se il sistema visivo in un mammifero adulto può essere soggetto a plasticità. In particolare, possono le mappe spaziali visive della corteccia riorganizzarsi? La corteccia visiva contiene diverse mappe spaziali del campo visivo che dipendono dalla distribuzione dei fotorecettori sulla retina (organizzazione topografica). Normalmente queste mappe spaziali (anche in altre modalità sensoriali) si sviluppano in modo regolare e consistente in tutti gli individui della specie. Le mappe visive possono essere però alterate da deprivazioni periferiche, come nel caso dello strabismo indotto alla nascita (Hubel & Wiesel, 1965). Tuttavia, queste evidenze sembrano indicare una forma di plasticità in cui le modifiche nella organizzazione corticale possono avvenire solo durante un periodo critico post natale. Quindi, l’idea era che oltre tale periodo critico le rappresentazioni sensoriali a livello corticale rimangano relativamente stabili nell’animale adulto. Questa prospettiva è stata però messa in discussione dagli studi di Merzenich sul sistema somatosensoriale nelle scimmie adulte → massiva riorganizzazione corticale dopo lesione nervo periferico della mano. Gli studi di Merzenich hanno dimostrato che, in un periodo che va da ore a settimane, la parte della corteccia che viene deprivata dell’input sensoriale si riorganizza in modo da rispondere ad input sensoriali provenienti da altri recettori cutanei. I neuroni della corteccia acquisiscono quindi nuovi campi recettivi, iniziando a processare informazioni dagli altri nervi (radiale e ulnare). Modello schematico di riorganizzazione corticale da deafferentazione periferica → Tali cambiamenti relativamente rapidi nella organizzazione della corteccia suggeriscono la presenza di connessioni pre-esistenti che possono essere sfruttate nel processo riorganizzativo. Nuove connessioni possono comunque essere stabilite nel tempo. Questi processi riorganizzativi sono importanti perché consentono al cervello di rispondere in modo adattivo e plastico a danni periferici e centrali. Reorganization of retinotopic cortical maps in adult mammals after lesions of the retina (Kaas et al, 1990). L’obiettivo del lavoro di Kaas è quello di verificare se anche nel sistema visivo è possibile una rapida riorganizzazione nei mammiferi adulti. Metodo: o Registrazione dell’area visiva primaria del gatto. o Prima fase: producono una lesione retinica nell’occhio destro in modo da indurre uno scotoma (l’occhio sinistro è normale). Risultati: o Nessun segno di riorganizzazione corticale (ovvio! Hanno comunque l’input dall’altro occhio! L’unica soluzione è togliere l’altro occhio). o L’unica alterazione è che i neuroni binoculari che si rappresentano l’area lesionata ora rispondono solo all’altro occhio, per la stessa porzione del campo visivo (in accordo con quanto osservato da Hubel & Wiesel). o Seconda fase: enucleazione dell’occhio sano e registrazione dell’area visiva primaria del gatto dopo 2-6 mesi. 22 Risultati: o Nessuna risposta dai neuroni i cui campi recettivi coprivano l’area danneggiata se viene presentato uno stimolo in quest’area. o I neuroni però rispondono per stimoli adiacenti all’area. I loro campi recettivi si sono spostati nelle porzioni del campo visivo vicine alla lesione. Riorganizzazione della mappa retinotopica a livello corticale – In nero i campi recettivi dei neuroni che prima rispondevano all’area corrispondente a quella danneggiata. I campi recettivi si sono spostati oltre l’area danneggiata in modo da continuare a ricevere un normale input visivo. In bianco normali campi recettivi di neuroni che mappano porzioni retiniche distanti da quella lesionata. Spostamento dei campi recettivi dei neuroni di V1 in pozioni retiniche non lesionate: Rapid reorganization of cortical maps in adult cats following restricted deafferentation in retina (Chino et al, 1992). Un successivo lavoro di Chino indaga ulteriormente i meccanismi corticali che consentono la riorganizzazione nel sistema visivo a seguito di lesioni retiniche. Chino e colleghi vogliono verificare se sia possibile osservare riorganizzazioni corticali in tempi rapidi dopo la lesione periferica. Se le evidenze fossero positive questo suggerirebbe che anche il sistema visivo, come quello somatosensoriale, presenta un elevato grado di plasticità in tempi brevi anche nell’animale adulto. Metodo: o Lesione della retina di un occhio o Misura dello scotoma a livello corticale o Enucleazione dell’occhio sano o Nuova misura dello scotoma corticale per valutare la possibile riorganizzazione (condizione immediata VS condizione ritardata dopo 2 mesi) Risultati prima della enucleazione: o La topografia corticale risulta normale quando mappata attraverso l’occhio sano. o Quando viene testato l’occhio lesionato emerge una zona corticale (corrispondente a quella retinica lesionata) in cui i neuroni non rispondono. o Se si registra dai neuroni che hanno il campo recettivo nella zona lesionata non si osserva risposta. Quindi non ci sono campi recettivi attivi per la porzione di campo visivo lesionata. Risultati gruppo immediato: o Campi recettivi per l’occhio lesionato, prima e subito dopo enucleazione di quello sano. o Si noti, subito dopo l’enucleazione dell’occhio sano, la comparsa di nuovi campi recettivi attorno all’area lesionata. Questi sono i campi recettivi di quei neuroni che prima mappavano l’area lesionata. I neuroni spostano il loro campo recettivo solo dopo la rimozione dell’occhio sano. o I nuovi campi recettivi hanno proprietà di risposta normali, sia per quanto riguarda la selettività all’orientamento, al contrasto e alle frequenze spaziali. o I neuroni che non rispondevano perché mappavano l’area lesionata spostano i campi recettivi verso zone retiniche intatte. I risultati del gruppo immediato dimostrano che una lesione bilaterale (locale in un occhio + enucleazione altro occhio sano) è necessaria per indurre una rapida riorganizzazione topografica della corteccia. 25 o Calcolo del fattore di magnificazione corticale: area corticale di rappresentazione/superficie tattile stimolata. o Normalmente esiste una relazione inversa tra ampiezza dell’area corticale e dimensione dei campi recettivi dei suoi neuroni. Si poteva quindi ipotizzare che l’espansione delle aree corticali dei settori stimolati inducesse anche una riduzione dei campi recettivi dei neuroni corrispondenti. I risultati sono in linea con questa predizione. Quindi i neuroni aumentano di numero (espansione area corticale), ma diminuisce la grandezza dei loro campi recettivi. CONCLUSIONI: I risultati dimostrano che i campi recettivi dei neuroni corticali possono essere alterati a seguito di un uso esteso del recettori periferici. Gli studi che abbiamo visto sinora hanno riguardato mammiferi o addirittura primati non umani. Questo può indurci a ipotizzare che meccanismi analoghi funzionino anche nel cervello dell’essere umano. Ma come potrebbe essere testata questa ipotesi nell’essere umano? Elbert e collaboratori hanno testato l’effetto di una stimolazione intensiva delle dita della mano nell’essere umano. - Soggetti: violinisti, chitarristi e altri musicisti che usano estesamente le falangi di una mano (D2-D5) rispetto all’altra. - Non musicisti come controlli. - Sono stati applicati stimoli tattili alle dita mentre contemporaneamente veniva registrata la risposta corticale indotta da tali stimolazioni, e sulla base della quale è stata ricostruita la mappa corticale delle dita. - I risultati hanno messo in luce un ampliamento della dimensione dell’area corticale che si rappresenta le dita della mano che premono le corde dello strumento. I risultati confermano che l’organizzazione corticale non è stabile ma dipende dall’input sensoriale, non solo per il suo sviluppo, ma anche durante tutta la vita. I cambiamenti indotti dall’allenamento sono reversibili. Problema: qual è il ruolo dell’attenzione nella modulazione dell’input sensoriale, e nella successiva riorganizzazione corticale? Uno dei risultati emersi dallo studio di Jenkins et al. (1990) è che la riorganizzazione corticale era avvenuta solo nel caso in cui la scimmia toccava il disco rotante. Con il disco fermo non si era osservato nessun cambiamento significativo nella rappresentazione corticale delle falangi. Esiste però la possibilità che la differenza tra le due condizioni sia invece dovuta alla differenza di attenzione posta dall’animale al disco rotante piuttosto che stazionario (quello rotante poteva essere più saliente). Recanzone e collaboratori hanno esplorato questa possibilità in uno studio del 1992 – Topographic reorganization of the hand representation in cortical area 3b of owl monkeys trained in a frequency-discrimination task. Metodo: o Soggetti: 10 scimmie adulte (Owl Monkeys) o Compito: l’animale deve riuscire a discriminare la presentazione di uno stimolo oddball su di una falange del dito medio o Gli stimoli standard sono stimoli vibro-tattili con una frequenza di 20Hz o Il target è uno stimolo con una frequenza superiore ai 20Hz o Registrazione dall’area somatosensoriale 3b o 700 trial al giorno Due condizioni sperimentali: o Tattile attiva: Attenzione allo stimolo tattile. Solo stimoli tattili e compito tattile. o Tattile passiva: Attenzione allo stimolo uditivo. Presentazione di stimoli uditivi sui quali l’animale deve fare una discriminazione di frequenza + stimolazione tattile passiva. Risultati: o La rappresentazione del dito stimolato è stata confrontata con quella: di un dito vicino a quello stimolato; del dito corrispondente nella mano non allenata; del dito vicino a quello corrispondente non allenato; e del dito stimolato passivamente (compito uditivo). 26 o Grandezza delle rappresentazioni delle dita: il confronto con il dito adiacente a quello stimolato non mostra differenze nella grandezza dell’area che si rappresenta il dito. Il confronto con il dito corrispondente a quello stimolato nella mano non stimolata, non mostra differenze nella grandezza dell’area rappresentata. Il confronto tra la condizione di stimolazione tattile attiva e passiva non mostra differenze per quanto riguarda la dimensione della rappresentazione corticale del dito stimolato. o L’analisi della dimensione delle rappresentazione corticali del dito stimolato non ha messo in luce alcuna differenza tra le varie condizioni. o È stata però condotta un’analisi più precisa confrontando le varie condizioni solo in merito all’area del dito specificatamente stimolata. Si sono quindi confrontate le rappresentazioni corticali facendo riferimento allo specifico punto stimolato sul dito. o Rappresentazioni specifiche del punto stimolato: condizione attiva – Quando il confronto riguarda solo lo specifico punto di stimolazione attiva, ed un punto analogo nel dito adiacente non stimolato, allora emerge un chiaro incremento dell’area corticale indotto dalla stimolazione attiva. o Rappresentazioni specifiche del punto stimolato: condizione passiva – Se la stimolazione è passiva NON emerge NESSUN incremento dell’area corticale quando confrontata con il dito adiacente. CONCLUSIONI: I risultati del lavoro di Recanzone e collaboratori confermano quelli dello studio precedente di Jenkins. Si dimostra che la rappresentazione corticale somatosensoriale può essere modificata dalla stimolazione sensoriale, ma solo per lo specifico sito di stimolazione. Si dimostra inoltre che non basta che tale stimolazione avvenga passivamente, ma deve essere una stimolazione rilevante per l’animale. L’attenzione gioca quindi un ruolo cruciale nel modulare la plasticità corticale. Abbiamo visto che lesioni periferiche (nervi della mano o porzioni della retina) inducono una riorganizzazione topografica della corteccia, sia somatosensoriale (SI) che visiva (V1) → Merzenich et al. (1983); Kaas et al. (1990). Esistono inoltre evidenze che la corteccia somatosensoriale si riorganizza anche a seguito di una iperstimolazione attiva di alcuni distretti corporei → Jenkins et al. (1990); Recanzone et al. (1992). Come si comporta la corteccia uditiva? Esistono evidenze che anche la corteccia uditiva si riorganizza tonotopicamente a seguito di lesioni cocleare specifiche che impediscono la percezione di certe frequenze (Robertson & Irvine, 1989). In uno studio del 1993 Recanzone e collaboratori dimostrano una analoga riorganizzazione tonotopica a seguito di un training con una specifica frequenza – Plasticity in the frequency representation of primary auditory cortex following discrimination training in adult owl monkeys. Metodo: o Soggetti: scimmie adulte o Allenate per vari giorni a distinguere stimoli di una certa frequenza target o Alla fine del training registrazione da A1 (corteccia uditiva primaria) o Confronto dell’ampiezza della zona di corteccia che si rappresenta la frequenza stimolata tra scimmie allenate e non allenate Risultati: o Psicofisica: l’allenamento produce un miglioramento della prestazione discriminativa che si traduce in una riduzione della differenza di frequenza quando si tratta di discriminare tra target e non target. o Mapping corticale: in parallelo al miglioramento di prestazione, l’allenamento induce una espansione dell’area corticale che si rappresenta la frequenza allenata, ma non se presentata passivamente. Gli studi appena visti dimostrano che un allenamento percettivo, che porta ad una migliore discriminazione, si accompagna a un’espansione corticale dell’area coinvolta. Almeno nella modalità tattile e uditiva. Tuttavia non è ovvio se la relazione vale anche in senso opposto, cioè se un incremento dell’area corticale coinvolta si accompagni sempre ad un aumento della capacità discriminativa. Alcuni studi hanno non hanno trovato tale relazione (aumento area tramite microstimolazione). 27 Una possibilità è che la differenza stia nel meccanismo che determina l’aumento dell’espansione corticale. Il problema viene affrontato in uno studio di Thomas e collaboratori, nel quale si vuole vedere se un aumento dell’area corticale tramite esposizione a rumore bianco passivo si traduce in un aumento di prestazione. Modifying the adult rat tonotopic map with sound exposure produces frequency discrimination deficits that are recovered with training. Metodo: o Soggetti: 6 gruppi di ratti (3,5-6 mesi) o 3 gruppi UnTrained (UT) ▪ 1 gruppo 3 settimane in ambiente standard (Naïve UT) ▪ 1 gruppo esposto passivamente a 2 settimane di WN + 1 settimana a tono di 7KHz (7KHz UT) ▪ 1 gruppo esposto passivamente a 2 settimane di WN + 1 settimana a tono di 15KHz (15KHz UT) o 3 gruppi Trained (T) ▪ 1 gruppo 3 settimane in ambiente standard + 10 settimane di training a 7KHz (Naïve T) ▪ 1 gruppo esposto passivamente a 2 settimane di WN + 1 settimana a tono di 7KHz + 10 settimane di training a 7KHz (7KHz T) ▪ 1 gruppo esposto passivamente a 2 settimane di WN + 1 settimana a tono di 15KHz + 3 settimane di training con toni leggermente diversi o uguali a 7KHz Il training: o Tono target presentato nel 20% dei trial o Nel restante 80% è un tono diverso o Se è presente il target il ratto deve inserire il naso in una apertura per ricevere il reward ▪ Target presente e inserimento: HIT ▪ Target presente e non inserimento: MISS ▪ Tono diverso e inserimento: FA ▪ Tono diverso e non inserimento: CR o Analisi della prestazione con d’ o Dopo la fase di esposizione passiva e dopo la fase di training (per i gruppi allenati) si registrava dalla corteccia uditiva primaria o Mappatura della risposta a varie frequenze (da 0,75KHz a 70KHz) Risultati: o La semplice esposizione passiva al tono di 7KHz induce una espansione l’area corticale che rappresenta tale frequenza. o Ma l’esposizione passiva al tono di 7KHz riduce l’effetto del training discriminativo. o L’esposizione passiva al tono di 7KHz aumenta l’area dedicata, ma riduce il PL (C rispetto ad A). o Un aumento analogo si osserva anche come risultato di puro PL (B rispetto ad A, simile a C). Quindi le due espansioni non sono qualitativamente equivalenti. CONCLUSIONI: Anche la corteccia uditiva mostra la capacità di riorganizzarsi non solo a seguito di lesioni ma anche in risposta ad un allenamento specifico (per una certa frequenza). Un aumento della corteccia non è però una plasticità che si traduce automaticamente in un vantaggio percettivo. Anche la stimolazione passiva induce remapping, che però interferisce con la capacità discriminativa, che richiede invece training per migliorare. Inoltre, a conferma di quanto emerso nel lavoro di Recanzone et al. (1992), i risultati dimostrano ancora una volta il ruolo cruciale dell’attenzione nel regolare la plasticità corticale. In altre parole, un aumento di corteccia dovuta a training comporta anche un aumento di prestazione. Un aumento di corteccia dovuto a stimolazione passiva non comporta un aumento di prestazione. La magnificazione corticale si traduce in un vantaggio percettivo solo se avviene tramite training, cioè attenzione. 30 Risultati: o Effetti della iontoforesi sulla risposta di dominanza oculare di un neurone monoculare sinistro. Dopo l’accoppiamento il neurone mostra una modifica delle proprietà del suo campo recettivo, che da prevalentemente monoculare sinistro diventa binoculare con leggera preferenza sinistra. Effetti della iontoforesi sulla risposta di preferenza all’orientamento: neurone “verticale”. o Effetti della iontoforesi sulla risposta di preferenza all’orientamento. Dopo l’accoppiamento il neurone mostra una modifica delle proprietà del suo campo recettivo, che passa da una selettività di risposta per lo stimolo verticale ad una selettività per quello orizzontale. Discussione – La tecnica utilizzata ha consentito di cambiare le proprietà del campo recettivo dei neuroni, modificando sia la loro dominanza oculare sia la selettività per l’orientamento. Gli effetti più forti di questa plasticità neurale sono stati dimostrati nei gattini durante il periodo critico. Tuttavia effetti analoghi anche se minori sono stati osservati anche nei gatti adulti. La plasticità si osserva anche a livello del campo recettivo del neurone. La modifica è probabilmente dovuta ad un meccanismo di plasticità sinaptica che si basa sulla correlazione temporale di risposta pre- e post-sinaptica, qui modulata attraverso iontoforesi. I dati sono compatibili con la teoria di Hebb sull’apprendimento e la plasticità sinaptica. Plasticità del campo recettivo indotta tramite condizionamento classico – Bakin & Weinberger (1990) si chiedo se le proprietà del campo recettivo del neurone dipendano solo dalle proprietà dello stimolo o se queste possano essere modificate dalla rilevanza dello stimolo per l’animale. Classical conditioning induces CS-specific receptive field plasticity in the auditory cortex of the guinea pig. Metodo: o Soggetti: 8 maschi adulti di Guinea Pig o Procedura: prima viene misurata la risposta neurale a varie frequenze acustiche, e si identifica la miglior risposta della corteccia uditiva (10 kHz). o Poi si inizia una procedura di condizionamento avversivo, in cui un tono di 6kHz anticipa di 2 secondi due scosse elettriche. o Condizione di controllo di pseudo condizionamento, in cui il tono non predice la scossa, ma vengono dati lo stesso numero di toni e scosse. o Si stima ancora la risposta corticale alle varie frequenze acustiche. Risultati comportamentali: o L’animale mostra una serie di risposte comportamentali allo stimolo condizionato (tono di 6kHz): movimenti della testa, arretramento, masticazione. o Questo assicura che il condizionamento è avvenuto, e l’animale ha identificato lo SC (6kHz) come un evento saliente che predice l’arrivo dello SI (scossa). Risultati elettrofisiologici (condizionamento): il condizionamento modifica la risposta alle frequenze nelle cellule registrate. Risultati elettrofisiologici (controllo): il pseudo condizionamento NON modifica la risposta alle frequenze nelle cellule registrate. Discussione – La procedura di condizionamento è in grado di modificare il campo recettivo delle cellule della corteccia acustica dell’animale, mostrando plasticità a livello neurale. Le modifiche permesse da tale plasticità del campo recettivo sono relativamente durevoli nel tempo, dato che rimangono presenti anche 24hr dopo la fine del condizionamento. La plasticità del campo recettivo è emersa solo in quegli animali che avevano mostrano condizionamento. 31 Perceptual learning (1) Specificità dell’input sensoriale Il perceptual learning (apprendimento percettivo) consiste in un miglioramento delle capacità percettive del soggetto dovuto all’esperienza o allenamento (miglioramento che si mantiene nel tempo). Studiare il PL è interessante per vari aspetti pratici e teorici: come allenare al meglio alcune abilità? Come apprende e si modifica il sistema sensoriale a livello corticale? Il PL è una manifestazione di plasticità corticale. Si dice che “la pratica rende perfetti”. Forse la pratica non consentirà di raggiungere la perfezione, ma di sicuro aiuta ad aumentare le capacità allenate. Ad esempio, a seguito di una quotidiana esposizione alle radiografie, i radiologi sviluppano un’abilità a vedere macchie di contrasto rilevanti in immagini che al profano non dicono nulla. Un altro esempio è la capacità discriminativa degli operatori ai sistemi x-ray degli aeroporti, cruciale per la nostra sicurezza in volo. È un’abilità che si affina con l’allenamento. In merito agli aspetti teorici del PL possiamo porci alcune domande importanti: - L’apprendimento è un processo specifico o generale? Una visione comune, anche in ambito educativo, è che allenare il cervello a fare qualcosa produca un effetto positivo generale. Il rischio dell’apprendimento (compreso il PL) è che rimanga specifico. - Quali sono i meccanismi che consentono all’apprendimento di aver luogo? - Quali sono le basi neurali del PL? - Cosa ci dice il PL in merito alla plasticità corticale nell’adulto? Per tentare di dare delle risposte a queste e altre domande restringeremo il nostro interesse al PL nella modalità visiva. Per cominciare vediamo studi degli anni ‘80 che hanno indagato alcuni aspetti del PL: Fiorentini e Berardi (1981), Ball e Sekuler (1987). Questi studi sono tra i primi che hanno dimostrato la specificità del PL in riferimento alle caratteristiche dello stimolo sul quale viene fatto un compito di discriminazione. Senza tecniche di neuroimmagine, ma solo sulla base delle conoscenze dell’organizzazione del sistema visivo, questi due studi cercano anche di dare una risposta sulle possibili basi neurali del PL studiato. Learning in grating waveform discrimination: specificity for orientation and spatial frequency – Fiorentini e Berardi (1981). Gli autori studiano il PL per stimoli che consistono in 2 grating semplici oppure 4 grating complessi. Nello specifico, lo scopo del lavoro è valutare gli effetti dell’allenamento sull’abilità di discriminare tra i vari stimoli e vedere se l’abilità acquisita viene mantenuta nel tempo e se si trasferisce tra stimoli diversi. Stimoli: o 4 differenti grating complessi di diversa forma d’onda o 2 grating sinusoidali semplici con differente frequenza spaziale (7% di differenza) o Gli stimoli sono visti binocularmente in tutti gli esperimenti, tranne che nell’esperimento sul trasferimento interoculare Procedura: o La discriminazione dei vari grating, semplici o complessi, si basa su un compito a scelta forzata a 2 intervalli (2AF); o Nel compito con i grating complessi c’è un grating di riferimento a, che viene presentato con il grating b, c, oppure d (ogni grating presentato per 100ms – ISI=500ms); o I due grating sono presentati in due intervalli separati, in ordine casuale; o Il primo grating è presentato con un suono; il soggetto riporta se il grating a è presente nel primo (con suono) o secondo intervallo. o La stessa procedura è usata per studiare la discriminazione dei grating semplici con diverse frequenze spaziali; o Il grating di riferimento ha una frequenza spaziale pari a 10 Hz. Il grating test pari al 7% in più. o Nelle prime tre sessioni sperimentali ogni soggetto è testato con gli stimoli complessi verticali, oppure con stimoli semplici con una certa frequenza spaziale di riferimento (10 Hz). Questo per valutare gli effetti dell’apprendimento e del suo mantenimento nel tempo. 32 o Nelle successive sessioni sperimentali i grating complessi vengono presentati ruotati di 90°, cioè orizzontali. Quelli semplici con una nuova frequenza di riferimento più alta. Questo per valutare il grado di trasferimento del PL da un set di stimoli ad un altro con altri parametri (orientamento oppure frequenza). o Numero di prove: da 100 a 500 per sessione. Soggetti: 10 soggetti, di cui 5 esperti di esperimenti di psicofisica e 5 naïve. Risultati: o Il PL emerge con l’allenamento. I risultati mostrano un chiaro effetto dell’apprendimento: i soggetti diventano sempre più bravi nel discriminare gli stimoli, in tutti e 3 gli accoppiamenti. Si mostra quindi perceptual learning. o Mantenimento e aumento del PL tra le sessioni: il PL si mantiene di sessione in sessione nei vari giorni. Ad ogni nuovo giorno il livello di AC parte da un valore sempre più elevato. Un soggetto è stato testato a 6 settimane di distanza e il PL era parzialmente conservato. o Il PL è specifico per le caratteristiche dello stimolo: quando dopo aver appreso la discriminazione di forma d’onda con gli stimoli verticali si passa a quelli orizzontali, la prestazione riparte dal valore iniziale. Non c’è trasferimento del PL, che si dimostra specifico per la caratteristica dello stimolo (orientamento). o Il PL ha una certa tolleranza di specificità per l’orientamento: il PL si dimostra specifico per l’orientamento dello stimolo anche quando la caratteristica appresa è la forma d’onda. Esiste trasferimento sino ad una rotazione di 30° (a 45° il PL non si trasferisce più). o Il PL è specifico per la frequenza spaziale allenata: il PL si dimostra specifico anche per la frequenza spaziale dello stimolo. Se allenato con stimolo a 3c/d quando si passa a 6c/d il PL deve ricominciare. Specificità per posizione spaziale: per valutare se l’apprendimento percettivo sia specifico per posizione dello stimolo, o se si trasferisce nelle varie parti del campo visivo, alcuni soggetti sono stati allenati in due differenti parti del campo visivo. Il PL si dimostra specifico per la posizione del campo visivo nella quale è avvenuta la stimolazione sensoriale. Cambiando la posizione dello stimolo il PL deve ricominciare. Per la corteccia che sta producendo quella prestazione non si tratta dello stesso stimolo. Specificità oculare: per valutare se l’apprendimento percettivo sia specifico per l’occhio allenato, prima hanno allenato i soggetti a fare il compito con visione monoculare sinistra, poi hanno iniziato l’allenamento in visione monoculare destra. I risultati hanno mostrato trasferimento completo dell’allenamento da un occhio all’altro. Questo indica che le basi neurali dell’apprendimento di questo tipo di compito sono localizzabili ad uno stadio di convergenza delle informazioni dei due occhi. Il primo stadio di convergenza sono i neuroni binoculari di V1 (ad esempio, lo strato sopragranulare). CONCLUSIONI: Il PL di stimoli come quelli usati nel presente studio risulta specifico per: posizione spaziale, orientamento (oltre i 30°) e frequenza spaziale. Il PL una volta ottenuto si mantiene nel tempo e mostra un trasferimento inter-oculare, il che suggerisce una base neurale che deve essere in V1 o successiva. Come si spiega l’estrema specificità spaziale e per orientamento emersa nello studio di Fiorentini & Berardi? Si spiega con il fatto che il PL sta avvenendo in V1, dove i neuroni hanno campi recettivi piccoli e quindi mostrano estrema selettività di risposta spaziale (e per orientamento). Direction-specific improvement in motion discrimination – Ball e Sekuler (1987). L’obiettivo degli autori è studiare la plasticità del meccanismo di apprendimento della percezione del movimento. In particolare sono interessati a studiare la specificità di tale apprendimento e la sua durata. Infine, cercano di capire quali possano essere le basi neurali di questo tipo di PL. 35 Perceptual learning (2) Specificità dell’input sensoriale Where practice makes perfect in texture discrimination: evidence for primary visual cortex plasticity – Karni & Sagi, (1991) cercano di determinare quale sia il livello neurale a cui avviene il PL nei compiti di discriminazione di tessitura. L’interesse di partenza era quello di valutare se e che tipo di apprendimento è possibile osservare in un compito di segregazione figura-sfondo (texture segregation). La texture segregation è un processo automatico e pre-attentivo che si ritiene avvenga a livelli precoci dell’elaborazione visiva (V1, V2). È possibile migliorare le proprie prestazioni in compiti di segregazione figura-sfondo che coinvolgono stati così precoci di elaborazione dell’informazione? In pratica ci si chiede se analisi così precoci siano permeabili all’effetto dell’allenamento o se siano invece processi automatici e obbligatori fissi. Gli autori sono inoltre interessati a valutare la specificità di questo tipo di apprendimento in termini di: orientamento, posizione spaziale (retinotopia) e monocularità. Metodo: o Partecipanti: 5 soggetti naïve ed uno degli autori o Procedura: i soggetti venivano sottoposti a sessioni di 16-20 blocchi d 50 prove ciascuno (ca. 1000 prove per sessione). Le sessioni venivano svolte a distanza di 1-2 giorni. Stimoli: usano la tecnica del masking per ridurre la visibilità dello stimolo e rendere il compito impegnativo. o Gli stimoli erano composti da trame (textures) in cui il target (foreground) era composto da tre elementi che si distinguevano dallo sfondo (background) solo per il loro orientamento; o La posizione esatta del target veniva variata casualmente all’interno di un area ristretta della scena visiva in modo da permettere una successiva misurazione del grado di trasferimento su altre posizioni; o Per assicurarsi che i soggetti mantenessero lo sguardo fisso al centro, e quindi i target venissero presentati sempre nella stessa posizione retinica, veniva presentato un compito centrale (compito a scelta forzata sul riconoscimento di lettere). Procedura: o Risposta 1: riporta quale delle due lettere è apparsa al centro dello schermo (T o L) → feedback uditivo sulla risposta. o Risposta 2: riporta l’orientamento del target (verticale o orizzontale). Si noti che la risposta 2 non riguarda l’orientamento delle singole linee che compongono il target (l’orientamento delle tre linee era sempre la stessa, 45° o 135°), ma il loro allineamento rispetto allo sfondo! La variabile indipendente scelta per misurare il grado di apprendimento era il tempo trascorso tra lo stimolo e la maschera (SOA). Nei paradigmi di mascheramento temporale, minore è l’intervallo tra lo stimolo e la maschera, minore è la visibilità dello stimolo! Nella prima sessione veniva scelto un SOA abbastanza lungo (250-300 ms) di modo da rendere il compito piuttosto facile (95% di risposte corrette). Ad ogni sessione l’SOA veniva ridotto di 20 ms ogni 150-200 prove. Nelle sessioni successive il valore SOA di partenza era il valore SOA più basso della sessione precedente a cui i soggetti rispondevano correttamente il 95% delle volte. In questo modo era possibile stimare una funzione psicometrica calcolata sulla percentuale di risposte corrette ad ogni livello di SOA testato. L’apprendimento veniva misurato come la variazione, ad ogni sessione, del valore di SOA per cui i soggetti rispondevano correttamente nell’80% delle prove. Risultati: o L’intervallo SOA richiesto per eseguire il compito all’80% di risposte corrette era più che dimezzato con la pratica. o L’apprendimento mostrava un andamento rapido nelle prime sessioni e lento verso la fine, raggiungendo un livello stabile dopo 5-10 sessioni. o L’apprendimento non trasferisce per posizioni diverse da quelle allenate. Se veniva riproposto lo stesso compito dopo il training a soli 3 gradi di distanza dalla posizione addestrata, le prestazioni tornavano pari a quelle di partenza ed il compito doveva completamente essere “ri-appreso”. Erano necessarie ancora 5-10 sessioni per arrivare ad un miglioramento simile a quello della serie iniziale. 36 Una volta raggiunto l’asintoto per ogni soggetto (massimo livello di apprendimento) gli autori testarono il grado di specificità di tale apprendimento per mezzo di alcuni cambiamenti sulle proprietà dello stimolo. Specificità per orientamento – I partecipanti venivano testati nuovamente utilizzando orientamenti ortogonali delle linee target → Nessun cambiamento rispetto al valore di asintoto raggiunto. Specificità per orientamento – Target presentati con orientamento verticale, aumentando il gradiente assoluto tra foreground e background da 45 a 90° → Le prestazioni erano addirittura migliori rispetto all’asintoto raggiunto dopo il training. Specificità per orientamento dello sfondo – Veniva presentato il background con orientamento ortogonale, mantenendo quello dei target lo stesso → Drammatico decremento delle prestazioni. Soglie significativamente più alte. Trasferimento inter-oculare: Ultimo esperimento in cui gli autori valutano il grado di trasferimento dell’apprendimento tra i due occhi. Tre partecipanti sottoposti allo stesso paradigma di training ma su un solo occhio, mentre l’altro veniva bendato per tutta la durata delle sessioni. I risultati dimostrano una percentuale di trasferimento piuttosto bassa (18%), paragonabile a quella ottenuta spostando i target su una nuova posizione all’interno dello stesso quadrante (cerchio bianco occhio non addestrato, cerchio nero occhio addestrato). CONCLUSIONI: I risultati di questo studio indicano che l’efficienza con cui i partecipanti riescono ad estrarre informazioni rilevanti da una texture può essere migliorata attraverso la pratica, fino ad una drastica diminuzione del tempo necessario per una corretta elaborazione degli stimoli. Questo tipo di apprendimento risulta specifico per posizione ma non per orientamento dei target. Tuttavia l’apprendimento risulta specifico per l’orientamento delle linee sullo sfondo. Gli autori non forniscono una spiegazione convincente per questo risultato. Il lavoro di Karni e Sagi fornisce una prima idea di come il PL sia un fenomeno complesso, strettamente legato al tipo di compito ed ai meccanismi visivi coinvolti. Ma cosa ci può dire la specificità retinica che è stata osservata nel loro studio in merito allo stadio di analisi in cui avviene il PL? Human perceptual learning in identifying the oblique orientation: retinotopy, orientation specificity and monocularity (Schoups, Vogel e Orban, 1995) – Gli autori vogliono studiare più in dettaglio la specificità spaziale del PL. L’intento principale del loro studio è quello di investigare a fondo il trasferimento e la specificità del PL, tenendo in considerazione varie posizioni spaziali a distanza diversa da quella addestrata. Inoltre gli autori intendono studiare anche il trasferimento del PL a livello inter-oculare. Metodo: o Partecipanti: 6 soggetti naïve o Stimoli: gratings definiti da strisce di rumore visivo, della grandezza di 2,5° Procedura: o Un solo grating veniva presentato ad ogni prova per 300 ms. o I partecipanti dovevano rispondere se il grating era orientato in senso orario o antiorario rispetto ad un’inclinazione di riferimento (inclinazione a sinistra). o Venivano effettuati 16 blocchi di 100 prove al giorno, fino al raggiungimento dell’asintoto di apprendimento. o Ad ogni blocco veniva utilizzata una procedura staircase up-down che puntava all’84% di risposte giuste. Questa percentuale era chiamata JND (Just Noticeable Difference) e forniva una misura in gradi di angolo visivo (inclinazione dello stimolo dai 45°) della capacità discriminativa del soggetto. Risultati: o Tutti i soggetti migliorarono le prestazioni nel compito di discriminazione di orientamento. Il training è evidente come gruppo ma anche nel singolo soggetto (K. L.) o Specificità orientamento: Se però viene ruotato lo stimolo di 90° il PL viene perso e deve ricominciare. L’effetto è presente nel gruppo ma anche nel singolo soggetto (K. L.) 37 Così come nei risultati di Karni & Sagi, l’apprendimento era rapido nella fase iniziale e rallentava dopo le prime 5-10 sessioni. Trasferimento retinotopico – L’apprendimento osservato nel compito di discriminazione di orientamento è da considerarsi ristretto alla regione stimolata? Quanto è precisa la componente retinotopica dell’apprendimento, e quanto lontano devono essere uno stimolo addestrato ed uno nuovo per non osservare nessun grado di trasferimento? Dopo aver testato lo stimolo su varie posizioni spaziali, gli autori osservarono una completa mancanza di trasferimento. Trasferimento inter-oculare – Quattro soggetti vennero sottoposti a training monoculare nel compito di discriminazione di orientamento. Dopo il raggiungimento del grado massimo di apprendimento, vennero testati con gli stessi stimoli, ma sull’occhio non addestrato. Tre dei 4 soggetti mostrarono un trasferimento inter-oculare completo! No apprendimento all’interno della stessa sessione di allenamento! L’apprendimento pare aver luogo solo tra sessioni consecutive in diversi giorni. Gli autori ipotizzano che sia necessaria una fase di consolidamento dell’apprendimento che avviene durante il sonno notturno. CONCLUSIONI: L’apprendimento percettivo legato alla pratica porta ad un significativo aumento della capacità di discriminare orientamenti. Date le caratteristiche di questa forma di apprendimento, è possibile assumere che i suoi correlati neurali siano situati a livelli precoci delle aree visive. Uno dei risultati importanti è l’elevata specificità retinica del PL in questo tipo di compito. Il miglioramento non avviene nella sessione di training ma tra sessioni diverse in giorni diversi: necessità fase di consolidamento notturno. In realtà spesso si osserva miglioramento anche all’interno della stessa sessione (forse dipende dal compito discriminativo usato). 40 Risultati: In seguito all’allenamento diminuisce il tempo di esposizione dello stimolo necessario ad ottenere la stessa accuratezza (spostamento verso sinistra e verticalizzazione della curva psicometrica), sia per il compito locale che per quello globale. Il SOA per accuratezza del’82% diminuisce mediamente di più del 50% in seguito a training ad asintoto. Il miglioramento della performance è specifico per le caratteristiche fisiche dello stimolo. Questo suggerisce che l’apprendimento avviene ad un livello in cui i diversi attributi dello stimolo (come orientamento e dimensione), sono analizzati separatamente. La specificità dell’apprendimento è inoltre limitata alle caratteristiche che sono rilevanti per il compito utilizzato durante l’allenamento. Una domanda interessante è: cosa succede se, nella fase di test, lo stimolo rimane lo stesso usato durante l’allenamento, ma il compito è diverso? L’apprendimento è guidato solo dalle caratteristiche dello stimolo o c’è specificità dell’apprendimento anche per il contesto comportamentale in cui avviene l’apprendimento? Il Lavoro di Shiu & Pashler aveva suggerito un ruolo specifico dell’attenzione. L’allenamento sul compito locale porta ad un miglioramento della performance sul compito allenato, ma non sul compito globale. Risultati simili si ottengono anche con l’allenamento sul compito globale, anche se si può notare una certa asimmetria (parziale trasferimento dell’apprendimento). Asimmetria del trasferimento – Il compito di detezione viene appreso anche in assenza di attenzione selettiva volontaria, a differenza di quanto accade per il compito globale. È quindi possibile che la detezione avvenga in aree visive primarie che sono meno influenzabili da fattori attentivi, oppure l’elemento saliente cattura l’attenzione anche se si sta facendo il compito globale? CONCLUSIONI: I risultati mostrano che l’apprendimento dipende dalle caratteristiche fisiche dello stimolo che sono rilevanti per il compito su cui viene fatto il training. L’apprendimento è però controllato da un meccanismo attentivo. Risulta infatti essere specifico per le caratteristiche su cui viene portata l’attenzione durante l’allenamento. L’apprendimento interessa quindi solo quei neuroni che sono attivati dalle caratteristiche dello stimolo (specificità), e che allo stesso tempo sono rilevanti per svolgere il compito. Motion perceptual learning: when only task-relevant information is learned (Huang, Lu et al). Lo scopo di questo esperimento è studiare se è possibile apprendere delle caratteristiche soprasoglia di uno stimolo quando queste non sono rilevanti durante la fase di allenamento. In questo studio, diversamente da quelli precedenti, il PL riguarda la percezione del movimento. Compito: Compito di detezione del movimento: scelta forzata a due intervalli (movimento nel primo o secondo intervallo?). Compito di discriminazione del movimento: direzione oraria o antioraria rispetto a direzione di riferimento? Si noti che la direzione di movimento è una caratteristica rilevante solo per i partecipanti a cui era stato assegnato il compito corrispondente. Procedura: o Sessione di familiarizzazione ▪ Orientamento di riferimento: 45° o 135° ▪ Compito detezione: • Direzione ± 8° dalla direzione di riferimento (primo o secondo intervallo?) • % di coerenza fissa (50%) ▪ Compito discriminazione: • Direzione ± 40° dalla direzione di riferimento • % di coerenza fissa (50%) ▪ Feedback ad ogni trial ▪ Ripetuto fino al raggiungimento di accuratezza del 95% o Stima delle curve psicometriche per entrambi i compiti per ciascun partecipante ▪ Orientamento di riferimento: 45° o 135° ▪ Compito detezione: 41 • % coerenza testate: 5%, 10%, 15%, 20%, 30%, 40% • Direzione ± 8° dalla direzione di riferimento ▪ Compito discriminazione: • % coerenza che garantisce 95% di accuratezza in detezione • Direzioni testate: ±3°, ±5°, ±8°, ±11°, ±15°, ±30°. ▪ No feedback ▪ La stima delle curve psicometriche viene ripetuta dopo l’allenamento o Training con compito di discriminazione oppure di detezione ▪ Compito detezione: • 10 partecipanti • % Coerenza iniziale: 40%, poi adattata in modo da mantenere l’80% di risposte corrette ▪ Compito discriminazione: • 9 partecipanti • Direzione iniziale: ±20° dalla direzione di riferimento, poi adattata in modo da mantenere l’80% di risposte corrette ▪ Training per 8 o 15 giorni • Feedback ad ogni prova o Stima delle curve psicometriche (come al punto 2) Tutti i partecipanti migliorano in seguito al training, sia nel compito di detezione, sia in quello di discriminazione. CONCLUSIONI: Apprendimento di discriminazione si trasferisce a detezione, ma non viceversa. La direzione del movimento, che non era rilevante per il compito, non fa parte delle informazioni che vengono apprese nel compito di detezione, e quindi non trasferisce al compito di discriminazione. Viceversa il compito di discriminazione richiede sempre anche di rilevare la presenza del movimento (detezione) e quindi l’allenamento trasferisce al compito di detezione. I risultati di questi studi suggeriscono che l’attenzione sia un meccanismo fondamentale per il controllo dell’apprendimento percettivo. Perché ci sia apprendimento non solo bisogna portare l’attenzione su uno stimolo, ma bisogna anche selezionare attivamente la caratteristica che si vuole apprendere. 42 Perceptual learning (4) Specificità VS trasferimento Abbiamo visto che esiste un notevole livello di specificità nell’apprendimento di semplici stimoli visivi: - Specificità per posizione - Specificità per orientamento - Specificità per frequenza spaziale - Specificità per direzione di movimento - Specificità per compito (globale vs. locale) L’elevato livello di specificità è in parte un problema per il PL, perché lo rende limitato alle caratteristiche dello stimolo/compito usato durante l’allenamento. Una questione interessante è se questa specificità sia inevitabile, o se possa essere in qualche modo superata/attenuata. È quindi possibile indurre una generalizzazione o trasferimento del PL? Complete transfer of perceptual learning across retinal locations enabled by double training (Xiao, Zhang et al). Come si può spiegare la specificità del PL? La spiegazione tradizionale è che l’allenamento cambi qualche proprietà di risposta dei neuroni delle aree visive primarie. L’allenamento provocherebbe una regolazione della proprietà di risposta (tuning) dei neuroni, in modo che diventino sempre più sensibili alla caratteristica allenata. PL come tuning in aree visive primarie → Esiste però anche un’altra spiegazione, che presuppone che il PL non dipenda da cambiamenti nelle proprietà di risposta dei neuroni nelle aree visive primarie. Il PL avviene perché cambiano le connessioni tra aree decisionali di alto livello e i neuroni sensoriali. PL come tuning delle connessioni tra aree di alto livello e aree visive primarie → Nessun cambiamento nelle proprietà di risposta in V1. Il PL dipenderebbe dal fatto che le aree decisionali si connettono meglio con i neuroni rilevanti per il compito, riducendo le connessioni con quelli meno rilevanti. Meccanismo di re- weighting (ripesaggio delle connessioni). Il meccanismo di re-weighting è specifico per posizione allenata. L’unità decisionale per ottimizzare le connessioni deve essere quindi collegata con una certa area del campo visivo. L’idea di Xiao et al. è quindi vedere se si può trasferire il learning “preparando” il collegamento tra i neuroni sensoriali e quelli decisionali. Il paradigma del Double training – Prevede tre fasi distinte; nella prima fase (FEATURE LEARNING) si allena la discriminazione di una certa caratteristica dello stimolo (es. orientamento) nella posizione 1; nella seconda fase (LOCATION LEARNING) si allena la discriminazione di una diversa caratteristica (es. contrasto) dello stimolo nella posizione 2; nella terza fase si testa la caratteristica allenata in 1 nella posizione 2 per valutarne l’eventuale trasferimento. Esperimento 1: 8 partecipanti con il compito di discriminazione di contrasto in una scelta forzata a 2 intervalli (2IFC “Quale dei 2 stimoli ha contrasto maggiore?”). Uso di una staircase per stimare la soglia di contrasto al 80% di risposte corrette. Procedura: training tradizionale o 6 sessioni di allenamento o 2 ore di allenamento per sessione in una posizione o Test in una posizione diversa nello stesso emisfero 45 Fase di training: o Perceptual grouping indotto attraverso il principio di similarità (Gestalt) o 1500 presentazioni per sessione, divise in 5 blocchi consecutivi o Compito: rilevare il gabor (attended) a basso contrasto Fase di test: o 900 trial divisi in 3 blocchi consecutivi, ciascuno per ogni posizione o Task: discriminazione di orientamento grating (same vs. different) Risultati: Nella prima sessione la prestazione (d’) non differisce tra le diverse posizioni; nell’ultima sessione le prestazioni nella posizione attesa e in quella grouping sono più alte della prestazione nella posizione no-grouping. Aspetti critici: Non è certo che sia stato davvero il perceptual grouping a favorire una prestazione più alta nella posizione grouping rispetto a quella no-grouping. Infatti la prestazione migliore nella posizione grouping rispetto alla nogrouping potrebbe spiegarsi con il fatto che nella grouping il gabor aveva lo stesso orientamento di quello atteso durante la fase di training. Esperimento 2: 38 partecipanti (6 esclusi dalle analisi) Fase di training: o Perceptual grouping indotto attraverso il principio della regione comune (Gestalt) o Il gabor della condizione grouping ha orientamento diverso da quello attended e uguale a quello no-grouping Risultati: Nella prima sessione la prestazione (d’) non differisce tra le diverse posizioni; nell’ultima sessione le prestazioni nella posizione attesa e in quella grouping sono più alte della prestazione nella posizione no-grouping. CONCLUSIONI: Il raggruppamento percettivo sembra essere un fattore importante nei meccanismi di apprendimento percettivo. Non è chiaro se il perceptual grouping agisca sul perceptual learning direttamente o attraverso l’attenzione. I nostri dati sembrano suggerire più un’azione diretta. Altri esperimenti sono necessari per indagare meglio il ruolo del perceptual grouping nel perceptual learning. 46 Introduzione alla dipendenza (1) Condizionamento classico e operante Perché studiare i meccanismi che portano alla dipendenza da droghe in un corso sulla plasticità e sull’apprendimento? Cosa c’entra la dipendenza con la plasticità e l’apprendimento? Lo sviluppo e il mantenimento della dipendenza si basano principalmente su processi di apprendimento di tipo associativo e non-associativo. Un ruolo cruciale è svolto dal condizionamento classico ed operante, e da cambiamenti a lungo termine nella risposta neurale di alcuni circuiti cerebrali, che vanno incontro a sensibilizzazione. Stiamo quindi parlando a tutti gli effetti di meccanismi di apprendimento e quindi di plasticità. Si tratta di una plasticità disfunzionale, ma i meccanismi neurali sono gli stessi che regolano la plasticità quando si rivela adattiva e funzionale. Gli argomenti che verranno affrontati sono: meccanismi di apprendimento e motivazionali; dalle azioni alle abitudini; teorie della dipendenza (edonica, dell’apprendimento anomalo, della sensibilizzazione o salienza motivazionale); basi neurali della dipendenza. Prima di passare ad analizzare le principali teorie sullo sviluppo della dipendenza è necessario avere chiari i concetti di: apprendimento (classico e operante), motivazione (teoria di Hull), teoria degli incentivi (Toates). Dipendenza come processo di apprendimento – Ci sono evidenze che la dipendenza si sviluppa attraverso un processo di apprendimento. In particolare, nella dipendenza ha un ruolo importante il condizionamento. - Meccanismi di condizionamento strumentale: assunzione della sostanza → rinforzo e sviluppo di abitudini. - Meccanismi di condizionamento classico: alcuni stimoli ambientali (CS) acquisiscono un potente effetto motivazionale circa l’assunzione della droga (US). CONDIZIONAMENTO CLASSICO – PAVLOVIANO (o del I tipo) Un concetto cardine dell’apprendimento associativo è il fatto che il sistema nervoso si rappresenta la relazione associativa tra due o più eventi (stimoli e/o risposte) che hanno luogo in una finestra temporale relativamente breve. Nel condizionamento classico (o pavloviano) i fattori che lo determinano cono la contiguità e la contingenza. ➢ Gli stimoli incondizionati (unconditioned stimulus, US) sono specifici stimoli che evocano automaticamente una certa risposta nell’organismo (il riflesso, come il cibo che produce salivazione) ed ogni specie animale può avere i propri US specifici. ➢ La risposta incondizionata (unconditioned response, UR) è la risposta (riflesso, come la salivazione) evocata nell’animale dalla presentazione di US. ➢ Lo stimolo neutro (neutral stimulus, NS) è uno stimolo che non evoca nessuna UR (riflesso, come il suono di un campanello) nell’animale. ➢ Lo stimolo condizionato (conditioned stimulus, CS) è uno stimolo che dopo ripetuti accoppiamenti con US è in grado di evocare una risposta simile alla UR. ➢ La risposta condizionata (conditioned response, CR) è la risposta emessa dall’animale alla sola comparsa di CS. È la prova che è avvenuto il condizionamento, e cioè che lo stimolo neutro è diventato un CS. Affinchè avvenga condizionamento, ci deve essere contiguità temporale tra stimolo condizionato e stimolo incondizionato: di norma CS precede US. → Forward conditioning – l’intervallo ottimale tra l’inizio di CS e US è solitamente inferiore ai 2 secondi. Trace e delay conditioning differiscono tra loro per il tipo di relazione temporale tra CS e US. → Condizionamento di secondo ordine – il meccanismo di apprendimento associativo può coinvolgere più di un CS. → Overshadowing – non tutti gli stimoli hanno la stessa potenzialità di condizionamento: quello preferenziale ostacola il condizionamento dell’altro. Ogni specie ha i propri stimoli preferenziali, determinati da particolari vincoli biologici. → Generalizzazione della CR – la CR viene evocata anche da stimoli simili al CS. Quanto più lo stimolo è simile al CS, tanto più è facile che evochi la CR. Quanto più è diverso, tanto meno è probabile. 47 → Estinzione della CR – se si continua a presentare solo CS la CR verrà abolita. Due possibili meccanismi: viene cancellata l’associazione CS-US, oppure viene appresa una nuova relazione CS-nonUS. → Recupero spontaneo della CR – una volta ottenuta l’estinzione di CR se si aspetta un po’ di tempo e poi si ripresenta CS allora riappare CR. L’estinzione dopo recupero spontaneo è più rapida. Questo fatto suggerisce che durante l’estinzione non si fosse cancellata la relazione CS-US. Ma cosa causa il condizionamento classico secondo Pavlov? Il condizionamento avverrebbe perché US funziona come un rinforzo del legame associativo con CS. Più forte è il legame, più facilmente CS agirà come US e quindi attiverà CR (o UR). L’accoppiamento CS-US, cioè la contiguità temporale tra i due eventi, sarebbe quindi sufficiente. La contingenza: accoppiamento e contiguità sono sufficienti? Negli anni ‘60 del secolo scorso alcuni lavori hanno cominciato a mettere in crisi l’idea che la semplice contiguità tra CS e US fosse sufficiente, dimostrando che il meccanismo che consente il condizionamento classico era più complesso (Kamin e Rescorla). L’importanza della predittività di CS → Il blocking (Kamin, 1968) – Lo stimolo B non produce condizionamento perché l’informazione che fornisce circa la probabilità di comparsa di US è già fornita dallo stimolo A (condizionamento precedente). Quindi B non aggiunge nessuna nuova informazione al sistema cognitivo in merito a US, e pertanto la sua relazione con US non viene appresa perché irrilevante. L’importanza della contingenza tra CS e US → il lavoro di Rescorla (1967) – Dimostra come la contiguità non sia sufficiente affinchè si verifichi condizionamento. Il fattore cruciale è invece la contingenza, cioè deve esistere una relazione predittiva tra CS e US. Si osserva condizionamento solo quando la probabilità di comparsa di US è maggiore in presenza di CS che in sua assenza: 𝑝(𝑈𝑆|𝐶𝑆) > 𝑝(𝑈𝑆|¬𝐶𝑆). Gli esperimenti di Rescorla, così come il fenomeno del blocking, dimostrano che anche nel condizionamento classico sono in gioco fattori cognitivi. L’organismo deve poter crearsi un’aspettativa, una credenza su uno stato del mondo nel formato “se, allora”. Nello specifico, l’aspettativa/credenza riguarda la relazione tra CS e US. Solo se CS predice US avviene il condizionamento (non basta la semplice contiguità temporale)! CONDIZIONAMENTO STRUMENTALE – OPERANTE (o del II tipo) Secondo Thorndike, l’apprendimento è un processo incrementale che avviene per prove ed errori. Egli misura quanto tempo impiega il gatto a trovare la soluzione per uscire dalla gabbia. Una volta uscito, il gatto ottiene la ricompensa e viene rimesso nella gabbia per un’altra prova. Il gatto è motivato a cercare una soluzione per uscire, perché vede del cibo all’esterno e vuole raggiungerlo. Il comportamento è quindi emesso con un obiettivo (questo è un aspetto teorico importante che differenzia il lavoro di Thorndike da quello di Skinner). Le azioni sono inizialmente casuali, ma guidate dalla motivazione. Alcuni comportamenti non portano a nessuna conseguenza piacevole e quindi non vengono rinforzati. La pressione della leva, all’inizio per puro caso, è invece seguita da un premio (questo aumenta la probabilità che sia ripetuta in seguito). Quello che dimostrano gli esperimenti di Thorndike è che l’individuo apprende per mezzo delle conseguenze delle proprie azioni. Thorndike scopre il principio di base del condizionamento strumentale/operante, studiato poi estesamente da Konorki e Skinner. L’apprendimento avviene in base a rinforzi e punizioni. Il fatto che l’animale impari dalle conseguenze delle proprie azioni non implica necessariamente che esso creda che la sua risposta sia causa del risultato (outcome) che la segue. Semplicemente, il premio potrebbe agire sull’associazione tra le due rappresentazioni attive, quella dello stimolo e quella della risposta, rinforzandone il legame. L’approccio di Skinner allo studio del comportamento è chiamato comportamentismo radicale, perché non viene riconosciuto ai processi mentali un ruolo causale nel comportamento. Il comportamento è determinato da vincoli genetici e biologici, ma soprattutto dall’interazione dell’organismo con l’ambiente. Per Skinner, le cause del comportamento non risiedono in pensieri, emozioni e stati di coscienza. Attenzione, non nega che esistano questi stati mentali, ma ritiene però che non siano le cause del comportamento. Per spiegare il comportamento si farebbe appello a queste cause interne semplicemente perché non si è in grado di scoprire le vere cause esterne del comportamento. Accetta però il concetto di motivazione indotto dallo stato fisiologico come spinta iniziale per agire, e come condizione per dare valore al rinforzo. Infatti mantiene i suoi animali al 75% del proprio peso corporeo. Il comportamento è invece 50 L’autoshaping è un fenomeno osservato per la prima volta da Brown e Jenkins (1968), nell’ambito di un paradigma di condizionamento pavloviano. L’animale è esposto a un CS seguito dall’arrivo di un US (di fatto US è un reward per l’animale, nel senso di stimolo-rinforzo piacevole). Dopo la prima fase di condizionamento, l’animale sviluppa interesse per il CS. Come si spiega l’autoshaping? Nell’autoshaping l’animale comincia a comportarsi come se CS fosse US. Si noti che US non può aver agito come un rinforzo, perché non c’è alcuna risposta che viene rinforzata. Infatti, il reward (US) viene dato a prescindere da quello che l’animale sta facendo. È un condizionamento classico, quindi non è richiesta alcuna risposta per ottenere US. Però si potrebbe ancora sostenere che US ha involontariamente rinforzato il beccare CS (si veda il piccione superstizioso di Skinner). Che non sia così è però provato dalla procedura di omissione. L’autoshaping si verifica anche se US (reward) viene omesso ogni volta che l’animale agisce su CS (per esempio, beccando la luce). Nonostante l’azione su CS comporti l’omissione del reward, l’animale non riesce a smettere di agire su questo CS. Questo esclude la spiegazione secondo cui l’autoshaping si verifica perché US ha rinforzato l’azione su CS. Non tutti gli individui mostrano autoshaping: quelli che lo mostrano sono definiti sign tracker (a un certo punto sono più interessati al CS, cioè al segno/indicatore di US, che a US). Quelli che continuano a mostrare interesse per il reward (US) sono detti goal tracker. Le cause che portano un animale a diventare un sign tracker piuttosto che un goal tracker non sono chiare, ma è possibile siano coinvolte differenze genetiche o ormonali. Essere sign/goal tracker può essere anche una questione di grado. Sebbene non esista una spiegazione univoca dell’autoshaping, si ipotizza che il CS acquisisca una salienza o valore motivazionale pari a quelli di US, così da innescare comportamenti consumatori compulsivi (come quelli presenti nella dipendenza). Questa interpretazione è coerente con la presenza dell’autoshaping anche nella procedura di omissione. Bolles (1972) propone che l’azione del reward non riguardi principalmente rinforzare la relazione tra S e R o tra S e S attraverso una riduzione di pulsione. Il reward causerebbe un altro tipo di apprendimento, e cioè porterebbe l’animale ad imparare che esiste uno stimolo (CS) che anticipa l’arrivo di un altro stimolo (il reward stesso) che ha proprietà edoniche. Quindi il cibo dato in risposta alla pressione di una leva non porta ad imparare a premere la leva perché riduce la fame, ma porta soprattutto ad imparare che la leva predice l’arrivo di uno stimolo piacevole, e questo sarebbe il motivo per cui si preme la leva. Nel condizionamento pavloviano le stesse proprietà edoniche e motivazionali del reward passano (vengono associate) al CS. Si noti che il meccanismo di associazione pavloviana funziona anche nel paradigma di condizionamento strumentale. Secondo la TEORIA DEGLI INCENTIVI MOTIVAZIONALI di Bindra (1978), lo CS evoca nell’animale lo stesso stato motivazionale evocato dal reward. Lo CS diventa un incentivo ad agire, cioè una sorgente di motivazione e può essere trattato come un reward. Questo spiega perché, nell’autoshaping, l’animale tenti di consumare CS, come farebbe con il reward. Le proprietà motivazionali acquisite rendono il CS attraente. Attraverso meccanismi di tipo pavloviano, le caratteristiche incentivanti del reward vengono acquisite dallo CS. Lo CS è percepito come se fosse un reward. Quindi: - Teoria Hulliana: ci si muove per ridurre una pulsione che nasce da uno squilibrio. Il reward agisce come rinforzo dell’azione che porta alla riduzione dello squilibrio. - Teoria degli incentivi (Bolles e Bindra): ci si muove perché alcuni stimoli (reward) sono intrinsecamente appetibili, non perché riducono una pulsione. I CS possono portare all’azione perché acquisiscono il valore motivazionale dei reward, anche se non riducono alcuna pulsione (beccare la luce non fa passare la fame). Toates (1986) e la TEORIA DEGLI INCENTIVI – I reward sono l’oggetto della nostra motivazione. Il reward è uno stimolo che produce sensazioni piacevoli quando ottenuto (un buon cibo, una bibita rinfrescante, un partner attraente). 51 Toates riconsidera il ruolo degli stati fisiologici nella teoria degli incentivi. La sua posizione è che gli stati fisiologici servono per potenziare il valore del reward. Il valore edonico degli incentivi non è assoluto, ma dipende dallo stato fisiologico. Quanto ci può piacere un cibo dipende dal fatto che siamo affamati o meno. Cabanac (1979) infatti aveva dimostrato che i soggetti umani giudicano la stessa soluzione zuccherina più o meno buona a seconda del livello di fame → alliestesia = la percezione (anche edonica) di uno stimolo dipende dallo stato fisiologico. Toates aggiunge un aspetto importante alla teoria originariamente sviluppata da Bolles e Bindra. Se le pulsioni aumentano il potere motivazionale del reward, cioè voglio di più la pizza se ho fame, il reward può aumentare il livello di fame e quindi la motivazione. Ecco perché assaggiare una patatina può portare a mangiare tutto il pacchetto anche se non avevamo fame (“l’appetito vien mangiando”). L’influenza tra stato fisiologico e reward sulla motivazione è bidirezionale. La fame può potenziare il valore edonico del reward (se ho fame le cose sembrano più buone), ma il reward, funzionando come incentivo, può potenziare il livello di fame (se assaggio una cosa buona può venirmi fame). Sappiamo che i CS possono assumere le proprietà di un reward, e possono essere in grado di funzionare come incentivo che genera una motivazione e quindi anche il loro valore è potenziato dallo stato fisiologico. I simboli pubblicitari sono dei CS che innescano un desiderio per il reward (inducono motivazione): funzionano di più se abbiamo fame, ma possono portarci a mangiare anche se non avevamo fame. Quando un CS innesca un desiderio e la motivazione (Weingarten, 1983) – Weingarten nota che normalmente si ritiene che un organismo cerchi il cibo quando ha fame, cioè è in uno stato di deficienza nutrizionale (cioè la motivazione nasce dallo stato fisiologico, come previsto dalla drive-reduction theory di Hull). Tuttavia anche CS associati al cibo possono indurre motivazione a consumare il cibo (come previsto dalla teoria degli incentivi motivazionali). Weingarten vuole quindi testare questa ipotesi, cioè che dei CS possano controllare quando e se l’animale cerca e consuma il cibo, a prescindere dallo stato di fame. I. Prima fase (11 giorni) di condizionamento pavloviano: CS+ (suono) precede rilascio del latte (US) in una ciotola. II. Seconda fase di test (21 giorni): Il ratto ha pieno accesso al cibo tramite un dispenser durante tutto il giorno, ma una volta al giorno viene presentato anche il CS+ e rilasciato altro latte nella ciotola. I risultati mostrano che pur essendo sazio, il ratto consuma il cibo rilasciato nella ciotola quando è preceduto dal CS+. Conduce poi un secondo esperimento simile al primo, ma nella fase di test ci sono giorni in cui il CS+ è presente e giorni in cui è assente. La quantità di latte assunto è simile nei due giorni, ma nei giorni in cui è presente il CS+ il 20% del latte viene assunto dalla ciotola. Il ratto quindi preferisce mangiare il latte quando viene anticipato dal CS, che quindi controlla la sua motivazione ad ingerire cibo. I risultati del lavoro di Weingarten dimostrano che la motivazione ad assumere cibo non è determinata solo dalla fame, ma anche da stimoli ambientali (incentivi) che hanno acquisito un loro valore motivazionale attraverso un condizionamento pavloviano. CONCLUSIONI: Il ruolo principale del reward non è quello di rinforzare una risposta, ma di promuoverla. Il reward è quindi un incentivo all’azione. Il livello di motivazione dipende dallo stato fisiologico, ma anche dal valore edonico del reward. Il reward però può alterare il livello di motivazione. Stimoli condizionati (CS) possono assumere le stesse proprietà del reward, innescando un desiderio (motivazione) per il reward. Riassumendo, il reward è un oggetto che ha un valore edonico positivo per un organismo. Il reward può essere primario (cibo) o condizionato (soldi) attraverso meccanismi pavloviani; può essere inteso sia come incentivo sia come rinforzo. L’incentivo è un oggetto che genera un desiderio o motivazione nell’animale e può essere primario o condizionato. Il rinforzo è un oggetto che aumenta la probabilità che l’animale emetta una risposta e può essere primario o condizionato. 52 Possiamo concludere che la motivazione può essere innescata da tre fattori: ▪ Lo stato fisiologico quando non in equilibrio genera una pulsione (per esempio la fame o la sete, ho fame e cerco il cibo). ▪ Un reward che produce uno stato edonico (assaggiare un pezzo di pizza fa venir voglia di mangiarne di più). ▪ CS associati a reward (la vista di un dolce scatena il desiderio di mangiarlo, la vista dell’insegna PIZZA fa venire voglia di pizza). La differenza tra sign tracker e goal tracker fornisce un esempio delle diverse forme di apprendimento che possono essere implicate nel condizionamento. Per i sign tracker il CS ha acquisito non solo potere predittivo per l’arrivo del US, ma anche le sue proprietà edoniche e motivazionali (lo trattano come US). Per i goal tracker il CS ha acquisito solo il potere predittivo circa l’arrivo del US (usano CS per prepararsi ad approcciare il vero US). 55 Il PARADIGMA DI SVALUTAZIONE DEL RINFORZO si basa sul condizionamento avversivo e sui meccanismi sottostanti. Il condizionamento avversivo è un caso di condizionamento pavloviano nel quale un CS predice l’arrivo di un US sgradevole. Come abbiamo però visto, nel condizionamento pavloviano le proprietà del US si possono trasferire sul CS. Un caso interessante che dimostra il trasferimento delle proprietà edoniche al CS si osserva nel condizionamento avversivo del sapore (taste aversion conditioning): un cibo commestibile viene usato come CS che viene accoppiato con un malessere indotto nell’animale, tipicamente attraverso iniezione di Cloruro di Litio, che provoca vomito. Dopo il condizionamento il ratto mostra reazioni di disgusto se gli viene fatto assaggiare il cibo (CS) che prima gli piaceva, ma che era stato accoppiato con il malessere. Si noti che è cambiato il sapore del cibo, cioè è cambiata la proprietà edonica del CS. Quindi se quel cibo non è più desiderato la domanda interessante è se il ratto è ancora disposto a premere una leva per ottenerlo. Questa è l’idea alla base del paradigma di svalutazione del rinforzo. Che questo fenomeno dipenda dal condizionamento è dimostrato dal fatto che risponde alle stesse regole, come ad esempio la latent inhibition = la capacità di condizionare un CS diminuisce se prima lo stimolo è presentato da solo più volte, in modo che si crei l’associazione CS-nonUS. Questo rallenta l’associazione CS-US successiva. È quindi più difficile creare taste aversion conditioning per un cibo piacevole che è consumato abitualmente dall’animale, poiché tale cibo ha una forte associazione con una sensazione piacevole. Instrumental responding following reinforcer devaluation (Adams & Dickinson, 1981). La pressione della leva è un gesto automatico (risposta) alla presenza della leva (stimolo) che è stato rinforzato, oppure è un’azione dettata dalla conoscenza della relazione causale tra pressione della leva e arrivo del reward? L’esperimento è diviso in 4 fasi e coinvolge 2 gruppi di ratti (paired e unpaired). Se nel condizionamento strumentale esiste una rappresentazione della relazione A-O, allora non c’è ragione per emettere un’azione se porta ad ottenere un outcome spiacevole! Se invece si tratta di una mera relazione S-R, la risposta evocata dallo stimolo è indipendente dal fatto che il rinforzo sia stato svalutato dopo l’apprendimento. Nella fase 2 il cibo diventa un CS predittore di uno stato di malessere. Diventa quindi un CS avversivo e non desiderato. I ratti del gruppo P (reward svalutato) sono molto meno interessati a premere la leva per ottenere un alimento che è diventato un CS avversivo. Questo è evidente sia in fase di estinzione sia in fase di riacquisizione del learning. Si noti che l’animale non ha mai avuto occasione di associare la pressione della leva con il malessere causato dall’iniezione di LiCl. CONCLUSIONI: I risultati suggeriscono che i ratti sanno che premendo la leva arriverà un certo reward. Infatti, quando in un secondo momento questo reward viene reso indesiderabile, i ratti riducono molto la pressione della leva. Questo significa che posseggono una rappresentazione che associa tra loro stimolo (la leva) risposta (pressione della leva) e conseguenze dell’azione (arrivo di un certo outcome). Quindi anche un semplice ratto è in grado di mostrare un comportamento strumentale guidato in modo teleologico! Ma anche negli esseri umani non tutti i comportamenti sono vere azioni (mostriamo anche comportamenti stereotipati del tipo S-R). In alcuni casi è addirittura necessario che ci siano tali gesti automatici, come quando impariamo a guidare l’auto in modo efficiente. Nella letteratura sull’essere umano si distingue tra processi controllati e automatici. È possibile che nel condizionamento strumentale il passaggio da un comportamento controllato di tipo teleologico ad uno automatico regolato dalle abitudini avvenga attraverso una pratica estesa: la ripetizione di un’azione può trasformarla in una risposta. Scoprire se la pratica può trasformare un comportamento guidato da conoscenze e aspettative, in uno automatico o abitudinario che è indipendente dal valore del rinforzo, è potenzialmente importante per spiegare in parte la dipendenza! Quando un’azione diventa un’abitudine quest’ultima potrebbe essere meno sensibile al valore del reward che la segue. 56 Variations in the sensitivity of instrumental responding to reinforcer devaluation (Adams, 1982). L’abitudine rende quindi insensibili al valore del reward? Questo lavoro tenta di dare una risposta a questa domanda. L’esperimento è diviso in 4 fasi e coinvolge 4 gruppi di ratti: un gruppo che esegue poco training (100 prove), con un sottogruppo con svalutazione (devalued) e un sottogruppo senza svalutazione (no-devalued) del reward; un gruppo che esegue molto training (500 prove), con un sottogruppo con svalutazione (D) e un sottogruppo senza svalutazione (N) del reward. Si inizia con una prima fase di training (condizionamento strumentale), poi si prosegue con una fase di condizionamento avversivo, e infine un test in estinzione. Per il gruppo 500 che ha fatto molto training, cioè ha automatizzato la risposta, la svalutazione del reward non ha effetto. Questi ratti lavorano per il reward indipendentemente dal fatto che sia stato svalutato o meno. Per il gruppo 100 che ha fatto poco training, e per il quale l’azione è guidata dal valore del reward, la svalutazione del reward è cruciale. Questi ratti lavorano solo se il reward non è stato svalutato. Il fatto che nella fase di riacquisizione i ratti del gruppo 500D non premano la leva per ottenere il reward, così come quelli del gruppo 100D, indica che il reward era stato effettivamente svalutato dal condizionamento avversivo. Quindi il fatto che la risposta era sostenuta in estinzione per il gruppo 500D si spiega con l’abitudine a premere la barra, abitudine creata tramite allenamento sostenuto. CONCLUSIONI: Con la pratica un’azione che è guidata dagli obiettivi, e quindi sensibile al valore della ricompensa (un comportamento razionale), può trasformarsi in una semplice risposta elicitata dallo stimolo, che poi si trasforma in un’abitudine. I comportamenti abitudinari non sono più azioni razionali, perché vengono eseguiti automaticamente anche quando portano a risultati non auspicati o desiderati. Questo ha fatto supporre che anche l’assunzione di droga nella dipendenza potrebbe essere dovuta ad una risposta automatica a certi stimoli ambientali. Si parla di apprendimento azione-outcome quando l’azione è eseguita con l’intenzione di ottenere un certo risultato (outcome). L’azione è sensibile alla svalutazione dell’outcome: l’animale che ha appreso a premere la leva per il cibo smette di premerla se il cibo è accoppiato con una sensazione spiacevole (svalutazione del reward); oppure se l’animale è sfamato (il cibo perde interesse). Si parla di apprendimento stimolo-risposta quando il comportamento è emesso automaticamente in risposta ad uno stimolo (comportamento rinforzato dal reward). L’animale non esegue il comportamento con l’intenzione di ottenere il reward, ma è quest’ultimo che ha rinforzato la nascita di una abitudine. La risposta è poco sensibile alla svalutazione del reward. Le azioni sono sensibili al valore del rinforzo che segue, le abitudini molto meno! È stato proposto che l’uso compulsivo di droghe può in parte essere dovuto al fatto che questo comportamento diventa un’abitudine (Tiffany, 1990) → questa posizione è stata però anche soggetta a critiche. Una possibilità è che le droghe agiscano come rinforzi che favoriscono il passaggio da un’azione ad una abitudine, portando quindi al consumo compulsivo delle stesse anche quando il valore del reward (piacere della droga) risulta diminuito. 57 La teoria edonica della dipendenza La dipendenza è un comportamento di consumo compulsivo verso sostanze come droghe e alcol, ma può riguardare anche il cibo, il sesso o il gioco d’azzardo. La dipendenza si manifesta quindi come una fortissima motivazione alla ricerca e assunzione di queste sostanze. L’obiettivo è capire i meccanismi psicologici e neurali che determinano la dipendenza. Alcune domande cruciali: perché si sviluppa una dipendenza? Quali sono i meccanismi psicologici implicati? La dipendenza può essere controllata? Quali circuiti neurali sono coinvolti? Cosa cambia nel cervello? Chiedersi perché le persone iniziano a drogarsi è molto diverso dal chiedersi perché poi continuano a farlo in modo compulsivo. È precisamente la compulsione che caratterizza la dipendenza! Le persone possono iniziare a drogarsi per un motivo (per esempio per provare piacere o per noia), ma poi potrebbero continuare per altre ragioni. La dipendenza è inoltre caratterizzata dal rischio di ricaduta. Una volta sviluppata una dipendenza la ricaduta è molto probabile anche dopo che si è smesso di assumere droga da molto tempo. L’uso ricreativo delle droghe invece non ha questo problema: ci sono persone che possono drogarsi senza sviluppare dipendenza. Un dato interessante riguarda l’incidenza dello sviluppo di dipendenza nelle persone che assumono droghe. Circa il 60% della popolazione adulta americana ha fatto, almeno una volta nella vita, uso di droghe (il 90% se si considera anche l’alcol). Tuttavia, contrariamente a quanto si potrebbe pensare, solo circa il 20% di chi fa uso di droghe sviluppa dipendenza. La dipendenza non è quindi caratterizzata solo da un uso regolare di droghe, ma: - riguarda una ricerca ed un uso compulsivo a scapito di altre attività sociali (famiglia, lavoro, studio, etc.) - un uso sostenuto anche se la droga non produce più un gran piacere - ricadute: si torna a drogarsi anche quando i sintomi di astinenza sono terminati Lo studio della dipendenza si basa ampiamente sui modelli animali (ratti e scimmie): permette studi anatomici e farmacologici, permette di partire da un organismo pulito e studiare sperimentalmente la transizione verso la dipendenza (questo non è possibile con i soggetti umani). Gli studi clinici su umani consento solo di studiare: il mantenimento dello stato di astinenza e i cambiamenti neurali associati alla dipendenza. Esistono diverse spiegazioni riguardo la dipendenza, ma la maggior parte può essere ricondotta a tre categorie principali: teoria edonica, teoria dell’apprendimento anomalo e teoria della salienza motivazionale. Tutte le spiegazioni fanno comunque riferimento ad alcune nozioni fondamentali: motivazione, apprendimento e plasticità neurale. Le due questioni principali a cui una teoria sulla dipendenza deve cercare di dare una risposta sono: perché in alcuni individui ricerca e consumo di droga si traducono in un comportamento compulsivo? Perché queste persone non sono in grado di smettere, o in altre parole perché esistono le ricadute? TEORIA EDONICA A DUE STATI – Esistono varie formulazioni della teoria, che vanno sotto i nomi di: - Teoria del piacere/dolore - Teoria dei rinforzi positivi/negativi - Teoria dell’omeostasi edonica - Teoria dei processi opponenti - Teoria della dis-regolazione edonica Il principio guida di questa teoria è che le persone assumano la droga per due motivi: 1) Per il piacere legato all’assunzione della droga; 2) Per evitare i sintomi spiacevoli dell’astinenza. In particolare i due processi controllerebbero fasi distinte: le persone iniziano a drogarsi per provare il piacere della droga, successivamente continuano in modo compulsivo per evitare il malessere legato all’astinenza. I sintomi da astinenza variano in funzione del tipo di droga e possono comprendere reazioni sia di tipo neurovegetativo sia affettivo. Un caso specifico: la teoria dei processi opponenti (Solomon & Corbit, 1974) – L’assunzione di droga genera dei processi fisiologici (rilascio di neurotrasmettitori, tipo DA) e psicologici (reazione di piacere), che sono seguiti da processi in direzione opposta (riduzione DA, e malessere), che almeno a livello fisiologico, sono tentativi di ristabilire l’equilibrio o omeostasi nel sistema (es. quello dopaminergico). Con l’assunzione ripetuta i processi positivi si riducono (assuefazione) mentre quelli negativi si amplificano (sensibilizzazione) nel tempo. La dipendenza si sviluppa come tentativo di ridurre gli effetti negativi assumendo ulteriore droga, con il risultato di distruggere sempre più l’omeostasi nel sistema DA. 60 La teoria dell’apprendimento anomalo Secondo la TEORIA DELL’APPRENDIMENTO ANOMALO, la dipendenza si sviluppa per un passaggio da un uso iniziale controllato, probabilmente motivato dal piacere, ad un uso incontrollato imputabile a meccanismi di apprendimento che creano associazioni molto forti tra stimoli ambientali e azioni, ricordi o sensazioni associate alla droga. Questa idea nasce dall’osservazione che l’attività dopaminergica nel NAcc sembra rappresentare un processo di apprendimento della relazione CS-US. Poiché la droga è un reward molto potente, l’ipotesi è che gli stessi meccanismi di apprendimento, qualora diventino aberranti, possano spiegare lo sviluppo della dipendenza da stupefacenti → si creano delle associazioni molto forti tra le rappresentazioni mentali di alcuni eventi. Queste associazioni sarebbero particolarmente potenti (anomali o aberranti) perché la droga attiva in modo esagerato il sistema dopaminergico di rinforzo (normalmente implicato nei meccanismi di apprendimento), portando a comportamenti compulsivi in presenza di alcuni stimoli. Le associazioni che verrebbero potenziate dalla droga in modo anomalo possono essere di 3 tipi (questi apprendimenti o associazioni possono essere sia espliciti/consapevoli, sia impliciti/inconsci): 1) Action-Outcome (azione-risultato) 2) Stimolo-Risposta (formazione di abitudini) 3) Stimolo-Stimolo (condizionamento pavloviano) Apprendimento anomalo ESPLICITO – Quando le persone assumono la droga è probabile che apprendano in modo consapevole due tipi di relazione: a) Quella tra certi stimoli ambientali e la droga (S-S) → imparo ad associare lo spacciatore agli effetti della droga, o la bottiglia di vino all’alcol. b) Quella tra l’azione di assumere la droga e gli effetti della droga stessa (A-O) → imparo che assumendo una certa sostanza provo piacere. Apprendimento anomalo esplicito = associazione tra stimoli/azioni e il ricordo esageratamente ottimistico degli effetti della droga (simile alla teoria edonica). L’attivazione di questo ricordo fa nascere inevitabilmente il desiderio di riassumere la droga. Ma può una aspettativa o ricordo anche esageratamente ottimistico degli effetti della droga portare all’uso compulsivo della droga? Non sembra molto probabile, se consideriamo: i resoconti che della loro vita fanno le persone dipendenti (spesso disastrosa e piena di sofferenza); che le persone dipendenti spesso riportano che drogarsi non gli procura più molto piacere (nonostante questo “desiderano” e cercano la droga). Apprendimento anomalo IMPLICITO – Gli apprendimenti impliciti in questo caso sono del tipo: - S-R: condizionamento strumentale-abitudine (si ricordi l’ipotesi di Tyffani per cui dipendenza=abitudine). - S-S: condizionamento pavloviano. Una visione tradizionale della dipendenza vuole che il passaggio dall’uso ricreativo a quello compulsivo avvenga perché la droga trasforma un’azione (A-O) in una abitudine (S-R). Molti autori hanno proposto che la dipendenza si basi su un meccanismo S-R che, data la presenza di certi stimoli, porta all’assunzione della droga. L’abitudine farebbe perdere, in alcune persone, il controllo sull’uso della droga. Particolari stimoli ambientali, associati con l’uso della droga, scatenano la risposta compulsiva di ricerca e assunzione della droga. In una situazione patologica R diventa un’abitudine: il CS elicita la risposta di consumo di R. Il soggetto non ha nessun controllo su R: la sua risposta è obbligata dal fatto che la droga ha rinforzato in modo esagerato l’associazione S-R. Il fatto che l’uso sia diventato un’abitudine spiegherebbe perché continua nonostante il reward (droga) ha meno valore: - Assumo la droga anche se mi fa male - Assumo la droga anche se distrugge la mia vita - Assumo la droga anche se non mi piace più, etc. Ma ci sono evidenze che il consumo di droga è un comportamento automatico? Per esempio, è meno sensibile al valore/piacere della droga? 61 Alcohol seeking by rats: action or habit? (Dickinson, Wood & Smith, 2002). Tiffany (1990) sostiene che la dipendenza si sviluppa nel passaggio da un’azione ad un’abitudine → si instaura una risposta stereotipata (assunzione della droga) innescata da alcuni stimoli ambientali (visione della siringa, del posto dove si consuma la droga, delle persone che spacciano, etc.) (S-R). Dickinson e colleghi (2002) si chiedono quindi se è vero che la droga faciliti lo sviluppo di abitudini rinforzando la relazione S-R, e quindi tale risposta sia poi meno sensibile alla svalutazione della sostanza stupefacente. Un’insensibilità al valore dell’outcome (reward) suggerisce la presenza di una abitudine. Viceversa, una sensibilità alla svalutazione dell’outcome (reward) suggerisce la presenza di un comportamento teleologico guidato da obiettivi (come dimostrato dal paradigma di svalutazione del rinforzo). Infatti una relazione tra abitudine e valore del rinforzo era già stata dimostrata dal lavoro di Adams (1982): maggiore l’allenamento e quindi maggiore l’abitudine, e minore la sensibilità al valore del reward. I ratti con maggior training lavorano anche per un reward svalutato, rispondo cioè in modo abitudinario. Se l’abitudine porta a lavorare per un reward svalutato, in questo lavoro gli autori si chiedono se la droga mantiene il condizionamento strumentale più di un reward naturale come il cibo quando il reward viene svalutato. Gli autori mettono quindi a confronto due tipi di reward: cibo VS alcool (soluzione di etanolo) e vogliono vedere in che modo agiscono i ratti quando avviene una svalutazione del reward. L’esperimento è diviso in 3 fasi e coinvolge 2 gruppi di ratti (Etoh e Pel). Durante il condizionamento strumentale i ratti rispondono maggiormente al pellet (che evidentemente è il reward preferito) che all’etanolo. Quindi bisogna tener conto di questa differenza per interpretare i dati dopo la svalutazione del rinforzo. Quando si tratta di lavorare per ottenere il reward pellet, i ratti ai quali è stato svalutato il pellet premono meno la leva rispetto ai ratti ai quali è stato svalutato l’etanolo. Risentono quindi della svalutazione del reward. Quando si tratta di lavorare per ottenere il reward etanolo, i ratti ai quali è stato svalutato l’etanolo premono la leva tanto quanto i ratti ai quali era stato svalutato il pellet. Non risentono quindi della svalutazione del reward etanolo. CONCLUSIONI: La differente resistenza alla svalutazione con i due tipi di rinforzi, dimostra che rispetto alla ricerca del cibo, la ricerca dell’alcol è più facile si trasformi in un’abitudine governata da meccanismi S-R. In questo modo, anche se poi l’alcol perde di valore perché piace meno o addirittura crea malessere viene assunto lo stesso. Nell’ottica della dipendenza questo può significare che la dipendenza da alcol si può mantenere anche quando l’assunzione di un alcolico non è più vissuta come un’esperienza desiderabile e piacevole. Robinson & Berridge (2003) discutono varie ragioni per cui la dipendenza è difficile si basi solo su un meccanismo S-R abitudinario: i. Assumere che un’abitudine equivalga a un automatismo obbligatorio è sbagliato. Un’abitudine, per quanto forte, non implica una compulsione! Ci sono molti esempi di comportamenti automatici o abitudinari che mettiamo in atto quotidianamente ma che non sono (normalmente) compulsioni (guidare l’auto, lavarsi i denti, leggere, allacciare le scarpe). ii. Nessuno sacrificherebbe la sua vita, le sue relazioni affettive, i suoi guadagni, la sua salute per un’abitudine, mentre questo avviene nella dipendenza. iii. Il comportamento di un drogato quando deve cercare e procacciarsi la droga non è necessariamente così stereotipato come nel caso di una risposta automatica quale potrebbe diventare quella di un ratto che in laboratorio preme una leva per un’iniezione di eroina. Spesso la ricerca della droga richiede di coordinare attività complesse, come rubare o elemosinare soldi, vendere dei beni, cercare uno spacciatore, etc. Queste attività richiedono una pianificazione e quindi un sistema flessibile (non possono essere solo un’abitudine). La dipendenza si basa su di un meccanismo di condizionamento pavloviano S- S, per cui alcuni CS ambientali attiverebbero una risposta edonica (CR) simile a quella evocata dalla droga (US), che porta alla ricerca della stessa. 62 Il CS ha attivato le reazioni edoniche (CR) e quindi il desiderio di assumere la droga. Cocaine-predictive stimulus induces drug-seeking behavior and neural activation in limbic brain regions after multiple months of abstinence: reversal by D1 antagonists. Il lavoro di Ciccocioppo et al. (2001) ha l’obiettivo di verificare se uno stimolo condizionato può attivare il desiderio di droga anche dopo astinenza. Vengono allenati dei ratti a premere una leva per ottenere cocaina. Se assieme alla leva è presente un CS rosso allora la pressione porta ad una iniezione di cocaina; se è presente un CS verde la pressione porta ad una iniezione di soluzione salina (placebo). Dopo estinzione, quindi dopo disintossicazione, verificano la forza del CS nel promuovere il desiderio di cocaina (viene valutato come disponibilità alla pressione della leva). Durante la fase di self administration, il ratto preferisce risponder premendo la leva quando questo porta alla droga rispetto al placebo. Questa preferenza è successivamente innescata anche dalla presenza del CS+, anche se la droga non viene somministrata. Anche dopo 4 mesi la presenza del CS+ porta il ratto a lavorare per cercare l’iniezione della droga. CONCLUSIONI: Stimoli presenti durante la fase di somministrazione della droga funzionano come potenti promotori del comportamento di ricerca della droga quando vengono incontrati, anche dopo molti mesi di disintossicazione. Importanti implicazioni per la dipendenza: è facile ricadere nell’uso di droga anche dopo disintossicazione se si è esposti a stimoli (frequentazione di luoghi/oggetti o persone) presenti quando ci si drogava; questi stimoli funzionano come CS che attivano il desiderio della droga attraverso un meccanismo pavloviano. Secondo questa teoria il desiderio nasce dall’attivazione del ricordo delle sensazioni piacevoli (o spiacevoli) ad opera di un CS. Quindi secondo questa prospettiva il CS attiva il desiderio della droga non direttamente ma tramite l’aspetto edonico → La teoria della salienza motivazionale invece esclude questo aspetto edonico come causa e si concentra solo sul desiderio. L’assunzione centrale della teoria dell’apprendimento anomalo è che attraverso meccanismi di apprendimento associativo come il condizionamento pavloviano, alcuni stimoli (CS) attivino il desiderio (CR) della droga anche attivando il ricordo delle sensazioni edoniche (CR). Alcuni studi di neuroimmagine hanno quindi cercato di vedere se questi CS sono processati in maniera diversa dal cervello delle persone che si drogano. Molti di questi studi hanno in effetti scoperto che alla vista di stimoli che sono collegati alla droga, il cervello delle persone che si drogano risponde con una attivazione maggiore di aree collegate alle emozioni e al controllo cognitivo. Nelle persone che fanno uso di cocaina, la vista di immagini collegate alla droga attiva maggiormente alcune aree cerebrali, tra cui la corteccia pre-frontale e l’amigdala. Conclusioni dell’apprendimento anomalo – Nel caso dell’apprendimento S-S (pavloviano), alcuni CS ambientali attivano in modo potente il ricordo delle sensazioni (CR) associate alla droga (US) e quindi il desiderio della droga. Nel caso dell’apprendimento S-R, invece, S attiva una risposta automatica R di uso della droga, e quindi l’assunzione di droga diventerebbe un’abitudine compulsiva! La teoria dell’apprendimento anomalo, sia nella versione S-R, sia nella versione S-S, sebbene offra una spiegazione intuitiva, è stata oggetto di osservazioni critiche, che possiamo riassumere come segue: - Un’abitudine non significa compulsione (per quanto riguarda la spiegazione S-R) - L’attivazione di una CR di piacere non sembra essere così forte da determinare la compulsione all’uso della droga (per quanto riguarda la spiegazione S-S) Non si può tuttavia escludere che l’apprendimento anomalo possa avere un ruolo nella dipendenza. Processi associativi modulano la sensibilizzazione alla droga – Normalmente abituazione/assuefazione e sensibilizzazione sono considerati processi di apprendimento non associativi. Tuttavia, ci sono evidenze che almeno per l’abituazione il processo può mostrare aspetti associativi per quanto riguarda il contesto! La droga altera sia i processi di assuefazione sia quelli di sensibilizzazione. Ma in cosa consiste la sensibilizzazione? La sensibilizzazione si riferisce al processo, normalmente non associativo, per cui la ripetuta somministrazione di uno stimolo può portare all’aumento della risposta a tale stimolo. E in che modo viene modulata da processi associativi nell’uso di droghe? 65 Unconscious affective reactions to masked happy versus angry faces influence consumption behavior and judgments of value. Un ulteriore lavoro di Winkelman et al. (2005) condotto sugli essere umani dimostra che il desiderio di bere può essere manipolato senza che le persone ne siano consapevoli e senza che ci sia un cambiamento nel loro stato di attivazione emotiva. I partecipanti devono eseguire un compito di classificazione di genere in merito a delle facce. Prima della faccia target è presentata una faccia prime: un gruppo vede un’espressione positiva, un altro neutra e un altro negativa. Alla fine del compito i soggetti sono invitati a versarsi da bere, e bere se lo desiderano, e a valutare il loro stato emotivo. Le persone assetate si versano più liquido e ne consumano di più dopo un prime positivo. Le persone però non riportano cambiamenti di stato emotivo, non sono quindi consapevoli che l’attivazione emotiva inconscia abbia alterato il desiderio. CONCLUSIONI: L’attivazione inconsapevole del sistema limbico emozioni/ricompensa si traduce in un aumento di desiderio. Si aumenta quindi il desiderio viscerale inconscio, senza che la persona abbia un desiderio consapevole di consumare una maggior quantità di bevanda. Desiderio e piacere possono quindi essere due stati mentali/fisiologici indipendenti. A favore di questa distinzione ci sono anche i risultati di alcuni esperimenti farmacologici condotti sui ratti da Berridge & Robinson (1998). What is the role of dopamine in reward: hedonic impact, reward learning or incentive salience? L’obiettivo del lavoro è verificare se la DA è il neurotrasmettitore del piacere o del desiderio. Per molti anni la DA era stata considerata il neurotrasmettitore del piacere (Wise, 1985), ma gli autori ritengono che invece la DA sia collegata al desiderio del reward, non al piacere. Attraverso la somministrazione di 6-OHDA (idrossidopamina) distruggono nei ratti il sistema dopaminergico del NAcc e del Corpo Striato (Caudato + Putamen). Questo genera totale afagia (i ratti non provano più desiderio per gli alimenti), e quindi assenza di motivazione all’assunzione di cibo. Ma a cosa è dovuta questa mancanza di desiderio per il cibo? Se la DA è il neurotrasmettitore del piacere allora la mancanza di fame deve essere accompagnata da uno stato di anedonia, cioè mancanza di piacere per il cibo. Se invece la DA media solo il desiderio, allora pur in assenza di motivazione deve rimanere intatta la risposta edonica (piacere/spiacere) per il cibo. Somministrano ai ratti due sostanze, una soluzione di zucchero (dolce) e una di chinina (amara), e verificano se i ratti mostrano piacere e disgusto per le due sostanze. Per avere una misura della piacevolezza usano i “pattern di reattività al gusto”, che sono risposte motorie simili in molte specie animali, come nell’uomo e nel ratto. Anche i 6-OHDA apprezzano la dolcezza: le risposte edoniche allo zucchero sono maggiori di quelle avversive, e aumentano all’aumentare della doclezza, sia nel gruppo di controllo sia nel gruppo senza sistema DA. Le risposte sono appropriate alla sostanza: edoniche allo zucchero e avversive alla chinina. CONCLUSIONI: I ratti che hanno subito la distruzione del sistema DA mostrano reazioni edoniche appropriate agli stimoli. La DA non è quindi implicata negli stati edonici di piacere/disgusto. Questo risultato dimostra soprattutto che il sistema neurale del desiderio è distinto da quello del piacere. Infatti i ratti non desiderano il cibo, sono afagici, ma sanno apprezzarlo (piacere) se lo provano. I lavori che abbiamo visto indicano che piacere e desiderio, soprattutto se viscerale, non sono la stessa cosa. Sebbene i due stati cerebrali spesso correlano (vogliamo quello che ci piace), i due processi sono indipendenti. Questo significa che si può desiderare qualcosa che razionalmente diciamo di non volere o che dichiariamo non ci piaccia. Secondo la teoria l’uso ripetuto della droga provoca, in alcune persone, una sensibilizzazione dei circuiti neurali che mediano il desiderio, soprattutto quello viscerale. Da un punto di vista neurale la sensibilizzazione consiste in un aumento della risposta ad uno stimolo a seguito della sua ripetuta presentazione. Se un circuito si sensibilizza ad una sostanza ne basterà poca per eccitare in modo elevato il circuito → è un processo opposto alla tolleranza e può essere presente in contemporanea, agendo su risposte diverse. 66 La sensibilizzazione è prodotta da anfetamine, cocaina, oppiacei (eroina, morfina), alcol, nicotina. È maggiore se la droga è assunta rapidamente, in modo intermittente, e in dosi progressive. La sensibilizzazione è molto persistente! Può durare mesi o anche anni, e questo può spiegare perché le ricadute avvengono anche dopo molti mesi di disintossicazione (è modulata da fattori genetici, ambientali, e da stress). Le droghe che producono dipendenza sensibilizzano principalmente due risposte: A. Psicomotoria (si ricordi lo studio di Anagnostaras & Robinson, 1996). B. Il desiderio viscerale (salienza motivazionale). Le droghe possono anche produrre effetti di cross-sensibilizzazione. Per esempio, la cocaina può sensibilizzare all’alcol. La droga può rendere ipersensibili allo stress, ma anche viceversa. La sensibilizzazione da droghe a livello neurale si traduce in cambiamenti morfologici e funzionali nei circuiti del reward, che cambiano la connettività sinaptica. o Una volta sensibilizzati, questi circuiti rispondono alla droga liberando più dopamina nel Nacc. o I recettori DA dei neuroni del NAcc rispondo in modo più potente. o Aumenta la lunghezza dei dendriti e il numero di sinapsi. L’espressione comportamentale della sensibilizzazione è tuttavia modulata da fattori contestuali (la sensibilizzazione è più evidente in contesti in cui la droga viene assunta, Anagnostaras & Robinson, 1996). Tra gli effetti psicomotori che possono essere sensibilizzati dalle droghe troviamo: - Aumento dello stato di attivazione (arousal) - Attenzione - Attività motoria (agitazione) - Locomozione e esplorazione - Approccio - Movimenti stereotipati Un punto cruciale della teoria della salienza motivazionale è che l’uso ripetuto della droga provoca una sensibilizzazione dei circuiti neurali che mediano il desiderio viscerale. Una serie di lavori hanno fornito evidenze coerenti con l’ipotesi della teoria, mostrando che la sensibilizzazione porta ad una maggior motivazione alla ricerca di droga. D1 dopamine receptor blockade prevents the facilitation of amphetamine self-administration induced by prior exposure to the drug. Gli obiettivi del lavoro di Pierre e Vezina (1998) sono: ➢ Dimostrare che la sensibilizzazione alla cocaina si traduce in una disponibilità a lavorare per dosi successive molto piccole. ➢ Dimostrare che la sensibilizzazione è bloccata da un antagonista (Ant) dei recettori della DA (visto che è un eccessivo rilascio della DA a causare sensibilizzazione). ➢ Dimostrare che gli effetti della sensibilizzazione variano tra i soggetti, e sono più evidenti negli individui predisposti agli effetti psicomotori indotti dalla presenza di nuovi stimoli. Il paradigma prevede: una valutazione della predisposizione a effetti di sensibilizzazione (attività locomotoria indotta da stimoli nuovi) e la somministrazione per 10gg consecutivi di due iniezioni giornaliere separate da 30 min, in quattro gruppi di ratti: - Gruppo Salina-Salina - Gruppo Salina-Anfetamina (1.5 mg/kg) - Gruppo Ant DA-Salina - Gruppo Ant DA-Anfetamina (1.5 mg/kg) Infine, un test di auto infusione bassa dose anfetamina (10 µg/kg) tramite pressione leva (condizionamento strumentale). Presente anche una leva di controllo la cui pressione non porta a nulla. Durante la fase di somministrazione (pre-esposizione) della sostanza solo i ratti nella condizione salina+anfetamina (S- A) mostrano una attività motoria aumentata (effetto di sensibilizzazione psicomotorio) → Effetto psicomotorio della anfetamina. Durante la fase di auto-somministrazione solo i ratti che sono stati sensibilizzati dall’anfetamina sono disposti a lavorare per una dose infinitesimale di droga. In realtà l’effetto emerge solo per i ratti (HR) che avevano una risposta psicomotoria elevata a stimoli nuovi (alto livello di arousal) mostrano segni di sensibilizzazione alla anfetamina. L’antagonista SCH 67 blocca l’effetto dell’anfetamina e quindi la sensibilizzazione (i ratti non premono la leva per la dose minima di droga, non sviluppano wanting viscerale). Si noti che gli effetti della sensibilizzazione prodotta dalla droga non sono aspecifici, perché i ratti premono solo la leva che gli fornisce la dose, seppur piccolissima, di droga, e non l’altra leva di controllo che non porta a nulla. CONCLUSIONI: L’esposizione alla anfetamina produce una sensibilizzazione che si manifesta come disponibilità dei ratti a lavorare per la droga. La sensibilizzazione è evidente perché i ratti sono disposti a lavorare per una piccola dose per la quale i ratti non esposti alla anfetamina (non sensibilizzati) non lavorano (non premono la barra più della barra che non porta all’iniezione). La sensibilizzazione è più accentuata nei ratti che mostrano una predisposizione a effetti psicomotori, e cioè alla sensibilizzazione. Sensitization to the conditioned rewarding effects of morphine: pharmacology and temporal characteristics. L’obiettivo del lavoro di Shippenberg et al. (1996) è studiare gli effetti della sensibilizzazione indotta dalla morfina sul condizionamento, verificare dopo quanto tempo si manifestano gli effetti della sensibilizzazione, e verificare se sono possibili effetti di cross-sensibilizzazione tra morfina e altre sostanze. Il paradigma prevede: - Prima fase di 5 gg di sensibilizzazione → Gruppo iniezione di salina (controllo); Gruppo iniezione di morfina (5.0 mg/kg), una iniezione al giorno. - Seconda fase di conditioning place preference, 4 gruppi di ratti → Salina; Morfina da 1.5, 3.0, oppure 5.0 mg/kg. - Test di condizionamento in estinzione eseguito a vari giorni di distanza dalla sensibilizzazione. Conditioning score maggiori di 0 significano tempo speso nella zona dove avveniva l’iniezione. Il CPP funziona solo nei ratti pre-trattati con la morfina. L’esposizione alla droga sensibilizza all’effetto della stessa nel condizionamento. Dopo aver visto che la droga sensibilizza il sistema neurale permettendo gli effetti di CPP per dosi successive, i ricercatori si chiedono quanto tempo occorra perché si verifichino gli effetti di sensibilizzazione. Analizzano quindi i dati in funzione di quanto tempo passa tra la fase di trattamento iniziale e il CPP. Il CPP emerge solo dopo che sono passati almeno 3 giorni dal trattamento. La sensibilizzazione richiede del tempo per manifestarsi. Se la sensibilizzazione è prodotta dalla morfina allora ci si deve aspettare che: si riproduca con un oppioide sintetico (Fentanyl → induce un effetto di sensibilizzazione) e sia bloccato dal Naloxone (→ blocca l’effetto del Fentanyl, ma non quello della nicotina), antagonista degli oppiacei. Si possono verificare effetti di cross-sensibilizzazione da nicotina? CONCLUSIONI: La somministrazione prolungata alla morfina crea sensibilizzazione alla droga. La sensibilizzazione richiede alcuni giorni prima di manifestarsi nel comportamento. Evidenza di cross-sensibilizzazione: da nicotina a morfina. La cross- sensibilizzazione è coerente con altri studi e con le osservazioni cliniche che riportano il fatto che la dipendenza da droghe porta anche ad altre dipendenze: alcol, sesso, soldi, gioco d’azzardo. A questo punto ribadiamo l’idea principale della teoria della salienza motivazionale: la droga sensibilizza in modo durevole i circuiti del reward, che attribuiscono valore motivazionale agli stimoli. Una volta che questi circuiti sono stati sensibilizzati rispondono in modo esagerato anche a CS associati alla droga. Da un punto di vista psicologico questi stimoli assumono un valore motivazionale enorme, creando desiderio viscerale per la droga! Le evidenze viste sinora supportano l’idea principale della teoria della salienza o sensibilizzazione motivazionale. Tuttavia, per esser sicuri che il desiderio viscerale per un reward (come per la droga) nasca dalla sensibilizzazione e dalla percezione di un CS associato al reward, devono essere escluse spiegazioni alternative. 70 tempo dalla disintossicazione. Il fatto che le proprietà motivazionali della droga si trasferiscano per mezzo di condizionamento pavloviano a CS associati rende questi stimoli capaci di innescare il desiderio di droga anche in soggetti disintossicati. La dissociazione con la componente edonica e cognitiva spiega anche perché la persona voglia drogarsi sebbene sappia cognitivamente che è disastroso per la sua vita e sebbene la droga non procuri più un gran piacere (Decision utility > Expected utility). In questo senso la compulsione è totalmente irrazionale, ed è vista come un comportamento incomprensibile da parte delle altre persone che non capiscono e rifiutano (razionalmente) il comportamento del tossicodipendente. Il processo di sensibilizzazione, associato a quello di condizionamento sono alla base della teoria della salienza motivazionale. La sensibilizzazione è a tutti gli effetti un meccanismo di plasticità neurale, che però non è sotto controllo, e soprattutto è poco reversibile (anche il condizionamento è plasticità). Sebbene solo circa il 20% delle persone che fanno uso di droga sviluppa dipendenza, la probabilità di ricadere nell’80% che non sviluppa dipendenza non è qualcosa che possiamo controllare! Teoria dell’apprendimento anomalo VS teoria della salienza motivazionale: 71 Salienza motivazionale e attenzione: abituazione e dipendenza I due punti cardine della teoria della salienza motivazionale sono: 1) Un meccanismo di condizionamento che passa le proprietà motivazionali e sensoriali da US a CS 2) Il sistema DA mesolimbico (in particolare il NAcc) sensibilizzato dalla droga in modo cronico, così che risponde ai CS della droga in modo esagerato. Questi due fattori determinano il fatto che un CS possa scatenare il desiderio visce- rale incontrollabile per la droga anche se non si hanno sintomi di astinenza o se non si stava pensando alla droga. Tuttavia, secondo la teoria della salienza motivazionale il CS è saliente anche da un punto di vista attentivo: i CS del reward e in particolare della droga sono degli attentional magnet. Infatti, spesso prestiamo attenzione a stimoli che hanno un valore motivazionale. Motivazione e attenzione sono due meccanismi strettamente collegati: difficile infatti non prestare attenzione a qualcosa che è il motore della nostra motivazione. La teoria prevede quindi che CS associati ad un reward acquisiscano salienza attentiva, oltre che motivazionale. La teoria prevede inoltre che, in condizioni normali (NAcc non sensibilizzato in modo cronico), la salienza motivazionale e atten- tiva di un CS cambi in funzione del valore motivazionale del reward (che è a sua volta determinato dallo stato fisiologico). Quindi, la capacità del CS di attivare il sistema mesolimbico dipende dallo stato di attivazione fisiologica. Quando ho fame (attivazione fisiologica), il NAcc è temporaneamente sensibilizzato, e il CS (insegna della pizzeria) è in grado di scatenare il desiderio della pizza. Quando non ho fame l’attivazione fisiologica è bassa, e il CS non scatena il desiderio (potrebbe farlo in virtù di una abitudine, ma questo non è un desiderio viscerale ma una risposta super appresa). Analogamente, quando ho fame il CS dovrebbe catturare la mia attenzione (oltre che generare motivazione). Tuttavia, quando la fame passa questo bias attentivo dovrebbe cessare, assieme alla motivazione. Nei soggetti con dipendenza, con il circuito sensibilizzato in modo permanente, il CS cattura praticamente sempre l’attenzione (forse con l’eccezione di quando si è sotto gli effetti della droga, quando non c’è ulteriore desiderio). The salience of a reward cue can outlast reward devaluation. Un lavoro di De Tommaso, Mastropasqua e Turatto (2017) ha testato le previsioni della teoria della salienza motivazionale per quanto riguarda l’attenzione. Quando US ha valore (cioè c’è attivazione fisiologica) il CS dovrebbe catturare l’attenzione. Quando US è svalutato il CS dovrebbe perdere la sua salienza, perché viene aggiornata dallo stato fisiologico che abbassa il valore motivazionale di US. Il paradigma prevede: - Fase di condizionamento, in cui un CS viene accoppiato con US, senza però che ci sia la possibilità di consumare US. US = bevande per soggetti assetati. 3 CS di diverso colore predicono in modo diverso l’arrivo di US (p=.2, p=.5, p=.8). Il soggetto deve fare una discriminazione del CS. - Fase di test attentivo, in cui si valuta se i diversi CS usati hanno guadagnato una salienza attentiva. Compito di ricerca visiva nel quale target e distrattori appaiono dentro a 3 stimoli che prima erano i CS. Esperimento 1: Condizionamento e test attentivo in situazione di sete (maggiore il potere predittivo del CS e maggiore la sua salienza attentiva). Come ci si poteva aspettare più il CS è predittivo e maggiormente cattura l’attenzione nel compito di visual search. Il rate di risposta nel condizionamento conferma che questo è avvenuto. Esperimento 2: Condizionamento con sete, poi si beve e si passa al test attentivo (svalutando il reward dovrebbe ridursi la salienza attentiva del CS). Sorprenden- temente il CS continua a catturare anche dopo che il reward è stato svalutato! Esperimento 3: Soggetti dissetati prima dell’esperimento (con reward svalutato nessun condizionamento e quindi nessuna salienza attentiva del CS al test; si noti che in questo caso il semplice valore predittivo del CS non basterebbe per innescare 72 un bias attentivo e motivazionale). Se non c’è condizionamento perché il reward è svalutato da subito non c’è sviluppo di salienza attentiva per il CS. I risultati dell’Esperimento 2 sono particolarmente interessanti, perché secondo la teoria della salienza motivazionale la salienza attentiva del CS avrebbe dovuto aggiornarsi una volta che il corrispondente US è stato svalutato. Emerge invece una cattura attentiva che persiste nonostante la svalutazione di US. Sembra quindi che una volta che il CS acquisisce salienza attentiva, questa caratteristica permanga nel tempo, indipendentemente dal valore di US. On the resilience of reward cues attentional salience to reward devaluation, time, incentive learning, and contingency remapping. In un altro lavoro De Tommaso e Turatto (2021) hanno verificato quanto può durare la salienza acquisita e se ci sia un modo per cancellarla. Paradigma simile a quello del lavoro precedente (Exp2, 15gg di estinzione e poi test su attenzione; Exp3, condizionamento con due contingenze e poi nuovo condizionamento inver- tendo le contingenze). La salienza acquisita dal CS pare mantenersi anche dopo due settimane (exp2)! Il remapping delle contingenze sembra aver cancellato la salienza precedente, ma non instaurato una sa- lienza nuova. I due effetti sembrano elidersi (exp3). Se è possibile conferire una salienza attentiva persistente ad un CS tramite un US come l’acqua, si può facilmente capire quanto più permanente e definitiva possa essere la salienza attentiva e motivazionale che può acquisire un CS per un US come la droga, e specialmente una volta che il NAcc è anche sensibilizzato in modo cronico! Working for beverages without being thirsty: human Pavlovian-instrumental transfer despite outcome devaluation. De Tommaso, Mastropasqua & Turatto (2018) riportano risultati analoghi per quanto riguarda la salienza motivazionale di un CS svalutato. Si noti che nel paradigma usato, l’effetto PIT non emerge come differenza nel rate di risposta in funzione della presenza o assenza del CS (come avviene nor- malmente), ma come variazione del rate di risposta in funzione della predittività del CS (0.2, 0.5, 0.8). Si tratta di un esperimento in cui i soggetti bevono prima del PIT: nonostante US sia svalutato, il CS spinge comunque a lavorare (cioè emerge PIT). I risultati dei lavori di De Tommaso et al. (2017, 2018, 2021) mostrano che anche un reward naturale come l’acqua è in grado di conferire salienza attentiva e motivazionale a un CS+, e cosa cruciale, che questa salienza una volta acquisita tramite condizionamento tende a perdurare nonostante la svalutazione del reward associato. Abbiamo visto alcuni lavori che dimostrano in modo chiaro che l’assunzione sistematica di droga tende a produrre una sensibilizzazione cronica del NAcc. Questo stato di risposta alterato è centrale per la teoria della salienza motivazionale per spiegare la dipendenza. Tuttavia, non è solo la sensibilizzazione a giocare un ruolo nella dipendenza, ma anche il processo opposto, l’abituazione, è per altri motivi fondamentale. Con l’uso prolungato di droga si sviluppa una tolleranza o abituazione alla droga. In questa condizione l’individuo è capace di assumere una dose che sarebbe fatale se assunta la prima volta. Nonostante la tolleranza che viene sviluppata, un numero consistente di tossicodipendenti, quindi persone esperte nella gestione della dose, muore ogni anno per over- dose. L’autopsia spesso rivela che la causa della morte è un edema polmonare causato da una depressione respiratoria provocata dalla droga. Il problema è che spesso i tossicodipendenti muoiono per dosi che avrebbero dovuto tollerare senza difficoltà. Per dare una spiegazione a questo fenomeno Siegel et al. (1982) hanno ipotizzato che queste morti siano da ricondurre ad un problema nel meccanismo di tolleranza (abituazione). Heroin overdose death: contribution of drug-associated environmental cues. L’idea proposta da Siegel et al. (1982) è che l’ambiente nel quale normalmente viene assunta la dose divenga un anticipatore degli effetti della droga, così che 75 I gruppi trattati con il neurolettico smettono progressivamente di lavorare, con un pattern di comportamento simile al gruppo che non riceve più il reward. Se- condo Wise è come se il reward avesse perso le sue proprietà edoniche. Gli autori concludono che il sistema DA è il mediatore del piacere legato al reward. Nonostante il lavoro di Wise ebbe una grande influenza, successivamente l’idea che la DA mediasse il piacere entrò in crisi. Dagli anni ‘90 in poi molte evidenze hanno dimostrato che il ruolo principale della DA non è quello di me- diare la sensazione di piacere. Vediamo quali evidenze empiriche hanno fatto cadere e abbandonare l’ipotesi edonica. Come già visto, la DA non è indispensabile per la risposta edonica se misurata attraverso i pattern di reattività al gusto (Berridge & Robinson, 1998). Pazienti con malattia di Parkinson, che hanno una estesa riduzione del livello di DA, danno normali giudizi di piacevo- lezza alle sostanze dolci. Persone che sono in uno stato di blocco dei recettori DA, o di forte deplezione del livello della DA, forniscono giudizi normali di piacevolezza a seguito di iniezioni di cocaina. Ratti che a seguito di una mutazione genetica non hanno il sistema dopaminergico mostrano di preferire reward dolci. Iniezioni di anfetamina nel NAcc producono una forte elevazione del livello di DA. Tuttavia, ratti in questo stato non cambiano il loro pattern di reattività al gusto delle sostanze dolci (Wyvell e Berridge, 2000). La stessa condizione si osserva anche dopo stimolazione elettrica del sistema mesolimbico, che sappiamo essere fondamentale per la DA. Esistono quindi molte evidenze che la DA non è cruciale per l’esperienza del piacere. Visto che la DA non media il piacere, sono state proposte altre possibili spiegazioni su quale potrebbe essere il suo ruolo nella rappresentazione del reward. Tra queste vediamo ora quelle del rinforzo, della motivazione e del prediction error. IPOTESI DEL RINFORZO – Un rinforzo è un reward che, dato in risposta ad una azione, concorre a memorizzare la relazione tra un particolare stimolo e una certa risposta. A prescindere dagli aspetti edonici, il reward può agire favorendo la formazione della relazione S-R, e quindi l’apprendimento di nuove abitudini. La DA media il rinforzo, non necessariamente il piacere. Pimozide attenuates acquisition of lever-pressing for food in rats (Wise & Schwartz, 1981): se la DA è implicata nel meccanismo di rinforzo prodotto da un reward, allora una riduzione del livello di DA dovrebbe interferire con l’appren- dimento di un compito attraverso condizionamento strumentale. Paradigma: somministrazione di placebo oppure di 3 possibili dosi di Pimozide (0.25mg/kg; 0.5mg/kg; 1mg/kg) 4 ore prima del condizionamento operante; sessioni di training durante le quali il ratto riceve del cibo se preme una leva. Il Pimozide annulla l’effetto rinforzante del reward. I risultati dimostrano che all’aumentare della dose di antagonista della DA diminuisce la capacità dell’animale di apprendere in un compito di condizionamento operante. I risultati sono compatibili con l’ipotesi che la DA agisca da mediatore del meccanismo di rinforzo della relazione S-R o Azione-Out- come. I risultati sono anche compatibili con l’idea che la DA medi il desiderio, quindi con la teoria della salienza moti- vazionale. Un possibile ruolo della DA nel meccanismo di rinforzo emerge anche nel condizionamento pavloviano, ed in particolare è stato osservato nel Conditioning Place Preference (CPP). Il CPP, è una misura di condizionamento pavloviano, e in particolare della risposta di approccio verso un luogo (CS) che è stato associato alla presentazione di un US. Attenuation by haloperidol of place preference conditioning using food reinforcement (Spyraki et al., 1982). Il paradigma: - Fase di pre-trattamento, durante la quale viene valutata la prefe- renza spontanea dell’animale in merito ad uno di due locali (nero vs bianco). - Fase di trattamento e condizionamento, durante la quale un gruppo riceve un placebo e altri due gruppi un’iniezione di alo- peridolo (antagonista della DA: 0.1 mg/kg, 0.2mg/kg), e poi ven- gono messi nel luogo meno preferito dove riceveranno il cibo (CPP) → Il luogo agisce da CS per il cibo (US). - Fase test in estinzione, durante la quale si osserva la scelta spontanea dell’animale per il luogo. 76 Solo il gruppo trattato con il placebo mostra evidenza di CPP, cioè i ratti cambiano la loro preferenza di posto andando in quello inizialmente meno preferito ma nel quale era stato associato il reward cibo. Il gruppo pre-trattato con Aloperidolo non mostra CPP, cioè i ratti continuano ad approcciare il posto preferito inizialmente, anche se questo non era il CS del cibo. Esistono quindi evidenze sperimentali che sono congruenti con l’ipotesi che la DA sia implicata nel processo di rafforza- mento di una associazione. L’associazione può essere sia di tipo S-R o A-O, come nel caso del condizionamento stru- mentale, sia del tipo S-S come nel caso del condizionamento pavloviano. In entrambi i casi il reward svolge la funzione di rinforzo, e la DA medierebbe il processo di rafforzamento. IPOTESI DELLA SALIENZA MOTIVAZIONALE – Come l’ipotesi degli incentivi motivazionali assegna alla DA un ruolo nella motivazione. La differenza è che al posto di considerare la DA importante per il trasferimento della salienza dal reward al CS, l’ipotesi assume che la DA sia cruciale per desiderio (“wanting”) generato dalla visione del CS o del reward stesso. Un rilascio abnorme di DA dal NAcc nel sistema limbico in presenza di un CS, genera il desiderio incon- trollabile per il reward. Questa ipotesi sul ruolo della DA è sostenuta principalmente dai lavori di Berridge & Robinson (1998). Ricordiamo brevemente quello di Wyvell & Berridge (2000), in cui gli autori innescano una forte scarica DA nel NAcc attraverso la somministrazione di anfetamine. Berridge & Robinson hanno condotto molti lavori che forniscono risultati che sono a favore di un ruolo della DA nella salienza motivazionale. I loro lavori hanno anche chiarito che la DA non è il neurotrasmettitore che media la sensazione di piacere, ma il desiderio. Il desiderio in questione è di tipo viscerale, non razionale, ed è controllato non dalla corteccia ma dal sistema mesolimbico. IPOTESI DEL REWARD-PREDICTION ERROR – Nel 1972 Rescorla & Wagner presentarono un modello matematico che descriveva il meccanismo di apprendimento nel condizionamento pavloviano. Il modello era in grado di predire e spiegare anche alcuni fenomeni come il blocking e l’overshadowing, legati al condizionamento pavloviano, mentre aveva difficoltà a spiegare altri fenomeni, come la latent ihibiton. Il concetto fondamentale del modello di Rescorla & Wagner (1972) è quello di prediction error, o errore di predizione. Sostanzialmente il modello assume che l’apprendimento avvenga quando c’è una violazione di un’aspettativa. Quale aspettativa? Quella che ad un CS segua un US, per esempio come il reward. La violazione di un’aspettativa è, infatti, un errore di predizione. Consideriamo uno stimolo neutro che per la prima volta anticipa la comparsa di un US (reward). Qual è la forza associa- tiva, cioè il grado di apprendimento della loro relazione, prima del primo accoppiamento? Sarà nulla, perché l’animale non aveva mai fatto prima esperienza della loro relazione. Quando l’animale vede la per la prima volta luce non ha alcuna aspettativa circa il fatto che seguirà il reward. Quindi se il reward appare dopo CS, l’animale sarà sorpreso perché non se lo aspettava. Si genera un errore di predizione, una violazione di aspettativa circa la comparsa del reward. Poiché al primo accoppiamento l’aspettativa di US dopo CS era zero, il reward prediction error sarà massimo, e il salto nell’apprendimento pure. La quantità di apprendimento possibile in ogni singola prova è data quindi dall’ammontare di violazione dell’aspettativa (determinata da quanto già si conosce), cioè dal reward prediction error. Mentre ad ogni prova l’apprendimento complessivo incrementa, cioè l’associazione CS-US si rafforza, ad ogni prova l’apprendimento ancora possibile, o variazione della forza associativa ancora possibile, si riduce dopo ogni prova. La variazione di apprendimento ad ogni prova, o variazione della forza associativa è pari a Δ𝑉𝐶𝑆 = 𝛼𝛽(𝜆 − 𝑉𝐶𝑆). o α: valore che va da 0 a 1 e rappresenta la salienza percettiva di CS o β: valore che va da 0 a 1 e rappresenta la capacità di US o reward di promuovere il condizionamento di CS o λ: rappresenta la massima forza associativa possible dato US, cioè quanto US è massimamente capace di pro- muovere il condizionamento. Quindi il suo valore massimo corrisponde alla comparsa del reward/US o V: valore attuale della forza associativa tra CS e US, cioè quanto US è atteso dato CS Se ignoriamo alfa e beta, la formula del reward prediction error si può riassumere in 𝜆 − 𝑉. Δ𝑉 = (𝜆 − 𝑉) può essere sostanzialmente tradotto in Δ𝑉 = (𝑅𝑒𝑤𝑎𝑟𝑑 𝑜𝑡𝑡𝑒𝑛𝑢𝑡𝑜 − 𝑅𝑒𝑤𝑎𝑟𝑑 𝑎𝑡𝑡𝑒𝑠𝑜). 77 ΔV è l’apprendimento possibile nella prova, ed è dato dalla differenza tra il reward ottenuto e quello che potevo aspettarmi. Quando CS predice completamente il reward, vuol dire che non c’è più errore nella predizione, cioè non c’è più spazio per altro apprendimento! Schultz et al., in base a studi neurofisiologici sulle scimmie, hanno sostenuto che il rilascio di DA nei neuroni della VTA e NAcc corrisponde al reward prediction error. Il rilascio di DA segnalerebbe quindi la violazione di aspettativa creata da un evento rilevante inatteso. Più US è predetto e meno viola l’aspettativa e meno risposta dopaminergica dovrebbe essere registrata. La risposta DA al reward è coerente con il reward prediction error, cioè con quanto il CS predice il reward. Esistono varie ipotesi che spiegano cosa rappresenti la risposta nel sistema dopaminergico. Tutte fanno riferimento co- munque al fatto che tale risposta viene emessa per codificare qualche aspetto legato all’analisi del reward. Alcune enfa- tizzano l’aspetto motivazionale legato al reward o a stimoli associati come i CS (teoria della salienza motivazionale). Altre l’aspetto edonico, altre l’aspetto di rinforzo, altre ritengono che la dopamina codifichi il reward prediction error, cioè l’apprendimento presente nel condizionamento classico. Infine, si noti che il concetto di droga, ed il suo utilizzo, è anche un fattore culturale. L’uso è stato considerato più o meno legale per molti anni, e come sappiamo, ancora oggi ci sono movimenti che chiedono la liberalizzazione di alcune droghe. La condanna non ha molto senso, ma dobbiamo ricordare due cose: la droga agisce sulla plasticità del cervello e può alterarlo in modo patologico e permanente! Once addicted, always addicted!