Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli

PLASTICITA' E APPRENDIMENTO, Appunti di Psicologia Cognitiva

Appunti relativi ad argomenti quali plasticità' e apprendimento, utili per l'esame di Plasticità e apprendimento di Turatto (2017)

Tipologia: Appunti

2018/2019

Caricato il 30/07/2019

grtdm11
grtdm11 🇮🇹

4.5

(2)

6 documenti

Anteprima parziale del testo

Scarica PLASTICITA' E APPRENDIMENTO e più Appunti in PDF di Psicologia Cognitiva solo su Docsity! APPRENDIMENTO E MOTIVAZIONE Uno dei meccanismi che sta alla base della dipendenza è il meccanismo di apprendimento. Sia lo sviluppo che il mantenimento delle dipendenze si basano su processi di apprendimento che fanno riferimento ad apprendimento associativi e non associativi. Ruolo cruciale è svolto dal condizionamento classico e operante e da cambiamenti a lungo termine della risposta neurale di alcuni circuiti cerebrali. Si tratta di una plasticità mal adattiva o disfunzionale ma i meccanismi neurali alla base sono i medesimi di quelli che regolano la plasticità adattiva e funzionale. - Apprendimento (classico e operante) - Motivazione (Teoria di Hull, 1946) - Teoria degli incentivi (di Toates, 1986) Diverse sono le evidenze che la dipendenza si sviluppa attraverso un processo di apprendimento, in particolare per la dipendenza ha ruolo importante il condizionamento: - Meccanismi di condizionamento strumentale: assunzione sostanza > rinforzo e sviluppo abitudini - Meccanismi di condizionamento classico: alcuni stimoli ambientali (CS) hanno un potente effetto sulla motivazione ad assumere la droga (US) Processi di condizionamento: può essere ricondotto a due principali categorie 1) Condizionamento classico (detto anche Pavloviano o di I tipo) 2) Condizionamento strumentale (detto anche Operante o di II tipo) 1) Due eventi vengono rappresentati nel sistema nervoso dell’individuo e viene rappresentata anche la relazione associativa tra questi due eventi che hanno luogo in una finestra temporale relativamente breve (richiede processi inferenziali: l’organismo deve essere in grado di fare previsioni e anticipare il secondo evento sulla base del primo -> dimostrato in seguito) - Stimolo Condizionato (CS): stimolo che dopo ripetuti accoppiamenti con US è in grado di evocare una risposta simile alla UR - Risposta Condizionata (CR): è la risposta emessa dall’animale alla sola comparsa di CS (prova che è avvenuto condizionamento -> lo stimolo neutro è diventato un CS) - Stimolo Incondizionato (US): specifici stimoli che evocano automaticamente una certa risposta nell’organismo (riflesso) - Risposta Incondizionata (UR): è la risposta riflesso evocata nell’animale dalla presentazione di US - Stimolo Neutro (NS): stimolo che non evoca nessuna risposta nell’animale Modello associativo: due stimoli nel mondo esterno in relazione temporale tra loro hanno una corrispondente rappresentazione neurale nel SNC; S1 è uno stimolo neutro mentre S2 è uno stimolo incondizionato che evoca una risposta riflessa incondizionata. In seguito a ripetuti accoppiamenti si crea una associazione tra le due rappresentazioni neurali; quando SC è in grado da solo di evocare UR, senza la presenza di US, allora è avvenuto il condizionamento e si presenta una CR. La contiguità temporale tra CS e US è fondamentale affinché avvenga condizionamento: • Forward conditioning (trace e delay): differiscono per il tipo di relazione temporale tra CS e US o Delay: CS inizia prima di US ma termina assieme o Trace: CS inizia e termina prima di US (lascia una traccia) • Condizionamento di secondo ordine: il meccanismo di app associativo può coinvolgere più di un CS -> una volta che lo US diventa CS questo può fungere da stimolo neutro per un ulteriore condizionamento • Overshadowing: non tutti gli stimoli hanno stessa potenzialità di condizionamento e quello preferenziale ostacola il condizionamento dell’altro (ogni animale ha stimoli preferenziali che sono determinati da particolari vincoli biologici) • Fenomeno del Blocking • Generalizzazione della risposta condizionata: stimoli simili al CS sono in grado di evocare la medesima risposta • Estinzione della risp condizionata: la si nota quando smetto di associare US con CS, questo probabilmente avviene perché viene appresa una relazione (CS -> no US) e non che viene cancellata altrimenti sarebbe improbabile il recupero spontaneo • Recupero spontaneo della CR: una volta ottenuta l’estinzione di CR se si aspetta un po' di tempo e poi si ripresenta CS allora riappare CR (questo fatto suggerisce che durante l’estinzione non si era cancellata la relazione CS-US) Il condizionamento avverrebbe perché US funziona come rinforza del legame associativo con CS: ha un valore motivazionale ed emozionale e questo rafforza il loro legame; più forte è il legame più facilmente CS agirà come US e quindi attiverà CR (o UR). L’accoppiamento CS-US, cioè la contiguità temporale tra due eventi, sarebbe quindi sufficiente. Tuttavia, alcuni studi degli anni ’60 hanno cominciato a mettere in crisi l’idea che la semplice contiguità tra CS e US fosse sufficiente, dimostrando che il meccanismo che consente il condizionamento classico era più complesso (lavori di Kamin, che ha studiato il fenomeno del blocking, e Rescorla con i lavori sulla contingenza). Rescorla dimostra nel suo lavoro come la contiguità non sia sufficiente affinchè si verifichi il condizionamento e il fattore cruciale è invece la contingenza ovvero deve esistere una relazione predittiva tra CS e US: si osserva condizionamento solo quando la probabilità di comparsa di US è maggiore in presenza di CS che in sua assenza. I suoi esperimenti, così come quelli sul blocking, dimostrano che anche nel condizionamento classico sono in gioco fattori cognitivi: l’organismo deve poter crearsi un’aspettativa e quindi una credenza su uno stato del fenomeno “se..allora..” -> aspettativa sulla relazione tra CS e US 2) Thorndike sostiene che l’apprendimento è un processo incrementale che avviene per prove ed errori. Egli fece degli studi in cui misurò il tempo che impiega il gatto a trovare la soluzione per uscire dalla gabbia; una volta uscito ottiene la ricompensa e viene rimesso nella gabbia per una ulteriore prova: scopre che il tempo impiegato dall’animale diminuisce gradualmente con l’aumentare delle prove. MOTIVAZIONE Parlare di motivazione è parlare delle ragioni dell’agire e le ragioni possono essere due: o si muove per un riflesso o per uno scopo (i riflessi sono importanti ma sono risposte stereotipate che non sono guidate da motivazione o scopo). Si può definire come uno stato mentale che spinge ad agire per raggiungere uno scopo; le motivazioni principali nascono per bisogni fisiologici. Se una persona ha sviluppato una dipendenza si può tradurre come una grande motivazione per raggiungere una certa sostanza e farne uso. La teoria più influente sulla motivazione è quella di Hull (1943): Drive-reduction theory - lo scopo di una pulsione (drive) psicologica è quello di ripristinare una condizione di omeostasi nell’organismo - la pulsione ad agire nasce da un bisogno fisiologico che deve essere soddisfatto - le pulsioni innescano un comportamento mirato al ripristino dell’omeostasi - la riduzione della pulsione funziona come un vero e proprio rinforzo per l’azione che l’ha portata alla riduzione. Concetto chiave è quello di omeostasi ovvero la tendenza a mantenere una condizione di equilibrio in un sistema biologico; lo spostamento dall’omeostasi genera uno squilibrio fisiologico che si traduce in un bisogno, che genera a sua volta nell’organismo una pulsione a soddisfare tale bisogno; da qui nasce la motivazione. squilibrio = bisogno -> pulsione = motivazione Con il passare del tempo, l’effetto della ricompensa scompare e si rigenera lo squilibrio perciò tutto il ciclo ricomincia. Desiderio e soddisfazione sono inversamente proporzionali; la soddisfazione di un desiderio è rinforzante per un’azione messa in atto per ottenere quella soddisfazione. Perciò, la motivazione nasce da uno squilibrio omeostatico che genera una pulsione e ha lo scopo di ridurre la pulsione attraverso l’ottenimento del reward; quest’ultimo funziona come rinforzo riducendo la pulsione e ne segue una riduzione della motivazione. Con il tempo si produce lo squilibrio omeostatico e quindi ricompare la motivazione. Critiche e problemi: Olds e Miller (1954) scoprirono che i ratti erano molto motivati ad auto-stimolarsi elettricamente i centri del piacere del cervello: il ratto, quando riceve stimolazione diretta nella zona del piacere (NAcc e Ipotalamo laterale), preme in frequenza molto maggiore la leva (lo stesso meccanismo sarebbe quello che agisce nelle droghe ovvero queste agiscono indirettamente sullo stesso centro). I loro risultati mettono in crisi la drive-reduction theory: la motivazione ad auto-stimolarsi non dipendeva da nessuna pulsione che derivasse da uno squilibrio di uno stato di omeostasi; sono disposti a sopportare scosse elettriche molto forti peer potersi stimolare e i ratti lavoravano senza mai raggiungere uno stato di sazietà. Perciò la motivazione non è necessariamente legata alla presenza di una pulsione che nasce da uno squilibrio dell’omeostasi; il reward non agisce solo come rinforzo della relazione S-S o S-R attraverso la riduzione di una pulsione. Nasce quindi una nuova prospettiva teorica secondo cui la motivazione può essere scatenata da alcuni stimoli ambientali: la funzione del reward non sarebbe solo quella di rinforzare una associazione ma piuttosto agirebbe come un incentivo alla motivazione. Uno dei precursori di questa teoria è Bolles che propone il ruolo del reward non come quello di funzionare da rinforzo della risposta attraverso una riduzione della pulsione ma considera il fenomeno dell’autoshaping e sostiene che non si spieghi con il concetto di rinforzo della risposta da parte del reward. Fenomeno dell’autoshaping: l’animale è esposto a un CS seguito dall’arrivo di US (di fatto US è un reward nel senso di stimolo piacevole); dopo una prima fase di condizionamento, l’animale sviluppa interesse per il CS, ovvero mette in atto dei comportamenti che prima metteva in atto per il CS anche per l’US. La motivazione che regola il suo comportamento si sta spostando sullo stimolo che predice l’arrivo della ricompensa (CS non è più solo predittore ma acquista lo stesso valore di US). Nell’autoshaping l’animale comincia a comportarsi come se CS fosse US; si noti che US non può aver agito come un rinforzo perché non c’è alcuna risposta che viene rinforzata. Infatti, il reward US viene dato a prescindere da quello che l’animale sta facendo (non è richiesta alcuna risposta). Tuttavia, si potrebbe sostenere che US ha involontariamente rinforzato l’azione che avviene su US. L’autoshaping però si verifica anche se US (reward) viene omesso ogni volta che l’animale agisce su CS: questo esclude la spiegazione secondo cui l’autoshaping si verifica perché US ha rinforzato l’azione su CS. Animali che mostrano interesse per stimoli condizionati tanto più che per stimoli incondizionati vengono chiamati sign tracker (mostrano autoshaping); quelli che continuano a mostrare interesse il reward sono detti goal tracker. Le cause che portano un animale ad essere di una categoria piuttosto che di un’altra non sono chiare ma si pensa che possano essere di natura genetica. L’autoshaping dice che lo stimolo condizionato acquisisce una super salienza: si ipotizza che il CS acquisisce una salienza o valore motivazionale spropositato tanto da innescare comportamenti consumatori compulsivi (come quelli presenti nella dipendenza). Questa interpretazione è coerente con la presenza dell’autoshaping anche nella procedura di omissione. Per spiegare l’evento dell’autoshaping, Bolles (1972) propone che l’azione del reward non riguardi principalmente rinforzare la relazione tra S-R o tra S-S. Il reward porterebbe l’animale ad imparare che esiste uno stimolo CS che anticipa l’arrivo di un altro stimolo (reward stesso) con proprietà edoniche e motivazionali. Rispetto a Pavlov enfatizza il fatto che il CS genera un’aspettativa di tipo edonica e motivazionale circa l’arrivo del reward. Questa idea viene ripresa da Bindra (1978) e sostiene che l’apprendimento della relazione CS-reward riguarda il fatto che CS acquisisce le stesse proprietà edoniche e motivazionali del reward. CS evoca nell’animale lo stesso stato motivazionale evocato dal reward -> CS diventa un incentivo ad agire così come lo è il reward prima di essere consumato Perciò, attraverso meccanismi di tipo Pavloviano le caratteristiche incentivanti del reward vengono acquisite dal CS e il CS è percepito come se fosse un reward: il cibo evoca una proprietà motivazionale sull’animale, in seguito a diverse associazioni con uno stimolo, anche quest’ultimo acquisisce la capacità di evocare motivazione sull’animale. Toates (1986) sviluppa la Teoria degli Incentivi: egli sottolinea il fatto che i reward edonici (piacevoli) sono l’oggetto della nostra motivazione; quindi è uno stimolo incentivante che produce sensazioni piacevoli quando ottenuto. Egli nota che il valore edonico degli incentivi non è assoluto ma dipende dallo stato motivazionale ( ad esempio, quanto può piacere un cibo dipende dal fatto che si è affamati o meno). Già Cabanac aveva dimostrato questa cosa (1979): i soggetti umani giudicano la stessa soluzione zuccherina più o meno attrattiva a seconda del livello di fame (fenomeno dell’allestesia -> il giudizio su un evento esterno dipende da uno stato interno). Toates aggiunge un aspetto importante alla teoria di Bolles e Bindra, ovvero sostiene che se le pulsioni o motivazioni aumentano il potere incentivante del reward, allo stesso modo il reward può aumentare il livello di motivazione. Il rapporto è bidirezionale: la motivazione determina quanto sono interessato al reward, ma il reward può determinare e cambiare la motivazione. Tuttavia, anche semplici CS possono assumere proprietà di reward perciò anche un CS può funzionare da incentivo che genera motivazione: uno stimolo condizionato può generare uno stato di motivazione, non è più solo un predittore (ad es, i simboli pubblicitari funzionano in questo modo). Esperimento di Weingarten (1983): un CS innesca un desiderio e la motivazione Testa l’hp che dei CS possano controllare quando e se l’animale cerca e consuma cibo, a prescindere dallo stato di fame. - Fase di 11 giorni di condizionamento pavloviano: CS + suono che precede rilascio del latte (US) - Seconda fase di test (21 giorni): il ratto ha pieno accesso al cibo tramite un dispenser durante tutto il giorno ma una volta al giorno viene presentato anche CS+ e rilasciato altro latte Risultati: pur essendo sazio, il ratto consuma il cibo rilasciato nella ciotola quando è preceduto da CS+ (nonostante la omeostasi sia regolata perché il ratto può mangiare quando vuole durante il giorno). Conduce poi un secondo esperimento simile al primo, ma nella fase di test ci sono giorni in cui il CS+ è presente e giorni in cui è assente. Risultati: la quantità di latte assunto è simile nei due giorni, ma nei giorni in cui è presente il CS+ il 20% del latte viene assunto dalla ciotola dopo che è stato presentato. Il ratto quindi compensa la quantità di cibo ingerito in funzione di quella assunta tramite l’incentivo CS. Perciò, questi risultati dimostrano che la motivazione ad assumere cibo non è determinata solo dalla fame ma anche da stimoli ambientali (incentivi) che hanno acquisito valore motivazionale attraverso un condizionamento Pavloviano. Conclusioni: il ruolo principale del reward non è quello di rinforzare una risposta ma di promuoverla; il reward quindi è un incentivo all’azione e il livello di motivazione modula il potere edonico del reward; che però può alterare il livello di motivazione. Stimoli condizionati (CS) possono assumere le stesse proprietà del reward, innescando un desiderio per il reward. Ciò significa che posseggono una rappresentazione che associa tra loro lo stimolo e la risposta e conseguenze dall’azione. È possibile che nel condizionamento strumentale il passaggio da un comportamento controllato di tipo teleologico ad uno automatico regolato dalle abitudini avvenga attraverso una pratica estesa: la ripetizione di un’azione può trasformarla in una risposta. Studio di Adams (1982): variations in the sensitivity of instrumental responding to reinforcer devaluation Quattro gruppi di ratti: uno esegue poco training e un gruppo esegue molto training (entrambi sono a loro volta divisi in due gruppi in cui uno con svalutazione e uno senza svalutazione del reward) - Fase di training - Fase di condizionamento strumentale avversivo solo per uno dei due sottogruppi di ogni gruppo con iniezione di sostanza - Test in estinzione Risultati: nel gruppo con forte training la propensione alla pressione della leva è della stessa frequenza nei due sottogruppi; il gruppo di poco training preme molto meno la leva nel caso di svalutazione piuttosto che nell’altra condizione Perciò, si supporta l’hp per cui con la pratica un’azione che è guidata dagli obiettivi, e quindi sensibile al valore della ricompensa (comportamento razionale), può trasformarsi in una semplice risposta elicitata dallo stimolo che poi si trasforma in abitudine. I comportamenti abitudinari non sono più azioni razionale, perché vengono eseguiti anche quando portano a risultati non auspicati o desiderati. • Apprendimento azione-aoutcome: quando l’azione è eseguita con l’intenzione di ottenere un certo risultato (outcome) L’azione è sensibile alla svalutazione dell’outcome: l’animale che aveva appreso a premere la leva per il cibo smette di premerla se il cibo è accoppiato con una sensazione spiacevole (svalutazione del reward), oppure se l’animale è sfamato e quindi il cibo perde interesse. • Apprendimento stimolo-risposta: quando il comportamento dipende dall’esposizione ad un certo stimolo e viene rinforzato da un reward; l’animale non esegue il comportamento con l’intenzione di ottenere un reward ma è quest’ultimo che ha rinforzato la nascita di una abitudine Tutto ciò da supporto all’hp che l’assunzione di droga è determinato da abitudine: una possibilità è che le droghe agiscano come rinforzi che favoriscono il passaggio da un’azione ad una abitudine, favorendo l’uso compulsivo delle stesse. TEORIA EDONICA DELLE DIPENDENZE La dipendenza è un comportamento di consumo compulsivo verso sostanze come droghe o alcol, ma può riguardare anche il cibo, il sesso o il gioco d’azzardo; essa si manifesta come fortissima motivazione alla ricerca e assunzione di queste sostanze. È principalmente la compulsività che caratterizza la dipendenza, le persone possono cominciare a drogarsi per qualche motivo ma poi continuano per tutt’altro ed ciò che determina un comportamento compulsivo. Una volta sviluppata una dipendenza, la ricaduta è molto probabile anche quando si è smesso di assumere droghe da molto tempo. L’uso ricreativo delle droghe invece non ha questo problema, infatti ci sono persone che possono drogarsi senza sviluppare dipendenza. Circa il 60% della popolazione adulta americana ha fatto, almeno una volta nella vita, uso di droghe; il 20% di queste ha sviluppato dipendenza. La dipendenza quindi non è solo caratterizzata da un uso regolare di droghe ma riguarda una ricerca ed un uso compulsivo a discapito di altre attività sociali. Tre categorie principali di spiegazioni: • Teoria edonica a due stati • Teoria dell’apprendimento anomalo • Teoria della salienza motivazionale TEORIA EDONICA A DUE STATI: Il principio guida è che le persone assumano droghe per due motivi principali ovvero per il piacere legato all’assunzione e per evitare i sintomi spiacevoli dell’astinenza -> le persone iniziano a drogarsi per provare piacere e successivamente continuano in modo compulsivo per evitare il malessere legato all’astinenza I sintomi di astinenza variano in funzione del tipo di droga e possono comprendere reazioni sia di tipo neurovegetativo sia affettivo: tremore, aumento della sudorazione, aumento della frequenza e pressione cardiaca, dolore, depressione, ansia, irritabilità, apatia. Caso specifico proposto da Solomon e Corbit (1974): Teoria dei processi opponenti L’assunzione di droga genera dei processi fisiologici (rilascio di neurotrasmettitori tipo DA) e psicologici (reazione di piacere), che sono seguiti da processi in direzione opposta (riduzione DA e malessere). Questi processi opposti, almeno a livello fisiologico, sono tentativi di ristabilire l’equilibrio o omeostasi nel sistema (come quello dopaminergico). Con l’assunzione ripetuta i processi positivi si riducono (assuefazione) mentre quelli negativi si amplificano (sensibilizzazione) nel tempo. La dipendenza si sviluppa come tentativo di ridurre gli effetti negativi, con il risultato di distruggere sempre più l’omeostasi nel sistema DA. Molte evidenze mettono in luce che le droghe possono produrre due tipi di plasticità neurale che agiscono contemporaneamente e portano a due tipi di adattamenti: - Assuefazione (abituazione): le sensazioni di piacere diminuiscono nel tempo e per ritrovare lo stesso livello di piacere devo continuare ad aumentare la dose - Sensibilizzazione: la stessa dose produce nel tempo sempre maggiori effetti, aumentando i sintomi da astinenza e la risposta di desiderio della droga alla vista di alcuni stimoli collegati alla droga Causa principale della dipendenza sarebbe il fatto che la droga altera permanentemente l’equilibrio del sistema DA. Con l’suo prolungato si crea assuefazione (tolleranza) ai sintomi piacevoli, ma aumentano quelli legati all’astinenza, che portano il soggetto a cercare altra droga e altre dosi -> il sistema DA e affettivo/emotivo perde il suo equilibrio ! punto chiave è che la dopamina era ritenuta il neurotrasmettitore del piacere L’assunzione della droga sarebbe regolata da: - Meccanismo di rinforzo positivo: è predominante all’inizio dell’uso della droga, la quale agisce come rinforzo positivo producendo una sensazione piacevole dopo l’uso e quindi rinforzandolo - Meccanismo di rinforzo negativo: entra in gioco con l’uso prolungato, quando diventano dominanti i sintomi spiacevoli dell’astinenza; in questo caso la droga agisce come rinforzo negativo eliminando la condizione spiacevole ci si droga per piacere -> si continua per evitare sintomi spiacevoli Spiegazione del rinforzo negativo: - Gli psicostimolanti e allucinogeni generano una forte dipendenza psicologica a fronte di scarsi sintomi fisici da astinenza -> il forte desiderio di droga non dipende dal fatto che si stia particolarmente male senza - Farmaci che possono produrre forti sintomi da astinenza, come antidepressivi, non generano dipendenza e uso compulsivo - Le ricadute sono frequenti anche dopo che i sintomi da astinenza sono terminati da tempo -> perciò il meccanismo di rinforzo negativo non pare in grado di spiegare il bisogno di drogarsi quando la condizione spiacevole causata dall’astinenza è finita Esperimento Stewart e Wise (1992): reinstatement of heroin self-administration habits (morphine prompts and naltrexone discourages renewed responding after extinction) I due studiosi discutono la possibilità che nella dipendenza la droga sia assunta per eliminare i sintomi da astinenza: secondo la teoria dell’omeostasi edonica il meccanismo del rinforzo negativo è molto potente perché agirebbe curando i sintomi. Hp: se è vero che la dipendenza è mantenuta attraverso un meccanismo di rinforzo negativo, allora sostanze che inducono sintomi di astinenza dovrebbero essere in grado di promuovere l’uso della droga - Fase di allenamento in cui imparano ad autosomministrarsi dell’eroina - Estinzione in cui viene tolta la droga (mima la disintossicazione) - Prima della riacquisizione vengono iniettate tre tipi di sostanze diverse ovvero soluzione salina oppure eroina a basso dosaggio oppure un antagonista dell’eroina che produce sintomi di astinenza Risultati: la sostanza che più spinge il ratto a ricominciare a drogarsi è l’eroina, non l’antagonista. Contrariamente a quanto predetto dalla teoria dei processi opponenti non sembrano essere i sintomi di astinenza che motivano l’uso continuativo della droga: eliminare i sintomi di astinenza non è la ragione principale nel mantenimento della dipendenza e nelle ricadute dopo fine astinenza. Mettono a confronto due tipi di reward, ovvero una soluzione di etanolo e del cibo e vogliono vedere in che modo agiscono i ratti quando avviene la svalutazione del reward. - Due gruppi di ratti in cui in uno viene svalutato l’etanolo e uno in cui viene svalutato il cibo - Fase in cui tutti imparano a premere una leva per il pellet e l’altra per l’etanolo - Fase in cui vengono divisi in due gruppi in funzione del condizionamento avversivo - Fase di condizione in cui i ratti sono posti di fronte a entrambe le leve (una leva associata allo stimolo avversivo e l’altra a quello non avversivo) Durante il condizionamento strumentale i ratti rispondono maggiormente al pellet piuttosto che all’etanolo (importante differenza per interpretare i dati). Risultati: i ratti per i quali è stato svalutato il pellet premono in minore misura la leva, quindi risentono della svalutazione del reward (non sviluppano abitudine); i ratti a cui è stato svalutato l’etanolo non mostrano differenza tra prima e dopo, ovvero la svalutazione non ha apportato modifiche alla quantità di pressioni per ottenerlo. La differente resistenza alla svalutazione con i due tipi di rinforzi, dimostra che rispetto alla ricerca di cibo, la ricerca di alcol è più facile si trasformi in abitudine governata da meccanismi S-R. In questo modo, anche se poi l’alcol perde valore perché piace meno o addirittura crea malessere, viene assunto ugualmente. Nell’ottica della dipendenza questo può significare che la dipendenza da alcol si può mantenere anche quando l’assunzione d un alcolico non è più vissuta come esperienza desiderabile e piacevole. Evidenza critiche di un ruolo dell’abitudine (Robinson e Berridge, ragioni per cui la dipendenza non si basa su un meccanismo S-R): 1) Assumere che un’abitudine equivalga a un automatismo obbligatorio è sbagliato; un’abitudine non implica una compulsione, per quanto forte essa sia 2) Nessuno sacrificherebbe la sua vita, le relazioni affettive, i guadagni, la salute per un’abitudine, mentre questo avviene nella dipendenza 3) Il comportamento di una persona drogata quando deve cercare la droga non è necessariamente così stereotipato come nel caso una risposta automatica quale potrebbe diventare quella di un ratto che in laboratorio preme una leva per una iniezione di eroina Un’altra possibilità è che la dipendenza si basi su un meccanismo di condizionamento Pavloviano, per cui alcuni CS ambientali attivano la rappresentazione della droga (US) e delle relative sensazioni edoniche (CR). Una volta che il CS ha attivato le reazioni tipiche prodotte da US, nel soggetto nasce il desiderio di renderli reali: mette quindi in atto dei comportamenti per riprovare o evitare quelle sensazioni. Esperimento di Ciccocioppo (2001): cocaine-predictive stimulus induces drug-seeking behaviour and neural activation in limbic brain regions after multiple months of abstinence (reversal by D1 antagonists) Obiettivo era verificare se uno stimolo condizionato può attivare il desiderio di droga anche dopo astinenza. - Allenano dei ratti a premere una leva per ottenere cocaina, due condizioni: se assieme alla leva è presente un CS rosso allora la pressione porta ad una iniezione di cocaina se è presente un CS verde la pressione porta ad una iniezione placebo - Dopo l’estinzione, ovvero la disintossicazione, verificano la forza del CS nel promuovere il desiderio di cocaina (viene valutato come disponibilità alla pressione della leva) Durante la fase di self administration il ratto preferisce rispondere premendo la leva quando questo porta alla droga rispetto che al placebo. Questa preferenza è successivamente innescata dalla presenza del CS+, anche se la droga non viene somministrata. Anche dopo quattro mesi la presenza del CS+ porta il ratto a lavorare per cercare l’iniezione della droga. Risultati: la droga rinforza il comportamento, nella fase di estinzione mediamente si abbassa la risposta, quando si introduce S+ il ratto ricomincia a premere la leva -> vedere uno stimolo anticipatore della droga induce a ricominciare a premere la leva per ottenere la sostanza Questo dimostra che stimoli condizionati predittori di droga inducono a desiderare la sostanza: stimoli presenti durante la fase di somministrazione della droga funzionano come potenti promotori del comportamento di ricerca della droga quando vengono incontrati, anche dopo molti mesi di disintossicazione. - È facile ricadere nell’uso di droga anche dopo la disintossicazione se si è esposti a stimoli presenti quando ci si drogava - Questi stimoli funzionano come CS che attivano il desiderio della droga attraverso un meccanismo pavloviano Alcuni studi hanno dimostrato un ruolo dei processi di apprendimento associativo nella sensibilizzazione agli psicostimolanti. Modulazione della sensibilizzazione: si riferisce al processo per cui la ripetuta somministrazione di droga può portare all’aumento di alcuni effetti della droga; ciò avviene perché alcuni neuroni cambiano le loro sinapsi a causa della somministrazione della droga, che quindi induce plasticità neurale nel sistema. Esperimento di Anagnostaras e Robinson (1996): sensitization to the psychomotor stimulant effects of Amphetamine (modulation by associative learning) Vogliono studiare se gli effetti di sensibilizzazione prodotti dalla cocaina dipendono dall’ambiente nel quale viene assunta (contesto-dipendente); in particolare se vi sono implicazioni nella locomozione. - Fase di trattamento e fase di test in cui i ratti vengono messi in un rotatore per misurare la attività motoria - 3 gruppi di ratti: dalla gabbia (H) vengono portati nel rotatore (R) e ricevono una soluzione salina -> gruppo placebo (R-H-) dalla gabbia vengono portati nel rotatore e ricevono una iniezione di cocaina (R+H-) dalla gabbia vengono portati nel rotatore, poi riportati alla gabbia ricevono iniezione di cocaina (R- H+) - Fase di test in cui tutti ricevono cocaina nel rotatore prima di iniziare il test Risultati: nel gruppo che metto nel rotore e fornisco la cocaina aumentano le rotazione effettuate e quindi corrono di più, gli altri gruppi no. La stessa iniezione ha tre effetti diversi in funzione del fatto che i ratti avessero già ricevuto iniezione nel rotore o meno. - La somministrazione ripetuta della cocaina provoca un effetto di sensibilizzazione: la stessa dose ogni volta che viene somministrata fa aumentare la risposta psicomotoria dell’animale - L’effetto di sensibilizzazione si dimostra essere dipendente dal contesto; la sensibilizzazione si osserva solo quando l’animale assume la droga nello stesso contesto nel quale avevano avuto luogo le iniezioni precedenti  Dimostrazione di una tolleranza contesto dipendente Perciò, lo studio dimostra che anche gli effetti della droga sono soggetti a effetti di apprendimento associativo. Nello specifico, un apprendimento come la sensibilizzazione, tipicamente considerato non associativo, è invece modulato dal contesto, con ovvie implicazioni per la dipendenza -> questo spiega perché le ricadute sono spesso favorite dalla presenza di certi stimoli ambientali o contesti Alcuni studi di neuroimmagine hanno cercato di vedere se questi CS sono processati in maniera diversa dal cervello delle persone che si drogano. Molti di questi studi hanno in effetti scoperto che alla vista di stimoli che sono collegati alla droga, il cervello delle persone che si drogano risponde con un attivazione maggiore di aree collegate alle emozioni e al controllo cognitivo. Nelle persone che fanno uso di cocaina, la vista di immagini collegate alla droga attiva maggiormente alcune aree cerebrali (tra cui la corteccia prefrontale e l’amigdala). Conclusioni generali della teoria: attraverso un meccanismo di condizionamento pavloviano, alcuni CS ambientali attivano in modo potente il desiderio della droga (US). Inoltre, potrebbero portare all’uso della droga anche in base a meccanismi di autoshaping, evocando un comportamento di approccio e consumatorio. La teoria dell’apprendimento anomalo, sia nel caso S-R che S-S, sebbene offra una spiegazione intuitiva, è stata oggetto di osservazioni critiche: - Un’abitudine non significa compulsione (spiegazione S-R) - Le sensazioni prodotte da stimoli condizionati non sembrano essere così forti da determinare la compulsione all’uso della droga (spiegazione S-S) Secondo questa teoria della sensibilizzazione, l’uso ripetuto della droga provoca in alcune persone una sensibilizzazione dei circuiti neurali che mediano il desiderio, soprattutto quello viscerale. La sensibilizzazione è un processo opposto alla tolleranza e può essere presente in contemporanea, agendo su risposte diverse e consiste in un aumento degli effetti di una sostanza dopo utilizzo ripetuto. La sensibilizzazione da droghe è prodotta da anfetamine, cocaina, oppiacei, alcol, nicotina; è maggiore se la droga è assunta rapidamente, in modo intermittente e in dosi progressive. La sensibilizzazione è molto persistente, può durare per mesi o anche anni e questo può spiegare perché le ricadute avvengono anche dopo molti mesi di disintossicazione. Inoltre, è modulata da fattori genetici, ambientali e da stress. Le droghe che producono dipendenza sensibilizzano due principali effetti: - Psicomotori - Salienza motivazionale (waiting = desiderio viscerale) Possono produrre anche affetti di cross-sensibilizzazione: ad es, la cocaina può sensibilizzare all’alcol, la droga può rendere ipersensibili allo stress ma anche viceversa. A livello neurale, la sensibilizzazione alle droghe si traduce in cambiamenti morfologici e funzionali nei circuiti del reward, che cambiano la connettività sinaptica: una volta sensibilizzati questi circuiti del NAcc rispondono in modo più potente, aumenta la lunghezza dei dendriti e il numero di sinapsi. L’espressione comportamentale della sensibilizzazione è tuttavia modulata da fattori contestuali: la sensibilizzazione è più evidente in contesti in cui la droga viene assunta. Tra gli effetti psicomotori sensibilizzati dalle droghe vi può essere aumento dello stato di attivazione, attenzione, attività motoria di agitazione, locomozione ed esplorazione, approccio, movimenti stereotipati. Una serie di lavori ha fornito evidenze coerenti con l’idea che l’uso ripetuto della droga provoca una sensibilizzazione dei circuiti neurali che mediano il desiderio viscerale (punto cruciale della teoria della salienza motivazionale). ▪ Esperimento di Pierre e Vezina (1998): Dopamine receptor blockade prevents the facilitation of amphetamine self-administration induced by prior exposure to the drug L’obiettivo è dimostrare che la sensibilizzazione alla cocaina si traduce in una disponibilità a lavorare per dosi successive molto piccole; che la sensibilizzazione è bloccata da un antagonista dei recettori della DA e che gli effetti della sensibilizzazione sono evidenti negli individui predisposti agli effetti psicomotori prodotti da allerta e arousal. - Valutazione predisposizione effetti di sensibilizzazione (attività locomotoria indotta da stimoli nuovi) - Somministrazione per 10 giorni di due iniezioni separate da 30 min di diverse sostanze salina, salina salina, anfetamina antagonista DA, salina antagonista DA, anfetamina - Test di auto infusione di bassa dose di anfetamina tramite pressione di una leva (condizionamento strumentale) Risultati: durante la fase di somministrazione esposizione alla iniezione solo i ratti nella condizione salina+anfetamina mostrano una attività motoria aumentata; si nota anche un effetto psicomotorio della anfetamina. Durante la fase di auto-somministrazione solo i ratti sensibilizzati dalla anfetamina sono disposti a lavorare per una dose infinitesimale di droga. In realtà l’effetto emerge solo per i ratti che avevano una risposta psicomotoria elevata a stimoli nuovi (alto livello di arousal), mostrano segni di sensibilizzazione alla anfetamina. L’antagonista blocca l’effetto dell’anfetamina e quindi la sensibilizzazione. I ratti premono la leva per una dose minima di droga, non sviluppano waiting viscerale. Perciò, l’esposizione alle anfetamine produce una sensibilizzazione che si manifesta come disponibilità dei ratti a lavorare per la droga; la sensibilizzazione è evidente perché i ratti sono disposti a lavorare per una piccola dose per la quale i ratti non esposti alle anfetamine non lavorano. La sensibilizzazione è più accentuata nei ratti che mostrano una predisposizione a effetti psicomotori. ……………………………………………………………………………………………………………… ▪ Esperimento di Shippenberg (1996): sensitization to the conditioned rewarding effects of morphine (pharmacology and temporal characteristics) L’obiettivo era quello di studiare gli effetti della sensibilizzazioni indotti dalla morfina sul condizionamento, vedere dopo quanto tempo si manifestano gli effetti e verificare se vi sono possibili effetti di cross-sensibilizzazione tra morfina e altre sostanze. - Prima fase di 5 giorni di training in cui i sogg sono esposti a una iniezione salina o di morfina per una volta al giorno - Seconda fase di 3 giorni di condizionamento per la preferenza di posizione per due posizioni diverse per colore (per distinguere gli stimoli), in cui i sogg vengono sottoposti a iniezione di morfina che può essere di tre quantità diverse o una iniezione salina -> conditioning place preference - Test di condizionamento in estinzione del reward iniezione per vedere dove il ratto si posiziona Risultati: i ratti pretrattati con salina non sviluppano alcuna preferenza, i ratti invece pretrattati con morfina preferiscono la posizione in cui ricevono la sostanza e questo tanta più era la dose che veniva somministrata (la sensibilizzazione aumenta l’effetto della droga nel condizionamento). Inoltre si vede che il condizionamento funziona solo nei ratti pretrattati con la morfina ma solo dopo che sono passati 3 giorni dal trattamento; dopo 10 giorno l’effetto è ancora presente. Quindi, la sensibilizzazione richiede del tempo per manifestarsi. Anche trattando i ratti con nicotina per 5 giorni, si mostrano effetti di preferenza nella posizione in cui ricevono la sostanza. Inoltre, è stato dimostrato che il condizionamento funziona anche se l’animale è stato trattato con nicotina e poi rinforzato con morfina: la nicotina amplifica l’effetto della droga. In conclusione, la somministrazione prolungata di morfina crea sensibilizzazione alla droga e ci mette qualche giorno a manifestarsi completamente; inoltre vi sono delle evidenze di cross-sensibilizzazione da nicotina a morfina. La cross-sensibilizzazione è coerente con altri studi e con le osservazioni cliniche che riportano il fatto che la dipendenza da droghe porta anche ad altre dipendenze come all’alcol, al sesso, soldi o gioco d’azzardo. Per essere sicuri che il desiderio viscerale per un reward nasca dalla sensibilizzazione e dalla percezione di un cue del reward, devono essere escluse due spiegazioni alternative: - Escludere che il cue alteri gli aspetti edonici del reward - Che il cue crea aspettative cognitive del reward - Che il cue inneschi abitudini - Che il cue funzioni come un reward condizionato (rinforzi il comportamento di ricerca) ▪ Esperimento condotto da Wyvell e Berridge (2000): combinano l’iniezione di anfetamina nel NAcc per produrre un rilascio amplificato di DA, come avviene nella sensibilizzazione, con un paradigma del tipo PIT, per valutare l’impatto di un cue (CS) nel generare desiderio viscerale per un reward (US) in una condizione analoga alla sensibilizzazione. - Prima fase di condizionamento strumentale con due leve in cui sola la pressione di una porta allo zucchero - Seconda fase di condizionamento pavloviano per due gruppi di ratti: in un gruppo una luce precede sistematicamente lo zucchero (CS+) mentre per l’altro gruppo la luce viene data in modo random (CSr) e quindi non è predittiva (sono esposti lo stesso numero di volte indipendentemente dal fatto che sia casuale o meno) - Terza fase di test in estinzione con paradigma PIT, in cui ai ratti, in momenti diversi, viene iniettata l’anfetamina o una salina di controllo Risultati: quando il ratto è stato sottoposto a condizione salina e la luce viene accesa, lavora molto di più per ottenere la ricompensa (effetto PIT). L’iniezione di anfetamina ha un effetto producendo un aumento spropositato del desiderio di lavorare solo quando c’è il cue luce. In questo caso il desiderio viscerale del ratto è per lo zucchero perché era stato condizionato per quello. L’effetto di waiting è specifico per il gruppo CS+: solo il cue che era predittivo, e aveva quindi prodotto condizionamento classico, è in grado di generare il desiderio (con la pressione della leva) per il suo US (zucchero) associato. Non vi è alcun effetto generico dell’anfetamina visto che non viene modulata la pressione della leva di controllo. [ Esperimento 2: hanno trovato che l’iniezione di anfetamina non aumentava la reazione edonica al reward zuccherato ] Si può quindi concludere che la microiniezione di anfetamina nel NAcc aumenta la capacità di un cue pavloviano di potenziare il lavoro che l’animale è disposto a fare per ottenere il reward e questo effetto è specifico per il cue CS+ che era predittivo del reward ed è specifico per la leva associata al reward. Quindi, dopo l’aumento del livello di DA simile a quello prodotto dalla sensibilizzazione, un cue del reward è in grado di innescare nel ratto un desiderio viscerale di ottenerlo, come evidenziato dalla pressione della leva. - Un gruppo di ratti viene addestrato in fase di training a premere una leva per ottenere un reward e quindi piacere - Vengono divisi poi in tre gruppi in cui uno non riceve alcun trattamento, uno riceve placebo e uno riceve pimozide - Nella fase di retest i ratti vengono posti nuovamente davanti alla leva, dove il gruppo che non aveva ricevuto il trattamento non riceve reward mentre gli altri si Risultati: il gruppo trattato con il neurolettico smette progressivamente di lavorare, con un pattern di comportamento simile al gruppo che non riceve più reward -> secondo Wise è come se il reward avesse perso le sue proprietà edoniche Con il tempo si è giunti alla conclusione che la DA non è il neurotrasmettitore del piacere; come già visto nel lavoro di Berridge e Robinson, la DA non è indispensabile per la risposta edonica se misurata attraverso i pattern di reattività al gusto. Hp empiriche che hanno fatto cadere questa hp: - Il lavoro di Berridge e Robinson - Una serie di osservazioni cliniche su pazienti con malattia di Parkinson, che hanno estesa riduzione del livello di DA, danno normali giudizi di piacevolezza alle sostanze dolci - Persone che sono in uno stato di blocco dei recettori di DA forniscono giudizi normali di piacevolezza a seguito di iniezione di cocaina - Ratti che a seguito di una mutazione genetica non hanno il sistema dopaminergico mostrano di preferire reward dolci - Iniezioni di anfetamina nel NAcc producono una forte elevazione del livello di DA, tuttavia ratti in questo stato non cambiano il loro pattern di reattività al gusto delle sostanze dolci - La stessa condizione si osserva anche dopo stimolazione elettrica del sistema mesolimbico, che si sa essere fondamentale per la DA  Hp del rinforzo: un rinforzo è un reward che, dato in risposta ad una azione, concorre a memorizzare la relazione tra un particolare stimolo e una certa risposta; a prescindere dagli aspetti edonici, il reward può agire favorendo la formazione della relazione S-R e quindi l’apprendimento di nuove abitudini -> la DA media il rinforzo, non necessariamente il piacere ▪ Lavoro di Wise e Schwartz (1981): se la DA è implicata nel meccanismo di rinforzo prodotto da un reward, allora una riduzione del suo livello dovrebbe interferire con l’apprendimento di un compito attraverso condizionamento strumentale - Somministrazione di placebo o di tre possibili dosi di pimozide, 4 ore prima del condizionamento operante - Sessioni di training durante le quali il ratto riceve del cibo se preme una leva Risultati: il pimozide annulla l’effetto rinforzante del reward. I risultati dimostrano che all’aumentare della dose di antagonista della DA, diminuisce la capacità dell’animale di apprendere in un compito di condizionamento operante. Tale risultato è compatibile con l’hp di un ruolo della DA nel rewrad inteso come meccanismo di rinforzo della relazione S-R. Il ruolo della DA per il rinforzo emerge anche nel condizionamento pavloviano e in particolare è stato osservato nel Conditioning Place Prefernce: è una misura di condizionamento pavloviano e in particolare della risposta di approccio verso un luogo (CS) che è stato associato alla presentazione di un US. ▪ Lavoro di Spyraki (1982): - Fase di pretrattamento durante il quale viene valutata la preferenza spontanea dell’animale in merito ad uno di due locali (nero o bianco) - Fase di trattamento e condizionamento durante il quale un gruppo riceve placebo e altri due gruppi aloperidolo (antagonista della DA), poi vengono messi nel luogo meno preferito dove riceveranno cibo (CPP) - Fase di test in estinzione durante la quale si osserva scelta spontanea del luogo Risultati: il gruppo che erano nella condizione placebo, cambiano la loro preferenza; ratti trattati con la sostanza invece non cambiano la preferenza nonostante trovassero cibo -> lo interpretano come evidenza che una volta bloccata la DA non vi è nuovo apprendimento Solo il gruppo con placebo mostra evidenza di CPP; l’aloperidolo bloccando i recettori DA impedisce il condizionamento. Esistono quindi evidenze sperimentali che sono congruenti con l’hp che la DA sia implicata nel processo di rafforzamento di una associazione: questa associazione può essere di tipo S-R, come nel caso del condizionamento strumentale, o di tipo S-S, come nel caso del condizionamento pavloviano. In entrambi i casi il reward svolge la funzione di rinforzo e la DA media il processo di rafforzamento.  Hp degli incentivi motivazionali: il reward può fare riferimento anche al ruolo incentivante o motivazionale di uno stimolo, quindi se dato dopo una risposta in presenza di un certo stimolo, agirà come rinforzo dell’associazione S-R ma se visto prima della risposa funziona da incentivo ad emettere la risposta Sappiamo che CS associati al reward possono acquisire le proprietà motivazionali del reward stesso; la DA medierebbe questo apprendimento ▪ Lavoro di Spyraki (1983): l’idea è quella di usare il conditioning place preference come indicazione del fatto che uno stimolo (luogo) ha acquisito una proprietà motivazionale -> motivazione di andare in un liogo per ottenere il reward - Fase in cui si determina il luogo meno preferito - Seconda fase in cui viene fatta un’iniezione di droga nel luogo meno preferito (CCP) - Terza fase in cui si valuta la preferenza indotta dal luogo che era associato alla droga (scelta del posto in estinzione) Risultati: nel caso in cui viene somministrata droga, il ratto aumenta la sua tendenza a muoversi nel luogo dove aveva ottenuto droga (il luogo ha acquisito le stesse proprietà motivazionali della droga) -> la droga che agisce sulla DA fa aumentare la preferenza per il luogo dove viene somministrata; la vista del posto dove era stata somministrata la droga motiva l’animale a raggiungere e sostare in tale luogo ▪ Lavoro 2 di Spyraki: l’esperimento è simile ma vi è una seconda fase, dopo la valutazione del luogo preferito, in cui viene fatta una lesione nel NAcc o in un altro nucleo; in seguito viene fatta una iniezione di droga o di placebo nel posto meno preferito e, in ultima fase, si vede la scelta del posto in estinzione. Risultati: rispetto ad una lesione irrilevante per la DA, la lesione del NAcc riduce la capacità motivazionale del CS (dove era stato ottenuto il reward) di attrarre l’animale. Vi sono quindi evidenze sperimentali che sono compatibili con l’hp che la DA possa mediare l’acquisizione di proprietà incentivanti o motivazionali da parte di un CS. In realtà, anche le caratteristiche fisiche che definiscono un reward diventano CS che anticipano il vero reward, che probabilmente è la reazione edonica associata al consumo, o l’aumento del glucosio nel sangue -> la DA sarebbe importante anche per conferire aspetti incentivanti a tali caratteristiche  Hp della salienza motivazionale: assegna alla DA un ruolo nella motivazione, la differenza è che al posto di considerare la DA importante per il trasferimento della salienza dal reward al CS, l’hp assume che la DA sia la causa del desiderio di waiting generato dalla visione del CS o del reward stesso Un rilascio enorme di DA dal NAcc nel sistema limbico in presenza di un CS, genera il desiderio incontrollabile per il reward ▪ Esperimento di Wyvell e Berridge - Prima fase di condizionamento strumentale con due leve in cui solo la pressione di una porta zucchero - Seconda fase di condizionamento pavloviano per due gruppi di ratti in cui uno riceve lo zucchero preceduto da una luce (CS+) e l’altro riceve la luce in modo random perciò non è predittiva dell’arrivo dello zucchero - Terza fase di test in estinzione con paradigma PIT in cui ai ratti in momenti diversi viene iniettata anfetamina o un placebo di controllo Risultati: l’effetto di waiting è specifico per il gruppo CS+, vale a dire che solo il cue che era predittivo e aveva quindi prodotto condizionamento classico è in grado di generare il desiderio (pressione della leva) per il suo US (zucchero) associato Diversi studi di questi due autori forniscono risultati che sono a favore di un ruolo della DA nella salienza motivazionale. I loro lavori hanno anche chiarito che la DA non è il neurotrasmettitore che media la sensazione di piacere, ma quella di volere: il desiderio in questione è di tipo viscerale, non razionale, ed è controllato non dalla corteccia ma dal sistema mesolimbico.  Hp del reward prediction error: di Rescorla e Wagner (1972), presentano un modello matematico che descrive il meccanismo di apprendimento nel condizionamento pavloviano -> modello matematico per modellare l’apprendimento Risultati con grating semplici di diverse frequenza spaziali: mostrano che in questo tipo di compito non c’è apprendimento, quindi non si evidenzia PL ▪ Per valutare se l’apprendimento percettivo sia specifico per posizione dello stimolo o se si trasferisce nelle varie parti del campo visivo, alcuni soggetti sono stati allenati in due differenti parti del campo visivo - Fase 1 di allenamento superiore - Fase 2 di allenamento inferiore Risultati: il PL si dimostra specifico per la posizione del campo visivo nella quale è avvenuta la stimolazione sensoriale -> cambiando la posizione dello stimolo il PL deve ricominciare ▪ Vogliono ora valutare se l’apprendimento percettivo sia specifico per l’occhio allenato - Fase 1 di allenamento con occhio sx - Fase 2 di allenamento con occhio dx Risultati: dimostrano trasferimento completo dell’allenamento da un occhio all’altro e questo indica che le basi neurali dell’apprendimento di questo tipo di compito sono localizzabili ad uno stadio di convergenza delle info tra i due occhi (il primo stadio di convergenza sono i neuroni binoculari in V1) Conclusioni: il PL di stimoli come quelli usati in questi studi risulta specifico per posizione spaziale, orientamento e frequenza spaziale; una volta ottenuto PL si mantiene nel tempo e mostra trasferimento inter-oculare, il che suggerisce una base neurale che deve essere in V1 o successiva. Lavoro di Ball e Sekuler (1987): direction-specific improvement in motion discrimination Obiettivo è studiare la plasticità del meccanismo di apprendimento della percezione del movimento, in particolare se si può imparare a percepire in modo migliore qualche tipo di movimento; vogliono studiare la specificità di tale apprendimento e la durata, e quali sono le basi neurali di tale tipo di apprendimento. - Presentano un insieme di puntini lungo un certo asse in due intervalli di tempo distinti - 400 punti che si muovono per 500ms - Intervalli separati da 200ms - In metà delle prove i due insiemi si muovono nella stessa direzione mentre nell’altra metà hanno direzioni diverse di 3° - Compito è dire se i due insiemi sono uguali o diversi - Viene fornito un feedback ad ogni trial - Viene utilizzata la teoria della detezione del segnale al fine di disambiguare lo stile e sensibilità discriminativa • Esperimento 1: la capacità discriminativa viene misurata lungo vari assi di movimento (45° di differenza l’uno dall’altro) in 7 sessioni sperimentali divise in test e training (da 10 a 12 giorni di allenamento) - Sessioni 1, 4, 7 misurata la capacità discriminativa di ognuna delle 8 direzioni - Sessioni 2, 3, 5 viene allenata una specifica direzione di movimento (assegnata a caso ad ogni soggetto, 500 trial) Risultati: per misurare la capacità discriminativa lungo i vari assi viene utilizzato il d’ - Dimostra che la capacità discriminativa è migliore lungo gli assi cardinali rispetto a quelli obliqui sia prima che dopo il training - La capacità discriminativa migliora con le varie sessioni ma il miglioramento è specifico per la direzione allenata: nella direzione non allenata non vi è miglioramento mentre in quella allenata è notevole (anche nel caso in cui le due direzioni fossero opposte ma nello stesso asse 135°-315°) - Il PL mostra un limitato effetto di trasferimento che si osserva per le posizioni che distano al massimo 45° da quella allenata - La capacità discriminativa viene mantenuta, anche senza ulteriore allenamento, per un tempo (da 3 settimane fino alle 10) • Esperimento 2: ruolo del feedback, uguale all’esperimento 1 ma viene tolto il feedback ad ogni trial per valutare l’effetto che può avere nel PL - Il feedback viene dato solo alla fine di ogni sessione, complessivo sulla prestazione nella sessione [ alcuni studi dimostrerebbero che il feedback incide sulla prestazione momentanea ma non sull’apprendimento ] Risultati: il feedback non è necessario per l’apprendimento lungo gli assi cardinali ma ha un ruolo modesto su quelli obliqui (condizione più difficile) -> l’aiuto fornito dal feedback lungo gli assi obliqui probabilmente dipende dal fatto che il compito in queste condizioni è più difficile e quindi un aiuto da parte del feedback in condizioni di maggiore incertezza può migliorare il PL. Scopo dei prossimi esperimenti è quello di cercare di individuare le basi neurali del PL associato alla discriminazione della direzione del movimento: per capire lo stadio a cui avviene il PL usano la manipolazione dell’allenamento monoculare -> la logica è che se il PL non trasferisce da un occhio all’altro allora le basi neurali possono essere identificate o nello strato 4 di V1o prima nel NGL (oltre questi stadi i neuroni diventano per la maggior parte binoculari). • Esperimento 4: specificità oculare - Uguale all’1 ma il training è monoculare - Il test è monoculare per entrambi gli occhi Risultati: - Dopo il training l’occhio allenato mostra una prestazione leggermente migliore di quello non allenato - Tuttavia, anche quello non allenato mostra un chiaro miglioramento rispetto al test iniziale • Esperimento 5: specificità emisferica, obiettivo è verificare se il PL per una direzione allenata in un emisfero viene trasferito anche all’altro emisfero - Uguale al 2 ma test e training sono solo nell’occhio dx - Rispetto al punto di fissazione viene presentato il movimento nell’emicampo dx, l’immagine viene proiettata dall’emiretina nasale dx all’emisfero sx - Rispetto al punto di fissazione viene presentato il movimento nell’emicampo sx, l’immagine viene proiettata dall’emiretina temporale dx all’emisfero dx - Test su due direzioni (90° o 180°) - Training solo su una direzione e un emisfero Risultati: quando il test viene fatto sullo stesso emisfero del training si osserva PL; tuttavia, non trasferisce dall’emisfero allenato a quello non allenato e quindi il test nell’emisfero diverso non mostra segni di apprendimento. - Ad ogni blocco veniva utilizzata una procedura staircase up-down che puntava all’84% di risposte giuste (percentuale chiamata JND ovvero Just Noticeable Difference e fornisce una misura in gradi di angolo visivo, con inclinazione dello stimolo dai 45°, della capacità discriminativa del sogg) [ ogni soggetto può avere inclinazioni dello stimolo diverse per raggiungere l’84% delle risp giuste e con questo metodo fa in modo di avere risultati non devianti dovuti al fatto che le inclinazioni sono diverse -> metodo adattivo che si adatta alla prestazione del sogg, stima una soglia per una certa % di risp giuste ] Se c’è learning si dovrebbe osservare una situazione in cui la differenza di inclinazione dovrebbe essere sempre minore per arrivare all’84% di risp esatte (intuizione confermata dai risultati). Risultati: tutti i sogg migliorano le prestazioni nel compito di discriminazione di orientamento (il training è evidente come gruppo ma anche nel singolo soggetto). Tuttavia, se lo stimolo viene ruotato di 90° il PL viene perso e ricomincia, la soglia risale (l’effetto è presente sia nel gruppo che nel singolo soggetto). Così come nello scorso esperimento, l’apprendimento è rapido nella fase iniziale e più lento dopo le prime 5-10 sessioni. Trasferimento retinotopico: allenano lo stimolo in fovea e si nota un miglioramento, dopodichè spostano lo stimolo in altri punti e ogni volta che viene spostato una grande parte del learning precedente viene perso anche se si rimane entro lo stesso emicampo -> dopo aver testato lo stimolo su varie posizioni spaziali, osservarono una mancanza di trasferimento Trasferimento inter-oculare: 4 sogg vennero sottoposti a training monoculare nel compito di discriminazione di orientamento e dopo il raggiungimento del grado massimo di apprendimento vennero testati con gli stessi stimoli ma sull’occhio non addestrato. In questo caso, 3 dei 4 sogg mostrarono un trasferimento inter-oculare completo. Dal primo blocco all’ultimo nello stesso giorno non vi è miglioramento, questo si osserva solo il giorno dopo perché il soggetto necessita di riposo (hp), infatti il sonno gioca un ruolo importante nell’apprendimento -> non vi è apprendimento all’interno della stessa sessione di allenamento (solitamente) Conclusioni: l’app percettivo legato alla pratica porta ad un significativo aumento della capacità di discriminare orientamenti. Date le caratteristiche di questa forma di apprendimento, è possibile assumere che i suoi correlati neurali siano situati a livelli precoci delle aree visive. Risultato importante è l’elevata specificità retinica del PL in questo tipo di compito: il miglioramento non avviene nella sessione di training ma tra sessioni diverse in giorni diversi -> necessità di fase di consolidamento notturno, ma in realtà spesso si osserva miglioramento anche all’interno della stessa sessione (forse dipende dal compito discriminativo usato) ATTENZIONE E APPRENDIMENTO PERCETTIVO Studio di Shiu e Pashler (1992): improvement in line orientation discrimination is retinally local but dependent on cognitive set Domanda di ricerca: se prestare attenzione ad uno stimolo nel suo complesso sia sufficiente ad indurre app e se è così la caratteristica specifica su cui ci si allena dovrebbe essere irrilevante; ci potrebbe essere un miglioramento della prestazione nella posizione allenata indipendentemente dal compito fatto sullo stimolo (c’è app indipendentemente dalla posizione, dalla caratteristica ecc?). Esperimenti 1 e 2: specificità e ruolo del feedback -> vogliono confermare che il PL è specifico per la posizione retinica, orientamento dello stimolo e verificare se è influenzato dal feedback - Stimoli con linee inclinate a 7° o 9.8° - Linee presentate in due posizioni retiniche opposte - Compito: discriminare se lo stimolo presentato è uguale o meno a uno target e identificazione del grado di inclinazione - Il sogg viene testato in una posizione che è sia uguale che diversa da quella allenata • Esperimento 1: sessione di training di 12 blocchi di allenamento in cui i primi 9 hanno una posizione e gli altri 3 una posizione diversa; il feedback è diverso in 3 gruppi ovvero: - Feedback ad ogni prova - Feedback solo alla fine del blocco (% risp corrette) - Nessun feedback in nessuna prova Risultati: la prestazione peggiora in modo significativo quando le linee vengono presentate in una nuova posizione (emicampo opposto o diverso quadrante) -> si dimostra quindi specificità per la posizione allenata, sia nel gruppo con feedback ad ogni prova che nel gruppo con feedback a fine del blocco di prove L’apprendimento non è visibile in assenza di feedback, tuttavia il learning sembra essere latente perché si osserva una caduta della prestazione nella posizione non allenata. • Esperimento 2: è uguale all’1 ma il feeddback è sempre assente - Training distribuito in diverse giornate ovvero 8 sessioni per un partecipante e 5 sessioni più 2 test per 2 partecipanti - Il test può riguardare lo stimolo nella direzione e posizione allenata lo stimolo allenato in una nuova posizione uno stimolo nuovo in una posizione allenata Risultato: un miglioramento delle prestazioni si può osservare anche in assenza di feedback (risultato non in linea con quello precedente). Inoltre si vede specificità per posizione spaziale e orientamento: la prestazione peggiora quando le linee vengono presentate in una nuova posizione o quando viene testato un nuovo orientamento. • Esperimento 3: stessa posizione, stesso stimolo ma con due caratteristiche e il sogg deve prestare attenzione solo a una delle due -> si chiedono quale sia il ruolo dell’attenzione nel PL - Stimoli con linee inclinate a 7° o 9,8° - Due diversi livelli di luminosità con compito facile e compito difficile - Il sogg deve discriminare se la luminosità è uguale o meno (gli stimoli vengono presentati in due intervalli di tempo diversi) - Test iniziale su discriminazione di orientamento - 5 sessioni di training su discriminazione di luminosità - Test finale su discriminazione dell’orientamento - Feddback sempre assente Risultati: in linea con l’hp che senza prestare attenzione all’orientamento, anche se vi è differenza di orientamento nello stimolo a cui si presta attenzione, non vi è apprendimento; non c’è differenza significativa tra pre-test e post-test nel compito di orientamento per entrambi i tipi di compito (facile e difficile): il miglioramento non è maggiore nella posizione allenata rispetto a quella non allenata e quindi non dipende dall’allenamento. Perciò, il miglioramento è specifico per posizione retinica e orientamento dello stimolo, può avvenire anche in assenza di feedback durante l’apprendimento. L’apprendimento non ha bisogno di feedback ma richiede l’attenzione sulla caratteristica che è rilevante per il compito. Studio di Ahissar e Hochstein: attentional control of early percpetual learning Si chiedono se vi sono effetti di apprendimento percettivo anche a livelli molto precoci dell’analisi attentiva. - Stimoli di matrici di linee oblique da 5x6 elementi o 6x5 - Inclinazione di 30° o 60° - I due parametri sono variati in modo ortogonale - Mask di matrice di 7x7 elementi (asterischi) per 100ms - SOA compreso tra 16 (tempo minimo per il quale si poteva presentare uno stimolo per le tecnologie del tempo, questo è il motivo) e 183 ms (intervallo tra presentazione della matrice e mask) (Fenomeno del pop-out: (vedi) il sistema riconosce lo stimolo prima dell’intervento dell’attenzione, o meglio lo riconosce in modo molto veloce, per questo si definisce elaborazione pre-attentiva) - Due compiti diversi su uno stesso stimolo: local identification (riconoscere se c’è un pop-out ovvero uno stimolo di orientamento differente rispetto agli altri) oppure global identification (chiede se la matrice nel complesso forma una figura di orientamento verticale o orizzontale) - Feedback per le risposte corrette - Ogni sessione inizia con un SOA lungo che viene diminuito costantemente fino a raggiungere il valore minimo di 16ms - In base alla performance nei primi blocchi vengono scelti valori estremi del blocco successivo - Viene misurato il valore SOA a cui i partecipanti hanno una prestazione del 82% (variabile dipendente è il tempo) Risultati: prima dell’allenamento accorciando l’SOA disponibile la prestazione cade, fino al valore del caso; dopo l’allenamento la psicometrica si sposta ovvero per ottenere la stessa percentuale di risposte corrette è necessario un SOA più basso. Tutto ciò si osserva sia nei compiti globali che in quelli locali. SPECIFICITA’ vs TRASFERIMENTO Esiste un notevole livello di specificità nell’apprendimento di semplici stimoli visivi: - Per posizione - Per orientamento - Per frequenza spaziale - Per direzione di movimento - Per compito (globale vs locale) L’elevato livello di specificità è in parte un problema per il PL, perché lo rende limitato alle caratteristiche dello stimolo allenato. Questione interessante è se questa specificità sia inevitabile o se possa essere in qualche modo superata/attenuata. Tradizionalmente, il PL viene spiegato come una risposta dei neuroni ottimale per una determinata caratteristica che può essere modificata con il training (si riduce l’ampiezza della gaussiana -> quando l’area di sovrapposizione si riduce, aumenta d’). Questa è in linea con l’idea che il PL coinvolge aree visive primarie, dove i neuroni sono altamente specifici. (anche qui ci sarebbe un neurone decisionale ma riceve risp già differenziate) Una spiegazione alternativa, secondo alcuni autori, presuppone che il PL non dipenda da cambiamenti dei neuroni e della loro proprietà di risposta, ma il PL come tuning (regolazione delle proprietà di risposta) delle connessioni tra aree di alto livello e aree visive primarie: vari neuroni sensoriali (V1) sono connessi con un una popolazione di neuroni decisionali che raccoglie le diverse risp dei neuroni sensoriali e determina quale è quella corretta -> il neurone decisionale aumenta la sua connettività con i neuroni che forniscono risp corrette (neuroni più coinvolti nella risp) e invece diminuisce connettività dell’input con neuroni meno coinvolti (la curva sensoriale dei neuroni sensoriali non cambia, viene ottimizzata la connessione) Questo ultimo meccanismo viene chiamato meccanismo di re-weighting (ripesaggio delle connessioni), che è specifico per posizione allenata; l’unità decisionale per ottimizzare le connessioni deve essere quindi collegata con una certa area del campo visivo. Studio (2008): complete transfer of perceptual learning across retinal locations enabled by double training Seguendo il meccanismo di re-weighting, Xiao e colleghi si basano sull’idea di vedere se si può trasferire il learning preparando il collegamento. Tre fasi: 1) si allena una posizione spaziale per un orientamento (feature learning) 2) si allena una posizione diversa in un compito diverso, ad esempio di contrasto (location learning) 3) test della caratteristica allenata nella prima fase ma nella posizione della seconda fase per valutarne un eventuale trasferimento - 8 partecipanti - Discriminazione di contrasto in una scelta forzata a due intervalli - Uso di una staircase per stimare la soglia di contrasto all’80% di risposte corrette - 6 sessioni di allenamento di due ore per sessione in una posizione - Test in una posizione diversa nello stesso emisfero Risultati: per ottenere l’80% di risp giuste basta una diff di contrasto minore rispetto a quella iniziale (migliora circa un 25% con il training); quando lo stimolo viene spostato nella nuova posizione la soglia non mostra miglioramenti -> se si testa il gabor in una posizione retinicamente diversa non vi è nessun miglioramento nella discriminazione del contrasto • Esperimento 2: - 5 partecipanti - Discriminazione di contrasto su gabor verticale in posizione 1 - In seguito discriminazione di orientamento del gabor orizzontale in posizione 2 - Test del contrasto nella posizione allenata con orientamento Risultati: in seguito all’allenamento mostrano miglioramenti -> quello che viene imparato in una posizione può essere trasferito ad un’altra posizione (allenamento sull’orientamento e miglioramento nel contrasto) I partecipanti migliorano nella capacità di discriminare: miglioramento del contrasto nella posizione 2. • Esperimento 3: verifica dell’importanza della sequenza - 6 partecipanti - Discriminazione di contrasto su gabor verticale in posizione 1 - Discriminazione di orientamento su gabor orizzontale in posizione 2 - Prima viene fatto un training sull’orientamento (location training) in una posizione, poi sul contrasto in una posizione diversa (feature training) - Test sul contrasto sulla posizione allenata per l’orientamento Risultati: mostrano trasferimento, la capacità di discriminare il contrasto migliora a seguito di location training; la capacità di discriminare il contrasto migliora ulteriormente dopo feature training in una diversa posizione spaziale. Complessivamente si osserva un completo trasferimento dell’apprendimento: il location training ha preparato la posizione allenata e questo ha permesso il trasferimento dell’apprendimento sulla discriminazione del contrasto. La loro idea è che il 2° training prepara la posizione allenata e connette la posizione con la stessa unità decisionale e fatto questo trasferisce l’apprendimento. Conclusioni: il completo trasferimento dell’app riscontrato mette in dubbio l’hp che l’app percettivo avvenga esclusivamente nelle aree visive primarie. Il location training potrebbe agire migliorando la distribuzione dell’attenzione spaziale, che è indipendente dalle caratteristiche dello stimolo, nella posizione allenata. Ci si chiede quali sono le condizioni necessarie perché vi sia trasferimento con la procedura di double training, in particolare che ruolo ha l’attenzione e che ruolo ha lo stimolo. Lavoro di Mastropasqua: location transfer of perceptual learning (passive stimulation and double training) • Esperimento 1: obiettivo è replicare la specificità spaziale del PL in un compito di discriminazione di orientamento di un gabor - 800 trial per sessione giornaliera - Training con un gabor in una posizione - Test con il gabor in un’altra posizione diametralmente opposta del campo visivo Risultati: si conferma la specificità spaziale del PL per quanto riguarda la discriminazione di orientamento -> spostando il gabor da una posizione allenata a una nuova non vi è miglioramento • Esperimento 2: ci si è chiesti se si può ottenere trasferimento anche senza compito ma solo se viene portata attenzione in un punto diverso (con orientamento automatico dell’attenzione) - In ogni prova il gabor nella posizione 1 era seguito da un onset nella posizione 2 (portava in quel punto l’attenzione) - Veniva poi spostato il gabor nella posizione 2 per vedere se vi era vantaggio Risultati: solo l’attenzione nella posizione 2 non basta a favorire il trasferimento del PL dalla posizione 1 alla posizione 2 Critica a questo esperimento però è che lo stimolo deviante è sempre lo stesso sempre nella stessa posizione perciò il sistema potrebbe andare incontro ad abituazione. • Esperimento 3: obiettivo è verificare e confermare che con un compito nella posizione 2 è possibile indurre trasferimento del PL dalla posizione 1; inoltre, diversamente da Xiao, in posizione 2 viene usato un compito con uno stimolo completamente diverso da quello usato per il PL in posizione 1 - Gabor in posizione 1 (discriminazione orientamento) - In posizione 2 invece appariva uno stimolo X o Y e il sogg doveva discriminare quale lettera appariva (stimolo completamente diverso dal gabor) - I due training erano paralleli, avvenivano nello stesso trial Risultati: si osserva completo trasferimento del PL dalla posizione 1 alla 2, infatti c’è PL anche nella posizione 2 nel compito X/Y • Esperimento 4: ci si chiede quanto importante è la quantità di allenamento nella posizione 2 affinchè trasferisca il PL dalla posizione 1 - Replica dell’esperimento 3 ma con lo stimolo X/Y che appare nella posizione due solo il 20% delle volte Risultati: non vi è trasferimento di apprendimento • Esperimento 5: ci si chiede se è sufficiente la stimolazione passiva nella posizione 2 affinchè trasferisca il PL dalla posizione 1 - Rispetto al 3 lo stimolo X/Y appare ma non è richiesto alcun compito Risultati: non vi è trasferimento di apprendimento