









Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Breve ma dettagliata descrizione dei meccanismi alla base dell'apprendimento
Tipologia: Appunti
1 / 16
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!










-> l’apprendimento avviene x prove ed errori -> il gatto è motivato a cercare una soluzione -> il comportamento è emesso con un obiettivo (questo aspetto teorico differenzia il lavoro di Thorndike da quello di Skinner) -> il cibo funziona come rinforzo per l’azione eseguita poco prima -> il premio aumenta la possibilità che quell’azione sia ripetuta anche in seguito -> le azioni del gatto sono inizialmente casuali -> alcuni comportamenti (errori) non portano alla conseguenza piacevole -> solo quelli che portano alla conseguenza piacevole vengono rinforzati (ma non serve che l’animale si rappresenti le conseguenze delle proprie azioni) L’apprendimento avviene automaticamente Il meccanismo attraverso cui avviene l’apprendimento è di tipo associativo (come x l’apprendimento classico), la differenza è che metto in mezzo una risposta -> US (= O, outcome) arriva solo se l’animale dà una risposta O va a rinforzare la relazione tra stimolo (S) e risposta (R), come US rinforzava quella tra CS e US -> dato uno stimolo (la leva), la conseguenza di una risposta (pressione della leva) è una ricompensa (cibo), che rinforza l’associazione tra stimolo e risposta. Questa associazione viene rinforzata ad ogni ripetizione => impariamo dalle conseguenze delle nostre azioni -> principio alla base del condizionamento operante -> l’apprendimento si basa su rinforzi e punizioni Che relazione c’è tra azioni e conseguenze? Il fatto che l’animale impari dalle conseguenze delle proprie azioni non implica necessariamente che esso “creda” che ad una sua risposta segua una certa conseguenza o risultato (outcome) -> questa conoscenza non è necessaria, e non è contemplata da Thorndike Semplicemente il premio (o la punizione) agiscono sull’associazione tra le due rappresentazioni attive, quella dello stimolo e quella della risposta -> basta che O arrivi temporalmente vicino a S e R per rinforzare la loro associazione Legge dell’effetto -> imparo in funzione di qual è l’effetto -> se la conseguenza è positiva tendo a ripetere quel comportamento, se è negativa ad eliminarlo-> Thorndike introduce il concetto di rinforzo positivo (premio) e di punizione Legge dell’esercizio -> si impara ripetendo (è usando l’associazione che la rinforzo) e si dimentica smettendo di ripetere (trascurandola/non usandola la indebolisco) Premi e punizioni -> il premio è più forte della punizione -> se è vero che le conseguenze piacevoli di un comportamento tendono ad aumentare la probabilità che quel comportamento si ripeta, non è altrettanto vero che le punizioni eliminano del tutto i comportamenti non desiderati -> x eliminare un comportamento che non mi piace ho più successo se premio la persona per un comportamento alternativo e incompatibile che insegno che se punisco (non puniamo le persone perché rubano, premiamole perché non rubano) -> idea condivisa poi anche da Skinner (implicazioni per i sistemi educativi) -> il motivo è di natura evoluzionistica, come già notato da Darwin (l’idea di Thorndike ha molto in comune con la teoria della selezione naturale-> concetto di meccanismo a feedback che funziona a livello del singolo individuo o genetico -> la mutazione che porta dei vantaggi in termini di sopravvivenza viene trasmessa, così come il comportamento che porta dei vantaggi/premi viene ripetuto) -> le condizioni piacevoli sono più vantaggiose di quelle spiacevoli Nb. in entrambi i casi i meccanismi sono automatici, casuali (senza obiettivo) e non intenzionali Nb. il premio è più forte perché mi dà un’alternativa
comportamento operante -> devo agire sull’ambiente x far sì che questo agisca su di me -> spiegato dalla risposta che l’organismo riceve dall’ambiente in conseguenza delle proprie azioni (Thorndike) Il comportamento, non gli stati mentali, è l’unica variabile misurabile, controllabile e meritevole di indagine scientifica e l’unico modo x studiare il comportamento è studiare lo schema di rinforzo Scatola di Skinner (Skinner box) = ambiente controllato/semplificato in cui l’animale vive -> controllo gli stimoli ambientali (premi e punizioni) e registro le relative risposte (comportamenti) dell’animale -> approccio riduzionista ma assolutamente scientifico Concetti fondamentali del condizionamento operante Operante = ogni risposta emessa dall’organismo che ha un effetto sull’ambiente -> opera sull’ambiente Es. la pressione della leva
comportamento che ha preceduto l’evento venga ripetuto (la ricompensa aumenta le probabilità che il topo prema di nuovo la leva) Relazione tra operante e rafforzamento -> l’organismo messo in un ambiente qualsiasi si muove, muovendosi metterà in atto delle azioni (emetterà spontaneamente dei comportamenti, sulla base di vincoli biologici e del puro caso), alcune delle quali avranno delle conseguenze e altre no 2 differenze Con Pavlov -> non c’è US senza la risposta -> il rinforzo o la punizione sono presentati solo se l’animale emette una certa risposta (a US non segue sempre CR) Con Thorndike -> la risposta non è guidata da motivazioni/obiettivi (stati mentali) ma è emessa all’inizio x puro caso e poi viene rinforzata 2 classi di eventi ambientali che modificano il comportamento Rinforzo (premi) -> aumenta la p che una certa risposta (contingente) venga emessa o Positivo -> viene dato uno stimolo appetibile/positivo (se lavori ti dò i soldi) o Negativo -> viene tolto uno stimolo avversivo (se prendo il farmaco mi passa il mal di testa) -> non va confuso con la punizione Punizione -> riduce la p che una certa risposta (contingente) venga emessa o Positiva-> viene dato uno stimolo avversivo/spiacevole (se ti comporti male ti picchio) o Negativa -> viene tolto uno stimolo appetibile (se ti comporti male non ti do da mangiare) Rinforzo Primario -> ha a che fare con bisogni primari Secondario -> sostanzialmente appresi con l’esperienza (non posso mangiare i soldi ma so che con i soldi posso comprarmi il cibo) Schemi di rafforzamento Come viene dato il rinforzo (quando e quanto premi e punizioni vengono somministrati) determina come il comportamento viene modificato Esistono 3 schemi di rinforzo Continuo -> ogni volta che l’animale emette la risposta che si vuole ottenere viene dato il premio -> è il più rapido a modificare il comportamento (a fare apprendere il comportamento voluto) ma non produce il mantenimento a lungo termine di quel comportamento -> si estingue molo in fretta se il rinforzo cessa
Ad intervallo -> il rinforzo viene dato dopo che un tempo fissato è passato dall’ultimo rinforzo (ma sempre appena l’animale ha emesso la risposta -> il rinforzo deve essere sempre contingente alla risposta) o Fisso -> tot minuti dopo l’intervallo, indipendentemente dal numero di risposte emesse tra i rinforzi -> L’animale tende ad aumentare la frequenza delle risposte in prossimità del rinforzo, per poi diminuirla o Variabile -> in media tot minuti dopo l’intervallo, sempre indipendentemente dal numero di risposte emesse tra i rinforzi -> L’animale non potendo prevedere quando avverrà il rinforzo continua ad emettere la risposta in modo frequente. Questo porterà l’animale ad emettere la risposta in modo abbastanza costante nel tempo A rapporto -> il rinforzo viene dato dopo un numero prefissato di risposte (conta il numero di risposte, non più il tempo passato dall’ultimo rinforzo) o Fisso -> dopo tot risposte -> efficace nel far apprendere velocemente un comportamento o Variabile -> in media dopo tot risposte -> è il più efficace di tutti perché c’è maggior incertezza su quando arriverà la ricompensa -> efficace nel mantenere un certo comportamento dando un numero limitato di rinforzi e soprattutto nell’evitare l’estinzione -> porta l’animale ad emettere spesso la risposta (lo porta a lavorare) -> impara che deve raggiungere un certo numero di risposte x ottenere la ricompensa (prima lo raggiunge, prima la otterrà) Skinner riteneva che attraverso il condizionamento operante e lo schema di rafforzamento appropriato fosse possibile ottenere qualsiasi tipo di comportamento Prende comportamenti tipicamente umani e riesce ad insegnarli agli animali -> dimostra che tutto il comportamento è controllato dall’ambiente (dagli schemi) -> anche il comportamento umano lo è -> cambiando l’ambiente cambio il comportamento -> x Skinner un delinquente può non esserlo più se gli cambio ambiente Estinzione dell’operante Analogamente a quando accade nel condizionamento classico, ed in linea con quanto ipotizzato da Thorndike (legge dell’effetto), se una risposta acquisita tramite una procedura di rafforzamento smette di essere rinforzata viene estinta -> se il mio comportamento è sostenuto dalle conseguenze del mio comportamento (ricompensa), quando non mi viene più data la ricompensa la relazione stimolo- risposta cade Ma l’estinzione è meno probabile per quei comportamenti che hanno ricevuto un rinforzo intermittente (schema a rapporto variabile) -> l’animale insiste ad emettere la risposta (anche quando è da un po’ che non viene rinforzata) perché ha imparato che ci possono volere molte risposte per ottenere la ricompensa Nb. nel paradigma del condizionamento operante CS si chiama stimolo discriminativo Condizionamento operante nell’uomo Ha un sistema nervoso più sofisticato ma è comunque soggetto agli stessi meccanismi -> il suo comportamento, come quello degli animali, è manipolabile da eventi esterni (rinforzi) Es. contratto di lavoro a cottimo -> più lavoro più mi pagano (rinforzo a rapporto fisso) -> illegale perché porta a sfruttamento del lavoratore Es. bambino che insiste x ottenere qualcosa -> la cosa più sbagliata che un genitore può fare e aspettare e cedere (il bambino impara che basta insistere -> schema a rapporto variabile), meglio cedere subito o non cedere mai Es. slot machines, gratta e vinci -> si innesca un meccanismo che mi porta a continuare a giocare perché so che prima o poi otterrò una ricompensa (schema a rapporto variabile), non mi importa che globalmente sto perdendo del denaro
o Induce comportamenti superstiziosi o Rende immuni alle evidenze negative -> ci diamo molto meno peso -> bias di valutazione (bias di conferma): fenomeno cognitivo umano x cui dò più peso alle info che confermano le mie convinzioni che a quelle che le mettono in discussione Il bias di conferma e l’effetto Forer La credenza nell’astrologia, nella cartomanzia e nei profili di personalità nasce dalla combinazione di o Schema a rapporto variabile o Bias di conferma Forer (1948) fa eseguire agli studenti un test di personalità e chiede di valutare su una scala da 1 a 5 quanto l’analisi del carattere sia accurata (quanto ognuno si riconosce nella descrizione ricevuta). Il risultato medio è 4,26 (alta accuratezza) ma in realtà Forer ha dato a tutti la stessa descrizione, basata su affermazioni generiche nelle quali tutti potevano facilmente riconoscersi -> dimostra che la credenza umana aumenta se vengono descritti aspetti positivi rispetto a negativi Quindi secondo Skinner o Il comportamento è tutto appreso => può essere controllato e modificato o Qualsiasi comportamento anche complesso può essere costruito, passo dopo passo, attraverso il rinforzo (shaping) o Noi siamo quello che facciamo ma siccome quello che facciamo può essere cambiato da un appropriato schema di rinforzo anche quello che siamo può essere cambiato o L’ambiente (schemi di rinforzo) è tutto -> cambiando l’ambiente cambierò l’individuo o Con la corretta ingegneria del comportamento posso ottenere un mondo migliore e esseri umani migliori Visione diversa da Skinner = pensare che il comportamento sia determinato da cause interne -> x Skinner è solo una spiegazione che ci diamo Es. guardo il comportamento e associo un’etichetta, poi uso l’etichetta x descrivere il comportamento -
tautologia -> la spiegazione del comportamento non è l’etichetta, è lo schema di rinforzo Il ruolo dell’ambiente come storia di rinforzo personale Skinner ha dimostrato che la storia di rinforzo di un organismo determina come si comporterà quell’organismo davanti ad un certo stimolo o ambiente -> storie di rinforzo diverse determinano comportamenti diversi (non sono motivazioni diverse a determinarli) Es. la bambina “volenterosa” che fa i compiti e il bambino “pigro” che non li fa-> la bambina li fa perché all’inizio della sua storia scolastica ha ricevuto rinforzi positivi quando li faceva Es. il ratto “pigro” (condizionato con schema a rapporto fisso) e il ratto “motivato” (condizionato con schema a rapporto variabile) -> se messi in una nuova situazione il primo estinguerà la sua risposta prima che possa arrivare il rinforzo, il secondo continuerà a produrla abbastanza a lungo Variante del comportamentismo di Skinner =
2 esperimenti
Abilità di riproduzione motoria: è importante avere le abilità motorie adeguate -> guardare un campione di uno sport non determina automaticamente il saper compiere gli stessi gesti atletici, anche se si sa come si dovrebbe fare Rinforzo: le risposte rinforzate positivamente saranno apprese meglio (sia che il genitore premi il bambino x il suo comportamento aggressivo, sia che si arrabbi con lui -> il bambino vedrà ancora violenza e ciò rinforzerà il suo comportamento) Status del modello: più importante x noi è il modello (più è vicino a noi, es. genitore x i bambini), più facile sarà l’apprendimento (più lo imiteremo) L’ apprendimento per imitazione è un meccanismo importante attraverso il quale vengono trasmessi importanti aspetti della cultura che non sono facilmente verbalizzabili Richiede un sistema cognitivo che sia altamente flessibile e in grado di imparare dalle azioni degli altri ma anche alcuni animali sanno farlo Nb. conformismo: magari non a parole ma nei fatti tendiamo a conformarci agli altri (l’effetto del contesto nel quale viviamo è molto importante -> se tutti pensano una cosa e noi siamo gli unici a pensarla diversamente, tendiamo a pensare di essere noi ad aver sbagliato, anche perché cerchiamo sempre l’approvazione degli altri) Nb. problema natura-cultura -> interazione tra quello che siamo (geni) e l’ambiente in cui viviamo -> è questa interazione che determina ogni nostro comportamento Apprendimento: conclusioni Il cervello umano è un sistema altamente complesso con un’elevata capacità di generalizzazione E’ improbabile che esista un solo modo di apprendere (oltre a quelli spiegati anche l’imprinting = meccanismo di individuazione della figura importante, che viene seguita es. pulcini appena nati e l’apprendimento percettivo)