big data e algoritmi | Dispense di Linguistica

4. Algoritmi, intelligenza artificiale,

pattern recognition

L’obiettivo più promettente dell’intelligenza artificiale è la data science, che si occupa non solo di

spiegare i dati ma anche di creare algoritmi capaci di prevedere come quei dati cambieranno, a

prescindere dalle loro capacità di spiegazione. Cambia, quindi, il modo di cercare collegamenti utili

nei dati: rispetto alla statistica tradizionale, che punta soprattutto a spiegare i fenomeni, qui

l’attenzione è rivolta soprattutto alla capacità di fare previsioni accurate.

I dati vengono analizzati attraverso algoritmi di machine learning, dei quali particolarmente di

successo è il deep learning: metodo che individua schemi e modelli generalizzati, usati per prevedere

il futuro comportamento delle serie analizzate. Ad esempio, gli algoritmi per diagnosi medica

analizzano i dati di pazienti con una determinata patologia, ricercando caratteristiche ricorrenti che

permettano di prevedere l’evento e attuare cure preventive.

La data science utilizza il metodo delle correlazioni, cioè cerca legami tra diverse serie di dati.

Tuttavia, queste correlazioni non devono essere considerate veri rapporti di causa-effetto: indicano

semplicemente che due fenomeni sono collegati, soprattutto quando il legame supera una certa soglia

di intensità. Per raccogliere informazioni digitali e creare algoritmi in grado di fare previsioni, si parte

dall’idea che ciò che è accaduto in passato possa continuare a verificarsi anche in futuro. In questo

senso, le previsioni basate sui dati presuppongono che il futuro seguirà schemi simili a quelli già

osservati nel passato.

In questo contesto si usa spesso il pattern recognition, cioè un sistema che analizza i comportamenti

umani cercando regolarità e schemi che potrebbero ripetersi nel tempo. Questi meccanismi non si

limitano a descrivere il comportamento delle persone, ma tendono anche a influenzarlo, orientando le

scelte sulla base delle preferenze individuate dai dati. Tuttavia, le previsioni probabilistiche possono

risultare poco affidabili quando si conoscono solo in parte le situazioni analizzate, e in alcuni casi

possono persino produrre risultati discriminatori. Per questo motivo, uno dei temi più discussi della

rivoluzione informatica riguarda il rapporto tra decisioni, macchine e intelligenza artificiale. Con il

tempo, infatti, le macchine stanno assumendo un ruolo sempre più importante nei processi decisionali,

rendendo difficile controllare e comprendere le motivazioni delle loro scelte. Oggi è quindi aperto un

ampio dibattito sull’etica dell’intelligenza artificiale e sul grado di autonomia che questi sistemi

dovrebbero avere nelle decisioni e nelle questioni morali.

Gli algoritmi sono alla base della programmazione del computer, definizione sviluppata nella seconda

metà degli anni Sessanta da Donald Knuth, autore dell’opera The Art of Computer Programming,

nella quale descrive la storia della programmazione informatica. Tuttavia, le origini dell’algoritmo

precedono di molto la nascita del computer: intorno all’820 il matematico Al-Khwarizmi scrisse un

testo in cui sistematizzava le conoscenze matematiche della tradizione indiana, araba ed ellenistica,

introducendo nella cultura latina la numerazione araba e l’algebra, senza le quali sarebbe stato molto

difficile svolgere calcoli complessi con il sistema dei numeri romani. Secondo Knuth, la

programmazione affonda quindi le proprie radici nella storia dell’algoritmo, motivo per cui

quest’ultimo non richiede necessariamente l’esistenza di un computer. Sebbene l’algoritmo costituisca

il fondamento della programmazione, infatti, esso non riguarda esclusivamente i processi meccanici o

informatici, poiché può funzionare indipendentemente da una macchina. Gli algoritmi possono essere

definiti come “metodi per la risoluzione dei problemi”, nei quali il metodo deve essere esplicito e i

vari passaggi devono essere descritti in maniera precisa, così da ottenere un determinato risultato a

Anteprima parziale del testo

Scarica big data e algoritmi e più Dispense in PDF di Linguistica solo su Docsity!

4. Algoritmi, intelligenza artificiale,

pattern recognition

L’obiettivo più promettente dell’intelligenza artificiale è la data science , che si occupa non solo di spiegare i dati ma anche di creare algoritmi capaci di prevedere come quei dati cambieranno, a prescindere dalle loro capacità di spiegazione. Cambia, quindi, il modo di cercare collegamenti utili nei dati: rispetto alla statistica tradizionale, che punta soprattutto a spiegare i fenomeni, qui l’attenzione è rivolta soprattutto alla capacità di fare previsioni accurate. I dati vengono analizzati attraverso algoritmi di machine learning , dei quali particolarmente di successo è il deep learning : metodo che individua schemi e modelli generalizzati, usati per prevedere il futuro comportamento delle serie analizzate. Ad esempio, gli algoritmi per diagnosi medica analizzano i dati di pazienti con una determinata patologia, ricercando caratteristiche ricorrenti che permettano di prevedere l’evento e attuare cure preventive. La data science utilizza il metodo delle correlazioni , cioè cerca legami tra diverse serie di dati. Tuttavia, queste correlazioni non devono essere considerate veri rapporti di causa-effetto: indicano semplicemente che due fenomeni sono collegati, soprattutto quando il legame supera una certa soglia di intensità. Per raccogliere informazioni digitali e creare algoritmi in grado di fare previsioni, si parte dall’idea che ciò che è accaduto in passato possa continuare a verificarsi anche in futuro. In questo senso, le previsioni basate sui dati presuppongono che il futuro seguirà schemi simili a quelli già osservati nel passato. In questo contesto si usa spesso il pattern recognition , cioè un sistema che analizza i comportamenti umani cercando regolarità e schemi che potrebbero ripetersi nel tempo. Questi meccanismi non si limitano a descrivere il comportamento delle persone, ma tendono anche a influenzarlo, orientando le scelte sulla base delle preferenze individuate dai dati. Tuttavia, le previsioni probabilistiche possono risultare poco affidabili quando si conoscono solo in parte le situazioni analizzate, e in alcuni casi possono persino produrre risultati discriminatori. Per questo motivo, uno dei temi più discussi della rivoluzione informatica riguarda il rapporto tra decisioni, macchine e intelligenza artificiale. Con il tempo, infatti, le macchine stanno assumendo un ruolo sempre più importante nei processi decisionali, rendendo difficile controllare e comprendere le motivazioni delle loro scelte. Oggi è quindi aperto un ampio dibattito sull’etica dell’intelligenza artificiale e sul grado di autonomia che questi sistemi dovrebbero avere nelle decisioni e nelle questioni morali. Gli algoritmi sono alla base della programmazione del computer, definizione sviluppata nella seconda metà degli anni Sessanta da Donald Knuth , autore dell’opera The Art of Computer Programming , nella quale descrive la storia della programmazione informatica. Tuttavia, le origini dell’algoritmo precedono di molto la nascita del computer: intorno all’820 il matematico Al-Khwarizmi scrisse un testo in cui sistematizzava le conoscenze matematiche della tradizione indiana, araba ed ellenistica, introducendo nella cultura latina la numerazione araba e l’algebra, senza le quali sarebbe stato molto difficile svolgere calcoli complessi con il sistema dei numeri romani. Secondo Knuth, la programmazione affonda quindi le proprie radici nella storia dell’algoritmo, motivo per cui quest’ultimo non richiede necessariamente l’esistenza di un computer. Sebbene l’algoritmo costituisca il fondamento della programmazione, infatti, esso non riguarda esclusivamente i processi meccanici o informatici, poiché può funzionare indipendentemente da una macchina. Gli algoritmi possono essere definiti come “ metodi per la risoluzione dei problemi ”, nei quali il metodo deve essere esplicito e i vari passaggi devono essere descritti in maniera precisa, così da ottenere un determinato risultato a

partire dai dati in ingresso. In altre parole, è necessario individuare una serie di istruzioni che permettano di produrre un output partendo da un input. Per poter essere considerato un algoritmo, un metodo deve possedere alcune proprietà fondamentali: le istruzioni devono essere in numero finito, il processo deve svolgersi attraverso un numero finito di passaggi, deve essere sempre chiaro quale istruzione si stia eseguendo e deve essere evidente quando la procedura è terminata e il risultato è stato ottenuto. Per questo motivo gli algoritmi vengono definiti “ metodi effettivi ”, poiché la loro esecuzione non richiede creatività, ma soltanto l’applicazione rigorosa delle istruzioni previste; proprio per tale ragione anche una macchina può eseguirli. In questo contesto assume grande importanza la macchina di Alan Turing , una macchina astratta e mai realmente costruita, progettata per concettualizzare il funzionamento dell’algoritmo, nozione che, pur essendo informale, risulta sufficientemente definita da permettere di riconoscere un procedimento algoritmico. L’algoritmo rappresenta quindi una procedura di formalizzazione del calcolo e rende possibile sostituire il calcolatore umano con un calcolatore automatico, almeno sul piano teorico elaborato da Turing. Tuttavia, bisogna considerare che non tutto può essere calcolato: per questo non è possibile stabilire istruzioni precise per ogni situazione. A volte, anche quando un algoritmo può essere scritto, trovare la soluzione richiesta o eseguire il programma può richiedere troppo tempo per essere davvero utile. Gli algoritmi, infatti, non sono semplici strumenti tecnici composti da istruzioni per risolvere un problema. Sono sistemi complessi, perché conta anche il modo in cui queste istruzioni interagiscono con il contesto in cui vengono applicate. Si trovano quindi a metà tra il mondo computazionale e quello culturale, cercando un equilibrio tra modelli matematici e aspetti pratici della realtà, così da ridurre la distanza tra codice e cultura. Per questo gli algoritmi non coincidono solo con il codice che li compone: includono anche le regole implicite su cui si basano, i processi che mettono in moto e le decisioni o conclusioni a cui portano. Nel suo testo sulla storia della scienza algoritmica, Paolo Zellini parla di una vera e propria “ dittatura ” dell’algoritmo sulla conoscenza e sulla vita delle persone. Analizzando il calcolo algoritmico, usato già nella matematica antica per risolvere problemi pratici, lo considera sia una grande risorsa sia un possibile rischio per il sapere. Zellini si interroga soprattutto su ciò che può essere automatizzato e ciò che invece non può esserlo. A questa questione sembra rispondere la riflessione di Novalis , secondo cui l’uomo, per pigrizia, desidera “ puro meccanismo o pura magia ”, evitando di usare in modo attivo la propria immaginazione. L’algoritmo, in un certo senso, promette entrambe queste cose. Dalla fine dell’Ottocento, il concetto di algoritmo viene collegato ai problemi dell’infinito e, successivamente, assume un ruolo centrale nella logica matematica, soprattutto nel problema della decisione formulato da David Hilbert. Sarà poi Alan Turing a fornire una definizione moderna di algoritmo, descrivendolo come una macchina capace di eseguire una procedura di calcolo attraverso un numero finito di passaggi e istruzioni precise. La macchina di Turing formalizza l’idea di calcolabilità effettiva , cioè la possibilità di ottenere un risultato tramite un procedimento meccanico. Tuttavia, Turing dimostra anche che esistono problemi e numeri che una macchina non può calcolare. Paradossalmente, proprio questa teoria aprirà la strada alla nascita del computer moderno. Secondo Zellini, la teoria algoritmica abbandona gradualmente i problemi più astratti per concentrarsi sui calcoli concreti, diventando la base dell’informatica. Nelle scienze applicate, però, riemerge il problema dell’incertezza: non basta che un algoritmo produca un risultato, deve anche essere efficiente. Un algoritmo è considerato valido se trova una soluzione in tempi ragionevoli, utilizza una quantità limitata di memoria e mantiene basso il margine di errore, risultando quindi sufficientemente affidabile. Nel calcolo algoritmico emerge, inoltre, il problema del rapporto tra il finito e il “finito molto grande”: quando i dati diventano enormi e le procedure troppo complesse, diventa impossibile controllare completamente gli errori. Delegando le decisioni alle

riconoscimento del linguaggio, la visione artificiale e la previsione dei comportamenti, specialmente quando si lavora con dati non strutturati. Alcuni di questi sistemi vengono definiti “scatole nere” ( black box ), perché non spiegano chiaramente il motivo delle decisioni che prendono. Nonostante ciò, risultano molto efficaci in situazioni complesse, nelle quali non è possibile descrivere con precisione né il problema né l’obiettivo. Questo aspetto apre importanti questioni etiche e politiche , soprattutto riguardo ai contesti in cui tali tecnologie dovrebbero essere utilizzate. Secondo il documento dell’Unione Europea, i sistemi di intelligenza artificiale sono programmi progettati dall’uomo che, per raggiungere un obiettivo complesso, raccolgono dati dall’ambiente, li interpretano, elaborano informazioni e decidono quali azioni compiere. Possono funzionare tramite regole simboliche oppure apprendendo modelli matematici dai dati, adattandosi anche in base agli effetti delle loro azioni precedenti. Il documento individua inoltre tre fasi principali del funzionamento dell’AI:

rappresentazione dell’ambiente;
comprensione tramite ragionamento o apprendimento;
intervento per raggiungere l’obiettivo. Per questo motivo, l’uso dell’intelligenza artificiale deve garantire chiarezza sugli obiettivi e sulle modalità di intervento, soprattutto quando le decisioni influenzano aspetti sociali, politici o giuridici e possono incidere sui diritti umani e sulla giustizia. La task force europea sull’AI cerca quindi di definire principi etici per regolamentare questi sistemi. I rischi principali riguardano proprio i metodi di conoscenza basati sugli algoritmi e sull’apprendimento automatico, che sono meno controllabili e più esposti a fenomeni di discriminazione , pregiudizio e disuguaglianza. L’espressione machine learning indica l’insieme delle tecniche di apprendimento automatico utilizzate dall’intelligenza artificiale. Il suo obiettivo è individuare dei pattern , cioè modelli e regolarità presenti nei dati, utili per comprendere i fenomeni e fare previsioni sul futuro. Il processo attraverso cui si riconoscono queste regolarità prende il nome di pattern recognition. Il riconoscimento dei pattern è reso ancora più complesso dalla difficoltà di misurare certi attributi, soprattutto quando riguardano aspetti qualitativi o soggettivi, come ad esempio la somiglianza tra persone. Per interpretare questi fenomeni è quindi necessario costruire dei modelli , cioè rappresentazioni semplificate della realtà che permettono di individuare le caratteristiche considerate più rilevanti. Anche i dati, però, non sono completamente oggettivi. La loro organizzazione e interpretazione dipendono dalle scelte dei programmatori, che decidono come normalizzarli e quali parametri considerare importanti per individuare le regolarità. Per questo motivo, il machine learning presenta anche un importante problema epistemologico , legato al modo in cui la conoscenza viene costruita e interpretata. Il machine learning funziona in modi diversi a seconda del tipo di apprendimento utilizzato. Gli algoritmi vengono generalmente distinti in: ● apprendimento supervisionato; ● apprendimento non supervisionato. Nell’ apprendimento supervisionato , il programma cerca correlazioni già conosciute dai programmatori. Per addestrare la macchina si utilizzano dei dati di addestramento , che permettono all’algoritmo di riconoscere un determinato attributo chiamato target , cioè il risultato che si vuole ottenere. Per esempio, nel riconoscimento delle e-mail spam, il sistema deve imparare a collegare alcune caratteristiche delle e-mail al target “spam”. L’algoritmo apprende quindi dai dati forniti dal campione iniziale: se questi dati contengono errori o pregiudizi, anche il sistema li erediterà. Quando i

dati sono molto complessi, inoltre, è impossibile analizzare tutte le possibili correlazioni. Per questo l’algoritmo viene guidato attraverso un learning bias , cioè una preferenza verso determinati dati o relazioni considerate più importanti. In questo processo il ruolo del programmatore è fondamentale, perché sceglie quali correlazioni privilegiare, compiendo decisioni che non sono mai completamente neutrali. Nell’ apprendimento non supervisionato , invece, non esiste un target definito in partenza. L’algoritmo analizza autonomamente i dati cercando correlazioni e regolarità che possano risultare significative. Questo metodo viene utilizzato soprattutto nell’ analisi dei cluster , cioè nel raggruppamento di elementi simili tra loro in base ad alcune caratteristiche comuni. Per classificare i dati è necessario stabilire dei criteri di somiglianza e costruire delle metriche , capaci di trasformare anche aspetti qualitativi in valori misurabili. Anche in questo caso il programmatore deve scegliere quali caratteristiche considerare più rilevanti, introducendo inevitabilmente elementi di soggettività nell’interpretazione dei dati. Sia nell’apprendimento supervisionato sia in quello non supervisionato, lo scopo finale degli algoritmi di machine learning è riuscire a prevedere nuovi dati e situazioni diverse da quelle usate durante l’addestramento. Le correlazioni , pur non essendo rapporti di causalità, vengono quindi utilizzate per attribuire significato ai dati. Questo meccanismo, però, presenta dei rischi, perché alcune correlazioni possono essere spurie , cioè apparire significative senza avere un reale legame con i fenomeni osservati. Nonostante ciò, esse rimangono uno degli strumenti fondamentali del pattern recognition e del funzionamento dell’intelligenza artificiale. L’intelligenza artificiale comprende molte aree diverse. Una delle più tradizionali è quella basata sulla rappresentazione della conoscenza , a cui fa riferimento anche la definizione dell’Unione Europea. In questo approccio, le informazioni devono essere organizzate e strutturate fin dall’inizio, insieme alle regole necessarie per elaborarle. Lo scopo è ricavare nuove conclusioni a partire da conoscenze già note. L’area che oggi ottiene i risultati più avanzati è però il deep learning , perché permette di analizzare anche relazioni molto complesse tra i dati. I sistemi tradizionali di machine learning , infatti, riescono soprattutto a riconoscere correlazioni lineari , cioè relazioni dirette tra i dati di input e il risultato finale. Quando invece le relazioni sono più complesse e non lineari, è necessario utilizzare reti neurali composte da più livelli: queste strutture costituiscono il deep learning. Nel deep learning, ogni neurone artificiale può attivarsi con intensità diverse in base all’importanza degli input ricevuti. Ogni collegamento tra neuroni possiede infatti un peso , cioè un valore che determina quanto quell’informazione sia rilevante. Quando il livello di attivazione supera una certa soglia, il neurone trasmette il segnale agli altri elementi della rete tramite una funzione di attivazione. Il termine “neurone” deriva dal fatto che queste strutture imitano in modo semplificato il funzionamento dei neuroni biologici del cervello umano. Le connessioni tra neuroni artificiali sono dirette e i loro pesi vengono stabiliti e modificati durante il processo di apprendimento. Per addestrare una rete neurale con più strati è necessario regolare continuamente questi pesi, cercando di ridurre gli errori della rete. Nei neuroni di output il controllo dell’errore è relativamente semplice, perché basta confrontare il risultato ottenuto con quello desiderato. Nei livelli più profondi della rete, però, il processo è più complesso e viene utilizzato un metodo chiamato back propagation o retro- propagazione. La back propagation è un algoritmo supervisionato che modifica i pesi dei neuroni in base alla differenza tra il risultato ottenuto e il target desiderato. Questo sistema permette alla rete non solo di memorizzare informazioni, ma anche di apprendere regole più generali e adattarsi a situazioni nuove rispetto a quelle viste durante l’addestramento. Tuttavia, più gli strati della rete diventano profondi, più è difficile comprendere in che modo ciascun neurone contribuisca al risultato finale. Per questo

● i risultati possono essere fragili, perché piccole modifiche nei dati possono produrre errori significativi. Per esempio, una minima variazione in un’immagine può impedire il corretto riconoscimento di un volto oppure alterare la comprensione del linguaggio. Per questi motivi, il deep learning non garantisce sempre affidabilità assoluta nella soluzione dei problemi e viene criticato perché incapace di costruire una vera conoscenza autonoma. Da qui nasce il dibattito tra i cognitivisti , che privilegiano modelli simbolici e razionali, e i sostenitori delle reti neurali , che puntano sull’apprendimento dai dati. Alcuni studiosi propongono una posizione intermedia, sostenendo la necessità di sistemi ibridi , capaci di unire le caratteristiche dei due approcci. In questo contesto, Stuart Russell introduce il concetto di inverse reinforcement learning , un metodo in cui la macchina cerca di comprendere gli interessi e gli obiettivi umani osservandone i comportamenti. Successivamente propone anche il cooperative inverse reinforcement learning , secondo cui gli algoritmi dovrebbero riconoscere i propri limiti e chiedere conferma agli esseri umani prima di prendere decisioni importanti. Questa idea mette in discussione la possibilità di affidare completamente le decisioni alle macchine e sottolinea il ruolo centrale della soggettività umana nei processi decisionali. Allo stesso tempo, rende più evidente la responsabilità degli esseri umani nell’orientare il comportamento degli algoritmi. Di conseguenza, chi partecipa all’addestramento delle macchine ha un ruolo fondamentale nel definirne il funzionamento. Anche le persone che classificano e organizzano i set di addestramento contribuiscono, spesso inconsapevolmente, alla costruzione dell’intelligenza artificiale, trasferendo nei sistemi la propria capacità di interpretare e ordinare la realtà. Rimane quindi aperto il dibattito sulle pratiche di raccolta ed estrazione dei dati, sulla correttezza delle generalizzazioni prodotte dagli algoritmi e sulla legittimità dell’utilizzo dei dati personali e dei processi di classificazione automatica. Negli ultimi anni, molte istituzioni politiche internazionali hanno pubblicato report sull’intelligenza artificiale, concentrandosi soprattutto sulle sue possibilità di innovazione e sui suoi effetti sociali e politici. Le istituzioni dell’Unione Europea cercano di presentare l’AI come un tema non solo tecnologico, ma anche pubblico e politico. Sia i singoli Stati europei sia l’UE investono infatti nello sviluppo dell’intelligenza artificiale per acquisire maggiore autonomia rispetto a Stati Uniti e Cina. Pur essendo meno avanzata dal punto di vista tecnologico, l’Europa punta soprattutto sul proprio ruolo di regolatrice della scienza e della tecnologia, cercando di limitare i rischi e definire responsabilità, vantaggi e limiti dell’AI. La forza dell’approccio europeo sta nella consapevolezza che la tecnologia influenzi la società tanto quanto il diritto e le istituzioni politiche. Per questo motivo, secondo l’UE, solo un equilibrio tra innovazione tecnologica e tutela dei valori democratici può produrre benefici per tutta la collettività e non solo per pochi soggetti economici. L’Unione Europea affronta il tema anche attraverso la regolamentazione dell’intelligenza artificiale, definendo principi etici e norme nel Libro Bianco sull’intelligenza artificiale , considerato importante quanto gli investimenti economici destinati all’AI. L’approccio degli Stati Uniti è invece molto diverso, soprattutto per quanto riguarda il controllo dei rischi e la regolamentazione. Negli USA il dibattito etico sull’intelligenza artificiale è stato portato avanti soprattutto da aziende private, associazioni scientifiche e gruppi di ingegneri. In questo contesto fu scritta anche una lettera aperta che chiedeva maggiori investimenti nella sicurezza dell’AI, firmata tra gli altri da Stephen Hawking. In Europa , invece, il tema viene affrontato maggiormente dal punto di vista dell’interesse pubblico e collettivo, e non soltanto secondo le logiche delle imprese private. Nel frattempo, la Cina considera l’intelligenza artificiale un settore strategico sia dal punto di vista economico e produttivo sia per il controllo sociale e la sorveglianza. Durante la pandemia da COVID-19, ad esempio, le tecnologie digitali sono state utilizzate ampiamente per monitorare la

popolazione. L’approccio cinese è quindi orientato soprattutto allo sviluppo di strumenti di controllo, sorveglianza e digitalizzazione, con minore attenzione ai diritti individuali. Il problema etico dell’intelligenza artificiale nasce anche dal fatto che il concetto stesso di intelligenza è difficile da definire in modo preciso. Questo rende complessa la discussione sull’ accountability , termine che indica non solo la responsabilità, ma anche la trasparenza e la capacità di spiegare e giustificare le decisioni prese da un sistema. La questione diventa particolarmente importante quando l’AI viene applicata in ambiti politici, sociali o amministrativi. Il rischio, infatti, è affidare decisioni fondamentali a sistemi apparentemente più efficienti ma incapaci di spiegare le ragioni delle loro scelte. In questo modo, la definizione delle decisioni potrebbe passare dalla politica a una sorta di burocrazia tecnologica , nella quale nessuno si assume realmente la responsabilità delle conseguenze. I report europei, pur con alcune differenze, condividono diversi obiettivi comuni. In particolare sottolineano: ● il problema della responsabilità politica nelle decisioni prese in settori delicati come giustizia, finanza, difesa e politica, dove il giudizio umano non dovrebbe essere sostituito completamente dalle macchine; ● la necessità di ridefinire il rapporto tra lavoro , formazione e automazione, dato che molte attività possono essere svolte dai sistemi artificiali. Secondo questa prospettiva, le attività che richiedono empatia , creatività , spirito critico e capacità relazionali continueranno a essere soprattutto umane. Per questo motivo, nella formazione futura sarà importante valorizzare maggiormente queste competenze, oltre alle semplici abilità tecnologiche. Negli Stati Uniti, invece, il dibattito coinvolge soprattutto organizzazioni tecniche e professionali, come l’Institute of Electrical and Electronics Engineers ( IEEE ). Questa organizzazione ha promosso iniziative per definire standard etici e tecnici per i sistemi di intelligenza artificiale, pubblicando documenti dedicati allo sviluppo di sistemi di AI “eticamente allineati”. L’obiettivo principale è individuare regole e standard capaci di garantire che i sistemi di intelligenza artificiale rispettino i principi etici, giuridici e sociali condivisi. Anche nei principali convegni internazionali dedicati all’intelligenza artificiale, come il Neural Information Processing Systems Conference ( NeurIPS ), l’attenzione si è progressivamente spostata verso la valutazione etica dei sistemi sviluppati nella ricerca. Oggi, infatti, i ricercatori non si limitano più a presentare i risultati tecnici dei loro progetti, ma sono invitati anche a riflettere sui possibili effetti negativi che tali tecnologie potrebbero avere sulle persone e sulla società. Per questo motivo, nei lavori scientifici viene spesso richiesta una sezione dedicata ai rischi e ai potenziali danni dei sistemi di intelligenza artificiale. In questo contesto, i ricercatori che lavorano nelle grandi aziende tecnologiche assumono un ruolo molto importante, perché le loro scelte possono influenzare non solo lo sviluppo tecnico dei sistemi, ma anche gli interessi economici e le valutazioni etiche che guidano tali tecnologie. Nel report del Gruppo di esperti ad alto livello sull’intelligenza artificiale dell’Unione Europea, dedicato a un’ AI affidabile , vengono individuati alcuni principi fondamentali: ● il rispetto dell’ autonomia umana ; ● la prevenzione dei danni ; ● l’ equità ; ● la trasparenza e la spiegabilità dei sistemi decisionali.

valutazione delle prestazioni lavorative: se si considerano solo i risultati misurabili, si può finire per premiare comportamenti che migliorano i numeri ma non la qualità reale del lavoro, e quando gli algoritmi vengono integrati in questi processi di valutazione, la situazione si complica ulteriormente. Quindi, per poter essere elaborati da un sistema automatico, i dati devono essere standardizzati e trasformati in variabili numeriche. Questo implica una selezione preventiva delle caratteristiche ritenute rilevanti, che dipende dalle scelte dei progettisti. Di conseguenza, le classificazioni prodotte dagli algoritmi non sono semplici descrizioni della realtà, ma costruzioni che riflettono determinate visioni e interessi. Come sottolineano Bowker e Star , la classificazione è una pratica inevitabile, perché gli esseri umani hanno bisogno di organizzare il mondo per comprenderlo. Tuttavia, ogni sistema di classificazione impone una struttura che non è neutrale, ma deriva da decisioni culturali, sociali e politiche. Questo vale anche per gli algoritmi, che incorporano nei loro modelli le scelte e i valori di chi li progetta, e quando tali sistemi vengono applicati alle persone, il rischio è quello di ridurre la complessità individuale a categorie semplificate, basate su criteri che non sempre sono giustificati o trasparenti. Un caso particolarmente rilevante è quello degli algoritmi di profilazione , che suddividono gli individui in gruppi sulla base di caratteristiche comuni. Questo processo, noto come clusterizzazione , permette di individuare regolarità nei comportamenti, ma comporta anche una perdita di informazioni. Le persone vengono infatti associate a un gruppo in base a determinate somiglianze, mentre tutte le altre caratteristiche vengono ignorate. Di conseguenza, le previsioni basate su questi modelli possono risultare inaccurate o addirittura discriminatorie, perché attribuiscono agli individui proprietà che derivano dal gruppo di appartenenza piuttosto che dalla loro specifica identità. Tuttavia, questo processo di profilazione non è affatto neutrale né completamente automatizzato: al contrario, dipende in larga misura dalle scelte di chi progetta il sistema. In ogni progetto di data science, infatti, una delle difficoltà maggiori consiste proprio nel decidere quali attributi includere e quali escludere per ottenere risultati ritenuti efficaci. La selezione delle caratteristiche è quindi un passaggio cruciale, perché stabilisce i criteri attraverso cui i dati verranno organizzati e interpretati. In questo senso, anche i processi più automatizzati si fondano su decisioni umane preliminari, che determinano il modo in cui la categorizzazione viene costruita. Queste considerazioni si intrecciano con il tema della responsabilità algoritmica , affrontato anche in un report del Consiglio d’Europa che analizza l’impatto delle tecnologie di intelligenza artificiale sui diritti umani e sulle libertà fondamentali. Quando si utilizzano algoritmi per prevedere o orientare decisioni che riguardano le persone, diventa inevitabile interrogarsi sui valori che tali sistemi incorporano. Il report mette in luce diversi rischi:

da un lato, la possibilità che la profilazione e la previsione dei comportamenti, basate sul riconoscimento di pattern, minaccino la riservatezza e i diritti individuali;
dall’altro, il pericolo di una progressiva perdita delle relazioni umane e di una sorta di privatizzazione nascosta delle decisioni pubbliche, soprattutto in ambiti legati alla giustizia distributiva o all’organizzazione del lavoro.
A questo si aggiunge una forte asimmetria tra chi sviluppa le tecnologie e chi le utilizza: i primi possono trarre vantaggio dai dati raccolti sugli utenti, mentre questi ultimi spesso non sono consapevoli di come tali dati vengano sfruttati.
Rimane inoltre aperta la questione della responsabilità per le conseguenze negative dei sistemi tecnologici, poiché i progettisti tendono a sottrarsi al controllo diretto sugli effetti delle decisioni automatizzate.

In questo contesto si inserisce anche la pratica, sempre più diffusa, delle aziende di istituire comitati etici interni, con l’obiettivo di autoregolarsi. Tuttavia, queste iniziative risultano spesso controverse. Un caso emblematico è quello del comitato etico sull’intelligenza artificiale creato da Google nel 2019, che fu rapidamente sciolto dopo forti critiche e proteste interne. Episodi come questo contribuiscono a far emergere il fenomeno dell’“ ethics washing ”, particolarmente diffuso nelle aziende della Silicon Valley. Con questa espressione si indica la tendenza a promuovere un’immagine eticamente responsabile senza però modificare in modo sostanziale le pratiche aziendali. L’etica, in questi casi, viene trattata come qualcosa da aggiungere a posteriori, come una procedura o un insieme di linee guida, anziché come un principio attorno a cui progettare i sistemi fin dall’inizio. Questo approccio si lega spesso al cosiddetto soluzionismo tecnologico , ovvero alla convinzione che ogni problema possa essere risolto attraverso tecnologie sempre più avanzate, e a una forte fiducia nel mercato come spazio in cui tutto è permesso. In questa prospettiva, il rischio è quello di considerare l’etica come un ostacolo da gestire piuttosto che come una dimensione fondamentale della progettazione. Inoltre, si diffonde l’idea che possa esistere un metodo oggettivo e neutrale per programmare sistemi capaci di garantire equità e assenza di discriminazione, quando in realtà ogni scelta tecnica implica una visione del mondo. Se l’etica viene assorbita da queste logiche, finisce per perdere la sua funzione critica e non è più in grado di offrire reali garanzie alla collettività. Per questo motivo, alcuni studiosi come Elettra Bietti, sottolineano l’importanza di distinguere un uso autentico dell’etica e lo sfruttamento di questa per altri scopi. L’etica può ancora rappresentare uno spazio di confronto e di costruzione di valori condivisi, ma solo se accompagnata da una riflessione capace di chiarire le diverse posizioni, negoziare i conflitti e valutare le conseguenze delle tecnologie. Tale situazione è riassunta dall’articolo di Floridi sui principi che dovrebbero essere base dell’uso responsabile ed etico dei sistemi, identificati in report europei e americani, cercando linee comuni e sintetizzando diverse posizioni per trovare una visione unica. Tuttavia, tradurre questi principi in pratiche concrete si rivela particolarmente complesso, anche perché le grandi aziende tecnologiche della Silicon Valley stanno assumendo un ruolo sempre più rilevante nella gestione di servizi pubblici, come la mobilità, la sanità o L’educazione. Questo scenario solleva ulteriori questioni legate alla gestione dei dati, alla loro accessibilità e alla necessità di garantire interoperabilità tra sistemi diversi, soprattutto quando i dati dei cittadini sono trattati da aziende private. In un contesto in cui non è ancora chiaro come si distribuirà il potere a livello globale nel campo tecnologico, emerge con forza l’esigenza di un intervento da parte delle istituzioni politiche e della società civile. Anche il Libro Bianco sull’intelligenza artificiale della Commissione europea si concentra su questi aspetti, evidenziando la necessità di regolamentare le applicazioni considerate ad alto rischio. In alcuni ambiti, come il reclutamento o la selezione del personale, l’uso di sistemi di intelligenza artificiale richiede infatti livelli molto elevati di garanzia, soprattutto per quanto riguarda l’equità e la non discriminazione. Nei casi in cui si prevedono possibili impatti gravi, diventa fondamentale rispettare criteri rigorosi: dalla qualità dei dati utilizzati per l’addestramento degli algoritmi, alla documentazione dei processi di sviluppo, fino alla trasparenza sulle capacità e sui limiti dei sistemi e alla presenza di una supervisione umana nelle decisioni. Tuttavia, questi requisiti risultano difficili da applicare pienamente con le tecnologie attualmente in uso. Nonostante queste criticità, gli algoritmi non sono strumenti intrinsecamente negativi. In alcuni ambiti, come le previsioni meteorologiche, si rivelano estremamente utili proprio perché si basano su regolarità osservabili nei dati. La differenza fondamentale emerge quando si passa dall’analisi di fenomeni fisici a quella dei comportamenti umani. Nel primo caso, le previsioni non modificano il fenomeno osservato; nel secondo, invece, possono influenzarlo profondamente, orientando le azioni delle persone e aprendo la strada a possibili forme di manipolazione. Il machine learning , in particolare, si fonda sulla capacità di individuare schemi nei dati passati per costruire modelli predittivi. Questo comporta la creazione di insiemi di dati di addestramento e di test, e l’obiettivo è quello di generalizzare le relazioni tra variabili per anticipare comportamenti futuri. Tra

principale, infatti, è mantenere il controllo sull’esperienza degli utenti e orientarne i gusti nel tempo. La situazione è in parte diversa nelle piattaforme in cui i contenuti sono prodotti direttamente dagli utenti, come nel caso di YouTube. Qui i criteri di somiglianza tra contenuti e utenti, che servono per generare le raccomandazioni, vengono definiti e raffinati nel tempo, spesso dopo che la piattaforma ha già raggiunto una posizione dominante nel mercato. Anche in questo caso, però, il modo in cui i contenuti vengono proposti non è neutrale, ma deriva da scelte precise su come collegare tra loro utenti, preferenze e contenuti. Uno dei principali problemi dal punto di vista della conoscenza, quando si parla di algoritmi, riguarda il cosiddetto problema dell’induzione , già messo in luce dal filosofo David Hume. La questione nasce da una domanda fondamentale: su quale base possiamo essere certi che ciò che è accaduto in passato si ripeterà anche in futuro? In realtà, non esiste alcuna dimostrazione che le esperienze future saranno simili a quelle già osservate. Eppure, proprio su questa idea si fonda gran parte del funzionamento degli algoritmi. Gli algoritmi, infatti, utilizzano dati raccolti nel passato – i cosiddetti dati di training – per individuare caratteristiche ricorrenti e costruire delle previsioni. In questo processo, il passato rappresenta il punto di partenza, mentre il futuro è la conclusione a cui si cerca di arrivare. Tuttavia, come sottolineava Hume, questo tipo di ragionamento non è sempre affidabile, perché non garantisce che le regolarità osservate continuino a valere nel tempo. Nonostante questo limite teorico, il successo degli algoritmi di apprendimento automatico e di profilazione si basa proprio sulla loro capacità di sfruttare queste regolarità. In generale, gli algoritmi partono dall’idea che analizzando i comportamenti passati sia possibile anticipare quelli futuri. Questa convinzione si fonda su due presupposti principali: da un lato, che ciò che è accaduto in passato tenderà a ripetersi; dall’altro, che il comportamento di un individuo possa essere esteso ad altri individui simili, cioè appartenenti allo stesso gruppo o cluster. Tuttavia, queste assunzioni sono state oggetto di molte critiche, sia perché tendono a generalizzare eccessivamente, sia perché si basano proprio su quel meccanismo induttivo che, come visto, non offre certezze. A questo si aggiunge un ulteriore problema, noto come learnability , cioè la capacità di un algoritmo di apprendere a partire da un insieme di dati. In teoria, un algoritmo dovrebbe essere in grado di fare previsioni corrette scegliendo un campione rappresentativo dei dati disponibili. Ma nella pratica, stabilire quale sia il campione giusto non è affatto semplice. Anzi, questo problema si collega a una questione ancora più complessa, quella dell’indecidibilità: non esiste un metodo sicuro e universale per scegliere il sottoinsieme di dati migliore per l’addestramento. Di conseguenza, anche la capacità di apprendimento degli algoritmi rimane in parte incerta. Inoltre, per poter utilizzare i dati in modo efficace, è necessario descrivere il problema in variabili misurabili. Questo passaggio è indispensabile per permettere agli algoritmi di funzionare, ma comporta anche una limitazione importante: si può analizzare solo ciò che è quantificabile, mentre tutto ciò che sfugge a questa formalizzazione resta escluso. Il modo in cui i dati vengono raccolti e preparati ha quindi un impatto decisivo sui risultati. I dati devono essere organizzati, normalizzati e resi compatibili con i modelli matematici utilizzati dagli algoritmi. Tuttavia, questo processo non è privo di problemi. I dati “ sporchi ”, cioè incompleti o incoerenti, sono inevitabili, ma spesso vengono eliminati perché non si adattano al modello previsto. Allo stesso tempo, la normalizzazione può portare a una eccessiva uniformazione, che riduce la complessità della realtà pur di renderla trattabile dai sistemi di machine learning e deep learning. Questi sistemi, inoltre, stanno diventando sempre più complessi, al punto da risultare difficili da controllare anche per chi li ha progettati. Ogni processo di categorizzazione, quindi, non è mai neutrale, ma implica sempre un’interpretazione. Anche gli algoritmi, in questo senso, svolgono un’attività interpretativa, ma lo fanno in modo poco visibile, spesso nascosto dalle pratiche di segretezza delle aziende. I criteri con cui i dati vengono classificati e organizzati non sono sempre espliciti e difficilmente possono essere discussi o verificati dall’esterno.

Questa mancanza di trasparenza aumenta il rischio che si producano effetti discriminatori, soprattutto durante i processi di profilazione. Un esempio evidente è quello dei sistemi di raccomandazione sui social media, che tendono a proporre contenuti simili a quelli già visualizzati. Questo meccanismo può portare alla formazione delle cosiddette “ filter bubble ”, cioè ambienti informativi chiusi, in cui gli utenti entrano in contatto quasi esclusivamente con opinioni e contenuti che confermano le loro idee, riducendo così il confronto con punti di vista diversi. Alla base dei sistemi di raccomandazione c’è un processo di classificazione che si fonda su ipotesi e su metodi di calcolo che non sono completamente certi, ma che possono comunque spingere le persone a comportarsi o prendere decisioni seguendo i suggerimenti ricevuti. Una raccomandazione, quindi, dipende da un sistema che è stato costruito per rappresentare il futuro a cui si riferisce, e anche da una certa visione del mondo su ciò che è considerato giusto o su ciò che dovrebbe accadere. Inoltre si basa su un’interpretazione del passato usata come modo per prevedere il futuro, anche se tutti questi elementi non possono essere verificati in modo definitivo. In alcuni casi, a seconda del contesto, le raccomandazioni possono avere effetti importanti e persino gravi sulle decisioni, soprattutto quando si tratta di scelte pubbliche. Per esempio, nei sistemi di predictive policing , le indicazioni fornite dagli algoritmi finiscono per diventare di fatto delle regole: se un sistema suggerisce che in una certa zona è più probabile che avvengano crimini, questo porta la polizia a concentrare lì la propria attenzione, influenzando così concretamente l’azione. A questo proposito, Wendy Chun sostiene che gli algoritmi non si limitano a descrivere la realtà, ma contribuiscono a mantenere e rafforzare le discriminazioni già presenti. Secondo lei, non sono solo strumenti descrittivi, ma anche prescrittivi e “performativi”, perché finiscono per imporre comportamenti e norme mentre trasformano i dati in modelli di conoscenza su cui si basano le decisioni. Questo problema viene evidenziato anche dalla RAND , un’agenzia di ricerca che supporta le decisioni pubbliche, la quale sottolinea come gli algoritmi siano spesso poco trasparenti e difficili da valutare in termini di correttezza ed equità. Inoltre, essi possono essere considerati davvero affidabili solo in condizioni ideali, che nella realtà sono molto rare. Un tema centrale in tutto questo è l’idea di previsione del futuro, che viene affrontata in modi diversi da vari studiosi. Bridle , ad esempio, insiste sul fatto che il futuro è imprevedibile: dato che anche passato e futuro possono essere messi in discussione, ogni decisione dovrebbe concentrarsi soprattutto sul presente, sul “qui e ora”. Secondo lui, l’intelligenza umana sta proprio nella capacità di adattarsi all’incertezza del momento attuale. Vespignani , invece, riconosce che gli algoritmi possono fare previsioni, ma sottolinea che queste devono essere sottoposte a controlli rigorosi di qualità e validazione. Questo perché le previsioni si basano su informazioni incomplete sui fenomeni e anche perché i comportamenti delle persone possono cambiare proprio in base a ciò che si conosce o si immagina del futuro. Turing sosteneva che, per dimostrare davvero un’intelligenza simile a quella umana, anche le macchine dovrebbero poter commettere errori, proprio come le persone. Secondo lui, un comportamento può essere considerato intelligente solo se è anche creativo e originale, e questo implica necessariamente la possibilità di sbagliare, anche se ciò comporta un aumento dei rischi e delle possibilità di fallimento. In questa prospettiva, l’idea di Turing si basa sul fatto che la macchina debba imitare l’intelligenza umana nel suo complesso, quindi non è necessario che le sue prestazioni siano sempre perfette o costantemente eccellenti. Symons e Alvarado , invece, sottolineano l’importanza di analizzare e quantificare gli errori e il modo in cui questi si propagano negli algoritmi applicati ai big data, perché la struttura stessa dei sistemi di machine learning può rendere difficili da individuare alcuni errori, che rischiano quindi di passare inosservati. Humphreys aggiunge che l’uso di algoritmi per risolvere problemi legati ai big data crea nuove difficoltà: la razionalità computazionale, infatti, non può essere semplicemente paragonata a quella umana, perché funziona secondo logiche diverse e non sovrapponibili.

la realtà, ma puntano a intervenire direttamente sulle persone. Questo accade, ad esempio, nel marketing e nell’uso politico delle informazioni, dove i dati vengono utilizzati per influenzare i comportamenti , cercando di convincere i cittadini a modificare le proprie opinioni. Il marketing sfrutta queste categorizzazioni perché, come spiega Cardon , le tracce lasciate online dagli utenti possono essere raccolte e analizzate per costruire profili dettagliati delle persone. Attraverso questi profili è possibile stimare la propensione al consumo, cioè prevedere cosa una persona potrebbe acquistare. L’obiettivo principale del marketing è infatti quello di anticipare le scelte dei consumatori e orientarne i comportamenti. Con la crescita delle tracce digitali, che vengono lasciate in molti ambiti della vita quotidiana, si arriva al punto in cui quasi tutto può essere trasformato in un mercato e analizzato in termini di consumo. Wendy Chun si concentra in particolare su alcuni aspetti fondamentali legati ai dati: l’interpretazione, l’estrazione, la capacità prescrittiva e la costruzione di modelli. Il suo ragionamento si basa sull’idea che dare il consenso una sola volta all’uso dei propri dati significa, di fatto, permettere che questi dati circolino per sempre. Questo principio viene riassunto nell’espressione “ consent once, circulate forever ”. Secondo Chun, le abitudini non devono essere confuse con le dipendenze. Le abitudini si formano nel tempo, ma possono anche cambiare; non sono qualcosa di fisso o permanente. Per questo motivo non è corretto che i sistemi di big data si basino su queste come se fossero immutabili, trattando la memoria come un semplice magazzino in cui tutto resta invariato. In questo contesto, il diritto all’oblio assume un ruolo importante: non serve solo come strumento legale di tutela, ma anche come mezzo per cancellare quella memoria digitale che rischia di legare una persona in modo permanente al proprio passato. La rete , infatti, facilita la circolazione continua delle informazioni e, di conseguenza, fa perdere agli individui il controllo su di esse. Tuttavia, questa perdita di controllo non dovrebbe essere sfruttata, né da istituzioni pubbliche né da soggetti privati, per limitare le persone alle loro attività passate. Al contrario, sia gli utenti sia le istituzioni dovrebbero rinnovarsi continuamente, e dovrebbe essere garantito anche che le fake news non vengano diffuse o ripetute nel tempo. Oltre alle abitudini, Chun individua nella somiglianza tra le persone, cioè nell’ omofilia , uno degli elementi che contribuiscono maggiormente a un uso negativo delle previsioni algoritmiche. L’omofilia è la tendenza degli individui a preferire relazioni con persone simili a sé. Chun analizza il rapporto tra omofilia e segregazione utilizzando una teoria chiamata agent-base. Secondo questa impostazione, il metodo non è neutrale, ma si basa su una costruzione articolata in due fasi:

Nella prima fase si descrivono i fenomeni sociali come insiemi di nodi e connessioni, che servono a rappresentare le relazioni tra individui. In questa fase si definiscono i significati degli elementi di base e si costruiscono modelli che spiegano i comportamenti.
Nella seconda fase si sviluppano modelli capaci di riprodurre queste astrazioni; tutto ciò che riesce a riprodurre il modello viene considerato una rappresentazione corretta. Questo processo mette in evidenza come le scienze delle reti siano in equilibrio tra osservazione della realtà e costruzione teorica: il mondo reale viene modellato, ma la rappresentazione iniziale finisce per essere considerata vera proprio perché viene riprodotta dal modello. La costruzione dei metodi e il loro carattere prescrittivo rientrano in quella che viene chiamata formulazione del problema. Si tratta del passaggio dalla realtà concreta alla definizione del problema che l’algoritmo deve affrontare. Spesso questo processo avviene in modo implicito e inconsapevole, e per questo si tende a sottovalutare il carattere prescrittivo degli algoritmi. In realtà, gli algoritmi non si limitano a descrivere la realtà, ma formulano veri e propri giudizi, associando o separando i casi all’interno di categorie. L’omofilia rappresenta proprio l’idea che le persone tendano a stare con chi è simile a loro. Partendo da questa ipotesi, è possibile modellare il comportamento degli individui osservando quello dei loro

vicini. Questo principio è alla base di fenomeni come la segregazione sociale, etnica e politica. Secondo la teoria delle reti , la segregazione non avviene perché è prevista esplicitamente dal modello, ma perché gli individui cercano di non trovarsi in minoranza e tendono a organizzarsi in gruppi più omogenei. Tuttavia, partendo da condizioni iniziali casuali, è difficile ottenere modelli realmente integrati. Chun critica questa visione, sostenendo che le condizioni iniziali non sono mai veramente casuali. Le istituzioni, ad esempio, contribuiscono a creare spazi di segregazione nelle città sulla base di fattori politici e storici, spingendo le minoranze a spostarsi in determinati luoghi. Queste scelte vengono spesso rappresentate come volontarie, ma in realtà sono influenzate da condizioni strutturali. Molti studiosi considerano l’omofilia come un principio fondamentale della teoria delle reti, quasi come se fosse un fenomeno naturale. Un esempio evidente è dato dai social network : se due persone hanno un amico in comune, è probabile che entrino in contatto e diventino amici. Gli algoritmi che rendono possibile questo tipo di suggerimenti contribuiscono a concentrare l’attenzione su alcuni aspetti, trascurandone altri, e possono favorire meccanismi di segregazione, esclusione e discriminazione. Per questo motivo, sarebbe preferibile incentivare la diversità invece dell’omologazione. Le macchine , però, come abbiamo già detto, non sono neutre: sono progettate da programmatori che appartengono a specifici gruppi sociali, etnici e culturali. Anche se la tecnologia viene presentata come “ color blind ”, cioè priva di pregiudizi, in realtà questi pregiudizi possono essere incorporati negli algoritmi, anche in modo involontario. La maggior parte dei programmatori, infatti, sono uomini bianchi con alto livello di istruzione e appartenenti alla classe medio-alta. Inoltre, solo poche grandi aziende rendono pubblici i dati sulla composizione del proprio personale, mentre molte altre li comunicano solo in forma riservata. Questa mancanza di trasparenza evidenzia un problema importante: nelle aziende tecnologiche, in particolare nella Silicon Valley , gli uomini bianchi tendono ad avanzare di carriera più facilmente, mentre altri gruppi incontrano maggiori difficoltà. Questi pregiudizi influenzano anche le decisioni prese dagli algoritmi. Anche se alcune categorie discriminatorie sono vietate, è comunque possibile ottenere risultati discriminatori utilizzando altri attributi non esplicitamente proibiti. Inoltre, uno dei principali ostacoli al corretto funzionamento degli algoritmi riguarda l’accesso ai dati e la definizione degli obiettivi. Nella realtà, a differenza dei contesti teorici, è difficile stabilire con precisione quali dati siano rilevanti, perché gli obiettivi non sono sempre chiari e univoci. Per questo motivo, la trasparenza dei criteri decisionali non è sufficiente. Anche se si conoscono i meccanismi di funzionamento, se i dati utilizzati per addestrare gli algoritmi contengono pregiudizi, questi verranno inevitabilmente trasmessi ai risultati. Un esempio particolarmente significativo è quello del riconoscimento facciale. Questa tecnologia è stata utilizzata in modo problematico e poco affidabile. Nel 2018, un’indagine ha dimostrato che un sistema di riconoscimento facciale aveva confuso 28 membri del Congresso americano con criminali presenti in database della polizia. Questo dimostra che l’affidabilità non può essere garantita solo da controlli interni, e che sarebbe necessario un controllo esterno, che però le aziende spesso non accettano. Joy Buolamwini ha testato diversi sistemi di riconoscimento facciale e ha osservato che questi funzionano peggio nel distinguere i volti delle donne afroamericane rispetto a quelli degli uomini bianchi. Anche se alcune aziende hanno cercato di migliorare i sistemi aumentando la diversità dei dati, questi interventi non sono sufficienti. Il riconoscimento facciale, infatti, non garantisce l’assenza di errori, come i falsi positivi. Inoltre, il funzionamento di questi sistemi non è facilmente controllabile, e per questo sarebbe opportuno limitarne l’uso, soprattutto da parte delle forze dell’ordine, per evitare violazioni dei diritti umani.

più utilizzate per mostrare la complessità del reale, ma diventano strumenti per insegnare significati già stabiliti. Un esempio riportato riguarda un’immagine di un bambino con la pelle molto scura che non viene riconosciuta correttamente dai sistemi: questo dimostra i limiti della classificazione automatica. Anche se errori di questo tipo possono essere individuati nei singoli casi, diventano molto più difficili da riconoscere quando si analizzano grandi quantità di dati. Questo può avere conseguenze concrete sulla vita delle persone. Nonostante ciò, alcuni ricercatori continuano a sostenere che questi sistemi possano essere utilizzati anche in ambiti sensibili, come la classificazione dei volti in base alla presunta propensione alla criminalità. Tra i principali fattori di rischio nell’uso degli algoritmi per giudicare e classificare le persone ci sono l’influenza politica, la capacità di descrivere e prescrivere comportamenti, i metodi di categorizzazione utilizzati durante l’addestramento e la capacità di prevedere e anticipare il futuro. Un ambito particolarmente delicato è quello del riconoscimento delle emozioni, chiamato affect recognition. Questo tipo di tecnologia cerca di identificare gli stati emotivi delle persone attraverso le espressioni facciali, il tono della voce e i movimenti del corpo, con l’obiettivo di intervenire in diversi contesti. Tuttavia, questi metodi non hanno basi scientifiche solide, perché si basano su idee simili alla fisiognomica, che non è considerata una disciplina affidabile. Nonostante le difficoltà nel definire le emozioni in modo preciso, molti studi continuano a cercare di classificarle. Ekman , ad esempio, propone una suddivisione in emozioni di base come rabbia, felicità e paura. Alcuni sistemi, soprattutto in Cina , utilizzano queste teorie per associare emozioni interiori alle espressioni facciali. Tuttavia, molti psicologi criticano questa impostazione per tre motivi principali: la scarsa affidabilità delle espressioni, la mancanza di una corrispondenza precisa tra espressioni e emozioni e il fatto che il contesto culturale influisce molto su come le emozioni vengono espresse. In sostanza, non esiste una base scientifica solida per affermare che sia possibile riconoscere con certezza le emozioni attraverso il volto. Queste tecnologie, quindi, non identificano realmente emozioni, ma semplicemente movimenti facciali. Le tecnologie di affect recognition funzionano quindi come strumenti di monitoraggio delle espressioni , senza poter garantire che queste corrispondano a stati emotivi reali. In questo modo, si sostituisce la complessità dell’esperienza umana con una rappresentazione rigida e semplificata, che riflette una visione ideologica presentata come universale. Il successo del riconoscimento facciale dipende anche dalla sua capacità di creare rappresentazioni simboliche forti. Se le persone credono che questi sistemi siano in grado di riconoscere emozioni, rischiano di attribuire valore a queste rappresentazioni, con possibili conseguenze negative. Un altro ambito problematico è quello delle query suggestion , cioè i suggerimenti che i motori di ricerca propongono agli utenti mentre digitano una ricerca. Questi suggerimenti servono ad anticipare le intenzioni dell’utente e sono influenzati dalle ricerche precedenti e dalla personalizzazione. I motori di ricerca hanno quindi una responsabilità etica , perché possono evitare di proporre contenuti basati su stereotipi o pregiudizi. Tuttavia, spesso questa responsabilità non viene considerata prioritaria. Un problema centrale riguarda l’obiettivo dei motori di ricerca : devono fornire accesso all’informazione oppure privilegiare i contenuti più popolari? Spesso i risultati sono influenzati da fattori culturali e politici e possono risultare discriminatori, ad esempio con contenuti misogini o razzisti. Anche gli algoritmi dei social network presentano problemi simili. Safiya Noble analizza come questi sistemi influenzino la rappresentazione delle minoranze, amplificando stereotipi e influenzando l’autopercezione delle persone. Gli algoritmi sono progettati da ingegneri che possono introdurre, anche involontariamente, i propri pregiudizi. Inoltre, il codice stesso contiene valori e significati che influenzano la società. I social network personalizzano i contenuti mostrati agli utenti, filtrando le informazioni in base alle preferenze passate. Questo crea bolle informative e rafforza le opinioni già esistenti. Le fake news si diffondono facilmente in questo contesto, spesso più rapidamente delle notizie vere.

big data e algoritmi, Dispense di Linguistica

Documenti correlati

Anteprima parziale del testo

Scarica big data e algoritmi e più Dispense in PDF di Linguistica solo su Docsity!

4. Algoritmi, intelligenza artificiale,

pattern recognition