








Studia grazie alle numerose risorse presenti su Docsity
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Prepara i tuoi esami
Studia grazie alle numerose risorse presenti su Docsity
Prepara i tuoi esami con i documenti condivisi da studenti come te su Docsity
Trova i documenti specifici per gli esami della tua università
Preparati con lezioni e prove svolte basate sui programmi universitari!
Rispondi a reali domande d’esame e scopri la tua preparazione
Riassumi i tuoi documenti, fagli domande, convertili in quiz e mappe concettuali
Studia con prove svolte, tesine e consigli utili
Togliti ogni dubbio leggendo le risposte alle domande fatte da altri studenti come te
Esplora i documenti più scaricati per gli argomenti di studio più popolari
Ottieni i punti per scaricare
Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium
Riassunto "L'umanista digitale"
Tipologia: Sintesi del corso
1 / 14
Questa pagina non è visibile nell’anteprima
Non perderti parti importanti!









In offerta
Nascita del calcolatore: da Turing al pc
Per analizzare la storia del calcolatore si possono seguire due strade: -guardare allo sviluppo dell’ hardware , cioè la macchina fisica con le sue caratteristiche ingegneristiche; -soffermarsi sull’evoluzione del linguaggio della macchina e puntare sulla logica (trattare cioè il software ).
Storia dell’informatica (o scienza dei calcolatori): nasce intorno alla Seconda Guerra Mondiale dall’esigenza di eseguire grandi quantità di calcoli. Per progettare i calcolatori venne sfruttato il modello logico-teorico risalente agli studi di logica di Alan Turing.
Turing: negli anni ’30 del ‘900 ideò una macchina astratta in grado di eseguire qualsiasi compito potesse essere eseguito automaticamente. L’idea non era quella di fornire un modello di calcolatore, bensì quella di dimostrare l’indecidibilità della logica.
1945:
John von Neumann scrisse il documento noto come First Draft , considerato all’origine della storia dell’informatica.
La Mt suggeriva l’idea che l’esecuzione di un calcolo fosse una semplice manipolazione di simboli e che in linea di principio non ci fosse differenza qualitativa tra cifre e formule. Fu proprio da questa idea di computer come manipolatore di simboli e non più come calcolatore che nascerà la scienza dei calcolatori che getterà le basi per la rivoluzione informatica del secondo dopoguerra.
La MT non era l’unica esistente: nello stesso periodo in cui Turing ideò la sua macchina, esisteva anche l’Analizzatore di Vannevar Bush, basato su un modello analogico, ed era la macchina più potente in funzione.
Nell’ambito della ricerca di un dispositivo di calcolo per la crittografia (quindi x scopi militari), fu costruita la prima macchina completamente elettronica: il Colossus.
Quello che il computer non può fare: dall’analogico al digitale
Tecnologia digitale: ebbe successo, secondo molti studiosi, sia grazie al frutto di uno specifico sviluppo tecnologico, sia grazie all’efficacia della metafora di una macchina preposta al controllo e all’esecuzione instancabile di computazioni.
Calcolatore digitale: come il resto della tecnologia, anche lui si ispirò a teorie già esistenti, risalenti ad almeno dieci anni prima e sorte nel contesto degli studi sulla computabilità intorno alla metà degli anni ’ del ‘900.
Problemi: la macchina astratta inventata allora (quella di Turing) aveva una serie di limiti sulla trattazione dei problemi di decisione. La Mt non poteva, per esempio, stabilire la decisione dell’appartenenza di una formula all’insieme dei teoremi di un certo sistema formale o se un programma terminerà o andrà in loop.
von Neumann: intorno alla metà degli anni ’40 del ‘900 intuì che esistevano anche altri ordini di problemi da considerare quando si passava dalle macchine astratte alle macchine concrete. Introdusse quindi nuovi vincoli per le macchine concrete. Un esempio è la trattabilità (distinta dalla decidibilità). Per dichiarare un problema irrisolvibile da un calcolatore non era più necessario che esso fosse indecidibile; bastava che fosse
intrattabile dalla macchina, cioè che il numero di passi necessari per risolverlo fosse superiore alle capacità fisiche della macchina.
Ideologia del modello di logica nella prima metà del ‘900: per fornire una base alla matematica, i logici immaginarono di dover modellare un agente che maneggiasse solo simboli e che fosse capace, in completo isolamento, di preservare la verità della premessa nelle conclusioni solo maneggiando altri simboli in base a precise regole di inferenze.
Turing: lavorò sul concetto di una macchina capace di emulare il calcolatore assoluto, cioè l’essere umano, nell’atto di eseguire calcoli, immaginando persino di poter suddividere le operazioni da lui compiute compilando una lista di passi elementari espressi con estrema chiarezza da poter essere eseguiti anche da una macchina.
Limiti: ridurre i passi della matematica ad una lista di istruzioni elementari per un calcolatore non tiene conto né della pratica del matematico né del fatto che una macchina concreta, a differenza di quella astratta, non può far durare i processi a piacere.
Macchina analogica e macchina digitale: nonostante la macchina analogica fosse più flessibile di quella digitale nella rappresentazione dei fenomeni, era anche più problematica per l’interpretazione dei risultati e per la ripetibilità delle esecuzioni; inoltre non era possibile la compilazione di una tavola di istruzioni univoca da poter utilizzare in tutte le occorrenze di uno stesso problema. Per questo, a poco a poco la macchina digitale rimpiazzò quella analogica, anche nei compiti di controllo per i quali le macchine analogiche sembravano adeguate.
von Neumann: affermò che se si vuole imitare il meccanismo con cui il cervello prende le decisioni e trova le soluzioni ai problemi, bisogna anche cambiare le regole logiche classiche e il linguaggio della logica, in quanto i sistemi logici di cui si serve il cervello presentano una profondità logica inferiore a quella a cui siamo abituati.
La connessione tra logica e linguaggio e la relazione tra essi sono al centro dello sviluppo dell’informatica, in particolare riguardano lo sviluppo del software.
Tecnologia amichevole e integrazione con la macchina: il sogno visionario di Bush
Vannevar Bush (1890-1974): inventò l’Analizzatore differenziale, una macchina analogica costruita nel 1936 e che ancora negli anni della Seconda Guerra Mondiale era la più potente macchina per fare i calcoli. Orientò la propria riflessione sullo sviluppo scientifico e tecnologico verso il problema della gestione delle informazioni. Elaborò un progetto, reso pubblico nel 1945 e descritto, tra gli altri, nell’articolo As we may think , che rimase la fonte d’ispirazione per le generazioni successive. Il punto di partenza fu la necessità di riconvertire il lavoro degli scienziati verso attività adeguate al periodo di pace. La sua soluzione comprendeva la realizzazione di Memex, una macchina che sarebbe stata in grado di aiutare l’uomo nello sforzo di gestire efficientemente e dinamicamente le informazioni , con particolare riguardo alla necessità di aggiornarle continuamente, conservarle adeguatamente e renderle agevolmente accessibili. Decise di simulare la strategia associativa propria della memoria umana: i dati non devono essere indicizzati, ma trovati per associazione. La sua convinzione era, però, che la macchina potesse “aumentare” la capacità umana di creare associazioni e non emularla veramente. Il Memex era una macchina da tavolo, non riservata soltanto agli scienziati ma destinata a tutte le categorie di lavoratori e professionisti. Il funzionamento analogico, anche se arretrato storicamente, gli consentì di intuire la necessità di dispositivi interattivi: ideò così un’interfaccia con dispositivi analogici per l’amichevole interazione tra la macchina e l’utente. Altra convinzione di Bush era che l’evoluzione tecnologica non dovesse basarsi sui nuovi strumenti, ma su una <
Rischi individuati da Wiener in conseguenza alla “seconda rivoluzione industriale” (cioè quando le promesse della cibernetica si fossero avverate:
-disoccupazione intellettuale le macchine per il controllo e la comunicazione avrebbero sostituito non solo il braccio ma anche la mente dell’uomo. Era necessario dunque o rivoluzionare i meccanismi di formazione delle classi lavoratrici, o modificare le strutture valoriali della società, in modo da non escludere parti sempre più consistenti di cittadinanza; -proprietà intellettuale Wiener era contro l’idea che le scoperte scientifiche dovessero essere tenute nel segreto più assoluto ed aveva, anzi, una concezione di informazione dinamica e processuale, non statica. Porre il segreto alle ricerche, perciò, le rallentava inutilmente, dal momento che il nemico aveva comunque i metodi per scovare le informazioni.
La centralità dell’informazione e la garanzia della sua diffusione sono fondamentali nella prospettiva di Wiener, tanto che se i mezzi di comunicazione non soddisfano adeguatamente tale necessità si rischia di cadere in meccanismi antidemocratici, supportati da un cattivo uso delle macchine per il controllo, che favoriscono l’accentramento del potere.
Metodi per contrastare l’entrata in funzione delle macchine per il controllo nella società:
-realizzare una generazione di scienziati consapevoli e liberi da legami con la società e la politica, con la possibilità di prendere decisioni unicamente nella loro qualità di esperti; -fornire la massima informazione possibile sugli accadimenti scientifici e sull’innovazione tecnologica per far crescere la consapevolezza nella popolazione e per permettere l’attivazione degli opportuni correttivi.
Il fine di Wiener: contribuire alla costituzione di una società più giusta, con valori diversi da quelli della mera commercialità, capace di fronteggiare un uso inconsapevole della tecnologia con condivisione e collaborazione. La società così “plasmata” avrebbe permesso un <
Sintesi delle posizioni ed intuizioni di Wiener:
-soluzioni orientate agli esseri umani; -rigenerazione della conoscenza solo attraverso la sua libera e aperta trasmissione.
Licklider e la simbiosi uomo-macchina
Joseph Carl Robnett Licklider (1915-1990): la sua formazione rientrava nella psicologia sperimentale e il suo principale campo di ricerca era la psicoacustica, in cui si usavano sofisticate apparecchiature per studiare i neuroni cerebrali. Fu influenzato dalle idee della cibernetica di Wiener, dato che partecipava alle cybernetics dinners e prese anche parte alla settima conferenza Macy (marzo 1950), come invitato ad intervenire sulla distorsione del linguaggio e la sua capacità di rimanere intelligibile. Fu a capo dell’ufficio IPTO ( Information Processing Technologies Office ), che faceva parte dell’ARPA ( Advanced Research Project Agency ), un’agenzia del dipartimento della Difesa. Il suo ufficio fu alla base dei finanziamenti per lo sviluppo dell’interfaccia uomo-macchina e successivamente si dedicò alla costruzione dell’Arpanet (antenato di Internet), la rete che collegava università e centri di ricerca.
Idee di Licklider: condivideva con Bush la convinzione che la maggior parte del lavoro di ricerca fosse volta alla creatività e si adoperava affinché la macchina fosse capace non solo di far risparmiare tempo meccanico allo scienziato, ma anche di aiutarlo nello sviluppo di quello che lui chiamava pensiero formulativo(più in generale, creativo). La sua partecipazione al progetto Whirlwind si rivelò fondamentale per l’influenza che ebbe sul dispositivo cui Licklider pensava già dall’inizio degli anni ’60.
Progetto Whirlwind : progetto di guerra simulata nel quale i segnali degli strumenti di controllo venivano analizzati da operatori con l’aiuto delle macchine. Il progetto, però, nato già vecchio in termini di tecnologia,
non entrò mai in funzione; tuttavia fu estremamente importante per aver lanciato l’idea di una macchina capace di un’interazione diretta con l’utente: nasceva il paradigma della simbiosi uomo-macchina.
La simbiosi secondo Licklider: si contrapponeva decisamente con quella che Licklider chiamava l’automazione (da lui identificata con l’idea dell’<
Il nuovo computer: secondo quest’idea di simbiosi, nel computer i compiti di calcolo e gestione dei dati si fondono con quelli di immagazzinamento e ricerca di informazioni; a questo si integra la componente della comunicazione a tutti i livelli (tra operatore e macchina, tra macchine e tra uomini attraverso le macchine): nasce così un dispositivo nuovo che, per esempio, introduce dei dispositivi input-output ; anche le tecniche per i linguaggi di programmazione sono diverse da quelle adottate precedentemente, più consone al linguaggio umano. La novità più significativa è però il ruolo dell’utente nell’elaborazione dei processi meccanici: mentre nella Mt l’operatore era sostituito da un’adeguata tavola di istruzioni, nel modello cibernetico l’uomo è affiancato dalla macchina (che lo sostituisce solo nelle parti meccaniche del processo), senza che questa lo sostituisca mai. Perciò erano necessari degli strumenti input-output che facilitassero la comunicazione con la macchina: fu proprio in questo contesto che vennero inventati alcuni dispositivi ancora attualmente utilizzati, come il mouse , l’utilizzo delle interfacce a icone, il lavoro di gruppo, gli schermi adatti alle applicazioni grafiche ecc.
<< Information processing >> e biblioteche
Conseguenze del lavoro del gruppo di ricerca di Licklider: diede vita ad un nuovo modo di gestire e rappresentare i dati, costruire informazioni e creare conoscenza. In uno dei seminari organizzati nel 1961 per festeggiare il centenario del Mit, cui Licklider fu invitato, egli disse che il computer avrebbe riguardato <<l’intero dominio dei processi creativi intellettuali>> e che l’ information processing sarebbe diventato un giorno il campo di una scienza importante. Riconobbe perciò che l’informatica avrebbe toccato tutte le discipline che hanno a che fare con processi creativi di qualsiasi tipo e che tutte, anche quelle umanistiche, avrebbero contribuito al suo sviluppo.
Ostacoli alla simbiosi individuati da Licklider:
-differenza di velocità tra i due soggetti umano e meccanico soluzione: time-sharing , cioè una tecnologia che permettesse a diverse consolle a distanza di usufruire dello stesso tempo macchina. Conseguenze del time-sharing: = dal punto di vista sociale l’uso collettivo di un’unica macchina costruì una sorta di spirito di gruppo e di collaborazione tra i programmatori che pose le basi per la cultura di condivisione e di rispetto del lavoro altrui: Internet fu infatti uno dei tanti progetti collettivi per la distribuzione dell’informazione; = dal punto di vista tecnologico il lavoro più pesante è riservato al main frame (gli attuali servers ) mentre i singoli terminali connessi (gli attuali clients ) usufruiscono solo dei risultati. Negli anni precedenti la direzione dell’IPTO, Licklider era stato incaricato dal Council on Library Resources di esplorare il ruolo che la tecnologia avrebbe potuto avere nelle biblioteche del futuro; proprio nelle biblioteche egli individuò terreno fertile per sfruttare al meglio la tecnologia da perfezionare: in esse la digitalizzazione massiccia delle informazioni avrebbe permesso una più facile e diretta consultazione dei materiali garantita a molti utenti.
-differenza dei linguaggi utilizzati dall’uomo e dalla macchina soluzione: subroutines separate che l’operatore poteva richiamare semplicemente citando il loro nome; erano dei percorsi real-time da poter utilizzare all’occorrenza.
device , in cui profetizzavano che la comunicazione mediata dalle macchine avrebbe surclassato quella faccia a faccia.
Il computer come strumento di comunicazione
L’articolo delineava una nuova idea di informatica e soprattutto un suo diverso ruolo nella società.
Idea di Licklider e Taylor: progettazione di uno strumento che consentisse anche l’interazione, oltre che il trasferimento di informazione. A partire da ciò, si doveva modificare la concezione di alcuni elementi, tra cui la comunicazione e i beneficiari di questa nuova forma di comunicazione.
Comunicazione: anche Taylor era stato influenzato dalle idee di Bush e Wiener sulla nuova idea di interazione tra uomo e macchine. Entrambi avevano modificato la nozione di “comunicazione”: non più semplice scorrere di dati codificati che dovevano giungere a destinazione per essere decodificati; a questo loro affiancarono la nozione di feedback , la risposta al flusso di dati. In questa prospettiva si collocano Licklider e Taylor, secondo i quali <<comunicare è più che inviare e ricevere>>. Il loro interesse si concentrava soprattutto sull’aspetto “creativo” della comunicazione umana, quello che le macchine potevano supportare ed aumentare. Per questo era necessario un mezzo che fosse plastico e che si potesse modellare sulle circostanze, un mezzo dinamico e al quale tutti potessero avere accesso: un mezzo come il computer, il quale può gestire sia le <
Beneficiari della nuova comunicazione: se la gestione delle informazioni e dei loro processi è automatizzata, gli operatori del computer non devono essere solamente tecnici, programmatori o ingegneri, ma anche tutti coloro coinvolti in un’<<attività creativa informazionale>>.
Futuro delle comunità interattive online : nell’articolo viene inoltre ipotizzato il futuro nel contesto tecnologico e Taylor e Licklider previdero una società in cui si sarebbe usato il computer per ogni transazione informativa e in cui le lettere e i telegrammi sarebbero stati sostituiti da messaggi elettronici. In questo scenario, tuttavia, Licklider e Taylor scorgevano un rischio, quello del digital divide : la domanda era se essere online sarebbe stato un privilegio o un diritto e, quindi, se la rete sarebbe stata un vantaggio o un rischio per la società.
Nascita di Arpanet
1966: Taylor ottiene dal direttore dell’Arpa un primo finanziamento di un milione di dollari per la realizzazione dell’infrastruttura della rete Arpanet; nel dicembre riesce a convincere Larry Roberts a collaborare con l’Arpa: fu proprio lui a mettere in piedi il progetto.
Innovazioni e scelte di funzionamento di Arpanet:
Nel 1967 furono individuati i primi nodi da connettere: erano centri di ricerca universitari. Il primo fu quello dell’University of California a Los Angeles; il secondo quello dello Stanford Research Institute. Il primo
messaggio fu trasmesso il 29 ottobre 1969. Successivamente furono aggiunti i nodi dell’University of California a Santa Barbara e dell’University of Utah. Il 5 dicembre di quello stesso anno i quattro nodi erano connessi e si può considerare la rete in funzione. Da allora la rete crebbe e si espanse, mediante le innovazioni che avvenivano grazie al learning by using e il producing by using.
Douglas Engelbart: dirigeva lo Stanford Research Institute e fu proprio lì che si studiarono le tecniche per rendere l’interfaccia più amichevole con il computer. Inventò l’idea della tecnologia come human augmentation , il mouse , le finestre, le icone e l’idea del groupware.
Robert Taylor: nel suo PARC (era la divisione di ricerca della Xerox Corporation) ebbero origine le interfacce grafiche e la programmazione object oriented che le rese possibili. Nel 1973 costruì il primo prototipo del personal computer , Alto, cui si ispirarono sia la Apple sia la Microsoft.
Sia l’idea del computer “amichevole” per uso personale sia la rete Arpanet nacquero in un clima tecnologico a favore dell’utente e orientato all’aumento delle sue capacità. In questo contesto cambiò anche il ruolo della tecnologia nella società. Il processo di centrare l’interfaccia sull’utente e di ideare periferiche interattive portò alla nascita di un dispositivo simbiotico con l’utente comune, cioè una macchina “umanistica”.
Il www: un sistema autore nel cuore d’Europa
Tim Berners-Lee: presentò il progetto per il world wide web (www) al Cern di Ginevra (L’organizzazione europea per la ricerca nucleare). Il suo obiettivo era di facilitare il passaggio di informazioni tra i ricercatori del Cern: si doveva solo razionalizzare le risorse e rendere le informazioni facilmente accessibili. La sua prima proposta, nel marzo del 1989, non menzionava neppure il web ; si chiamava Information Management: A Proposal. Il Cern era comunque l’ambiente più favorevole alla creazione del web , presentando la necessità di connettere professionalità e scienziati diversi provenienti da tutto il mondo e di integrare la ricchezza informativa dei loro diversi sistemi hardware e software. Il sistema che permettesse di fare ciò, seppur ancora immaginario, avrebbe dovuto coniugare la funzione di sistema autore a un meccanismo di visualizzazione delle pagine; inoltre avrebbe dovuto rendere possibile l’associazione di documenti prodotti separatamente o loro componenti attraverso dei links. Tim Berners-Lee riconosce che era tutto già pronto: esistevano Internet e i suoi protocolli; inoltre c’era anche il concetto di ipertestualità, intuito da Bush ed ideato da Ted Nelson. L’unico merito che Tim Berners-Lee si attribuisce è l’aver connesso l’idea dell’ipertesto con i protocolli di Internet.
Cosa fece in realtà Bush: in realtà Bush non ha contribuito all’idea dell’ipertesto: la sua invenzione grandiosa fu una postazione da tavolo da cui ciascun utente isolatamente avrebbe potuto connettere la conoscenza (il Memex).
Ted Nelson e l’ipertestualità: fu lui ad inventare l’ipertestualità. Era uno studente di sociologia e filosofia che, nello scrivere un saggio, si rese conto che era necessario un sistema autore che permettesse di connettere attraverso dei links i diversi materiali che componevano il lavoro. Così nel 1960 inventò il progetto Xanadu, il primo sistema autore ipertestuale della storia.
L’idea originale del web era quella di un sistema autore in cui si potessero visualizzare le pagine e modificarle. Questo progetto di web partecipativo ed universale si è realizzato solo successivamente, con la diffusione di sistemi come wiki , i blogs o i social networks. Questo tipo di web , noto come web 2.0, è il compimento del progetto sulla gestione dell’informazione risalente al 1989 in cui ha un ruolo assolutamente centrale la comunità. Essa, come ha sottolineato Berners-Lee, deve comprendere le più diverse competenze: scienziati, biologi, giuristi, sociologi ecc.
I tre elementi distintivi del web : secondo Berners-Lee essi sono <<in ordine decrescente di importanza, Uri, Http, Html, cioè gli identificatori universali, il protocollo di trasferimento e il linguaggio>>.
informazioni utili alla collettività è rappresentata da strumenti che permettono di condividere e organizzare la conoscenza di ogni membro della comunità e di propagare la sua fiducia o sfiducia. In questi sistemi di data-mining sociali non è nemmeno necessario il coinvolgimento esplicito degli utenti , dato che il sistema registra il loro comportamento per scoprire informazioni implicite nella descrizione delle loro attività. Un esempio efficiente è rappresentato da Amazon, che registra il comportamento dei clienti e lo usa per fornire a potenziali nuovi utenti consigli su articoli di loro eventuale interesse e permette ai clienti anche di partecipare attivamente scrivendo una recensione o esprimendo un voto. Questi strumenti sono però più problematici perché gli utenti non sanno di essere messi “al servizio” della comunità, spesso ai fini di lucro del mediatore.
<< Open data >> e << open access >>: il web desiderabile nel futuro
Aspetti positivi del web 2.0: dalla possibilità di condividere i soli documenti in rete ora si possono mettere in comune anche i dati mediante il movimento dell’ open data : esso punta a rendere disponibili, aperti e non proprietari i dati in tutti i campi in cui essi siano accessibili e utilizzabili. Esistono già delle banche dati collettive (Wikipedia, Wikibooks –banca dati di libri editabili dalla comunità-, Geonames, Wordnet –un lessico della lingua inglese che comprende un sistema complesso per raggruppare i termini secondo le affinità semantiche-) ed altre sono in fase di realizzazione. Si tratta in sostanza di mettere contenuti di qualità a disposizione della collettività senza scopi di lucro e lasciare che essi siano aperti ad aggiornamenti e ad un’interrelazione con altri archivi, anch’essi aperti, e che adottino architetture standard.
Il semantic web o web 3.0 (presunto): il movimento dell’ open data è collegato al progetto del semantic web (il presunto web del futuro, il 3.0). Esso si propone di aggiungere uno strato di logica al web e di identificare ogni singola risorsa online attraverso una serie di tags o metadati che permetta anche alla macchina di “leggere e comprendere” lo strato “semantico” descrittivo del web. In altre parole, si tratterebbe di un database di dati strutturati attraverso i cosiddetti “ tags semantici”, cioè semplici stringhe di lettere casualmente scritte in inglese.
L’ e-government 2.0: applicazione collegata all’ open data movement. Esprime la volontà di trasparenza e l’attitudine collaborativa delle pubbliche amministrazioni nei confronti dei cittadini. Negli Stati Uniti è stato da poco lanciato il portale della partecipazione alla vita del Congresso in cui è possibile lasciare commenti e integrazioni alle leggi in esame. Anche nel Regno Unito, l’attuale primo ministro Gordon Brown ha chiesto nell’estate 2009 la collaborazione di Tim Berners-Lee per la realizzazione di uno strumento che favorisca la trasparenza delle attività governative e faciliti la comunicazione con i cittadini.
L’ open access : il movimento dell’ open data è connesso con l’attività dell’ open access. Secondo uno dei suoi principali esponenti, Peter Suber, la letteratura open access è <<digitale, online , priva di costi e priva delle principali restrizioni dovute al copyright e alle licenze d’uso>>. La base dell’ open access è l’idea della scienza e della conoscenza come cose pubbliche , che dovrebbero essere perciò accessibili a tutti senza restrizioni: si devono perciò abbattere le barriere dovute al costo dei giornali a pagamento. L’argomentazione principale in favore dell’ open access degli articoli scientifici si basa sulla constatazione che larga parte delle ricerche è finanziata da fonti pubbliche e, quindi, lo Stato paga due volte: una volta per finanziare l’ottenimento dei risultati e un’altra volta per finanziare le biblioteche che devono acquistare i periodici sui quali tali risultati verranno pubblicati. Così, alcune istituzioni pubbliche americane impongono che i risultati delle ricerche finanziate da loro siano disponibili anche su repositories open access. Anche le riviste a pagamento stanno cambiando: alcune mantengono un repository open access dei preprints degli articoli accettati per la pubblicazione o consentono agli autori di pubblicare su archivi open access gli articoli accettati per la pubblicazione; altre stanno avviando o hanno avviato le pratiche per diventare esse stesse riviste open access.
Come spesso accade, ci si trova di fronte ad una duplice “sfaccettatura” degli archivi pubblici: da un lato, il contenuto generato dagli utenti si presta ad essere oggetto di sfruttamento commerciale da parte della nuova
generazione di mediatori del web ; dall’altro, si mettono a disposizione della collettività informazioni pregiate senza scopo di lucro. Gli strumenti che rendono possibile la gestione e l’organizzazione dei contenuti digitali a beneficio della comunità sono i content management systems : questi permettono entrambe le attività, a seconda delle finalità che si propongono e nel tipo di utenti che privilegiano l’uno o l’altro servizio.
La “nuova” direzione delle piattaforme commerciali: le piattaforme commerciali che ospitano oggetti digitali ora stanno spostando la loro attività verso la distribuzione di contenuti di qualità, o comunque prodotti da professionisti. Ad esempio, Google ha realizzato un primo accordo pilota con la Universal per la creazione di un canale dedicato ai suoi contenuti musicali che prevede una qualche forma di divisione degli introiti pubblicitari. Anche il progetto di Google Book Search, una gigantesca scansione dei libri disponibili nelle biblioteche partner , va nella stessa direzione.
La sfida del web del futuro: il web del futuro dovrebbe perciò non abbandonare lo spirito di condivisione della conoscenza, mirando anzi ad aumentare le opportunità di accesso senza creare condizioni di monopolio o meccanismi di sfruttamento a causa della “chiusura” di spazi ad opera del più forte.
Cap 4 – Cercare e organizzare
Il paradosso della ricerca secondo Platone
Il problema della ricerca è più antico del web. Platone nel dialogo intitolato Menone ce lo spiega così: non è possibile trovare ciò che sappiamo già perché non c’è nulla da aggiungere e non si può trovare ciò che non sappiamo perché non esiste alcuna traccia che ci potrebbe condurre alla scoperta di ciò che stavamo cercando. La proposta di soluzione del problema da parte di Socrate (che è colui che parla nel discorso di Platone) risiede nelle nostre preconoscenze inconsce, dovute a una nostra esistenza preumana.
Anche Cartesio affronta questo argomento: egli ci invita a considerare che quando cerchiamo una nuova conoscenza lo facciamo a partire da un’idea chiara di cosa dobbiamo trovare, sebbene ne ignoriamo ancora i dettagli. Il processo cognitivo è il prodotto di quello che sappiamo già più le nostre ipotesi su quello che ancora ignoriamo.
ultimi anni i principali motori di ricerca hanno iniziato a usare le query suggestions, cioè suggerire la prosecuzione di una query o correggere un errore di ortografia.
La parte essenziale da studiare è l’ algoritmo ranking , ma bisogna tener conto che nessuno conosce il suo esatto funzionamento (esclusi pochi dipendenti di Google) e che è costantemente modificato per essere migliorato. L’idea di base di questo algoritmo per l’attribuzione del rango è lo sfruttamento delle interconnessioni tra le pagine del web come una valutazione dell’autorità delle pagine stesse. L’autorevolezza di una pagina non è un valore a sé, ma si costruisce in base ai link che puntano a quella pagina. Se una pagina ha autorevolezza 10 e contiene 5 link ad altre pagine, allora trasferirà su di esse il valore della sua autorevolezza (10) suddivisa fra tutte(5), quindi ognuna otterrà 2 punti. L’idea di PageRank consiste nell’attribuire a ogni link il valore di una citazione positiva e quindi considerarlo come un voto favorevole attribuito dalla pagina dalla quale parte il link. Da quando la rete si è espansa però questo meccanismo si è molto complicato.
Negli anni ’90 esistevano già altri modi per indicizzare le pagine della rete, che funzionavano in base a meccanismi diversi, ma non ebbero altrettanto successo come Google.
Il sistema che usa Google per immagazzinare i dati si basa su una tecnologia chiamata the cloud e consiste non nell’utilizzo di enormi macchine potenti, ma sulla connessione di molte macchine poco performanti.
Le tecniche che venivano usate di infomation retrieval, derivano dalla gestione tipica dei database, ma la rete è molto più vasta, meno coerente e cambia più rapidamente. Queste tecniche non sono adeguate per il web.
Che cosa non va nei motori di ricerca?
Il Sistema PageRank funziona bene per pagine nodali o molto popolari, ma non altrettanto per pagine minori. Se cerchiamo qualcosa che già conosciamo, sarà sufficiente inserire le parole chiave per trovarlo. Ma nel caso in cui invece non lo conosciamo, allora il PageRank sarà determinante per le nostre scoperte. Non sapremo mai se quello che abbiamo trovato era davvero ciò di cui avevamo bisogno. Inoltre nell’attribuire un voto gli algoritmi di ranking confondono autorevolezza e popolarità. Ci sono quindi molti rischi nell’affidarsi ciecamente ai motori di ricerca.
Search engine optimizers : sono agenzie che si occupano di migliorare la visibilità delle pagine web. Operano attraverso tecniche di boosting ( incremento) e di hiding (occultamento). Le prime amplificano la rilevanza e l’importanza di alcune pagine, mentre le seconde nascondo all’occhio dell’utente le tecniche adottate per migliorare la rilevanza di un certo oggetto web. Se fossero diffuse molte filosofie diverse da parte dei motori di ricerca, sarebbe molto difficile tentare di ingannare i crawlers con queste tecniche. D’altra parte è anche scontato dire che è meglio avere dei motori di ricerca che doversi cercare da soli le risorse nella rete!
La lista dei primi dieci o venti siti che un motore di ricerca trova in relazione a un concetto, ci fornisce il contesto e la rappresentazione che il motore ci dà a quel riguardo. Ma cercando la stessa parola in due lingue diverse si ottengono risultati diversi. Se si cerca “Italia” si ottengono informazioni istituzionali, ma se lo si cerca in inglese si trovano info turistiche.
Strumenti di ricerca alternativi ai motori generalisti
I metamotori : non hanno un deposito di info, non usano crawlers e non possiedono un indice sui loro server. Quando ricevono un’interrogazione, cercano le informazioni sui principali motori di ricerca e ne restituiscono i risultati in maniera omogenea. Esempi sono: Clusty, Ixquick e Kartoo.
Gli strumenti di ricerca “semantici” : cercano di organizzare le risorse di qualità o di sfruttare la comunità di utenti e sviluppatori per migliorare le proprie prestazioni. Esempi sono: Powerset (che interroga Wikipedia),
Freebase e WolframAlpha (si autodefinisce un motore di conoscenza computazionale; organizza le info provenienti da fonti ufficiali di fisica, chimica e matematica).
L’ invisible web coincide con quella parte della rete impossibile da frequentare attraverso i normali motori di ricerca. Ad esempio Deepdyve è uno degli strumenti che vuole superare le difficoltà di conoscenza e mettere l’utente in contatto con questo mondo.
www.archive.org si occupa di archiviare tutte le pagine web esistite. Inserendo l’Url di una pagine non più esistente, si sarà rimandati alla pagina che prima corrispondeva a quel Url.
Il nuovo ruolo sociale dei motori di ricerca fra etica e politica
1986 Richard Mason, pioniere dell’etica dell’informatica, individuò 4 sfide cruciali dell’età dell’informazione: privacy, accuratezza, proprietà e accessibilità. Queste sfide sono ancora aperte e al loro cuore troviamo i motori di ricerca.
Un caso interessante è quello di Google Book Search, che pretende di diffondere libri a scapito dei diritti d’autore e delle case editrici. La collaborazione con le biblioteche è stata pagata da Google a peso d’oro. La tendenza dei fornitori di servizi è ritenere di avere il diritto di appropriarsi del contenuto residente nelle proprie macchine, a completo detrimento dell’autore che lo avesse prodotto.
Il caso della privacy è il più delicato, infatti molte volte si è dovuto ricorrere a correggere le leggi e a farne di nuove.
Anche la censura è un tema scottante, in particolare basta vedere il caso della Cina. Gli utenti non possono accedere a tutti i contenuti e i motori di ricerca hanno dovuto sacrificare parte della loro deontologia democratica. Google è stato costretto ad autocensurare sia il motore delle news cinese e sia il motore di ricerca generale.
Google ha però oscurato nelle ricerche alcune pagine anche per altri motivi, ad esempio se avevano usato dei metodi illeciti per avere più visibilità. Chiaramente in uno stato di quasi monopolio nei motori di ricerca, è chiaro che questa tecnica di censura è molto pericolosa. Se fossero oscurate pagine di oppositori per scopi politici? La tecnologia deve essere regolata da leggi internazionali, non può regolarsi da sola. Per questo è importante il ruolo di un umanista digitale, che contribuisca a costruire il movimento volto a modificare le scelte sia a livello degli strumenti di ricerca e sia a livello delle responsabilità dei governanti.