Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Competenze digitali appunti, Appunti di Sistemi Digitali

Competenze digitali appunti del anno 2025

Tipologia: Appunti

2024/2025

Caricato il 12/06/2026

kseniia-volkova-1
kseniia-volkova-1 🇮🇹

1 documento

1 / 9

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
COMPETENZE DIGITALI PER I BENI CULTURALI
Esame: un progetto singolo scegliendo una delle tecnologie digitali
con piccolo report da discutere all’esame
Alcuni dicono che siamo entrati nell’era del POST-DIGITAL– parola fondata
dall’informatico digitale Kim Cascone – è finito il momento in cui il mondo
digitale è dirompente, è ormai diventato qualcosa di comune. Era parzialmente
vero 25 anni fa, è sicuramente vero oggi: passiamo da degli aspetti analogici a
quelli digitali con estrema facilità. L’interazione che si crea fra i vari tipi di
tecnologia digitale e tutto l’analogico crea il MONDO POST-DIGITALE – non un
superamento del mondo digitale, ma un’ibridazione da cui possono nascere
cose nuove in tutti gli ambiti.
Ora siamo in un mondo in cui c’è tutta una parte algoritmica (legata all’AI etc)
per cui dobbiamo chiederci se siamo in una fase post-algoritmica, in quanto
l’utilizzo dell’intelligenza artificiale è ancora abbastanza dirompente. In questo
ambito si colloca il futuro lavoro di chi lavorerà nei beni culturali.
Quando ragioniamo su quello che è il mondo digitale, quello che
fondamentalmente ci interessa è come elaborare, raccogliere e gestire i dati
che vengono dal mondo dei beni culturali = focalizzarci sui dati.
Dati = il dato è un insieme di valori che possono essere composti da variabili
qualitative o quantitative ( devo descrivere i quadri di una pinacoteca = utilizzo
dei dati quantitativi come le dimensioni o qualitativi come la descrizione delle
opere etc)- Ci sono dei dati processati e non processati (non esiste il “dato
grezzo”: anche quando non sono ancora corretti dal ricercatore, si tratta del
dato base ma non del dato grezzo, visto che comunque sono stati utilizzati
degli strumenti etc). Uno quindi è il dato prodotto all’inizio (dato non
processato), l’altro è un dato in qualche modo corretto da un intervento
successivo.
Inoltre, i dati non sono dei dati che esistono “di per sé”, ma sono dei dati che
noi in qualche modo co-creiamo assieme ad uno strumento. Il dato è quindi un
insieme di varie scelte che fanno si che il dato venga creato = il dato non è
neutro (come una fotografia) – il dato è una creazione comune, perché se
consideriamo il dato come esistente di per sé, il risultato è che analizzando
quei dati si arrivi ad una forma di verità / mentre con il dato come creato posso
utilizzare dei dati ma sono sicuro che alla fine avrò delle verosimiglianze, delle
probabilità.
Possiamo scegliere se tenere i dati chiusi o aperti -> OPEN DATA MOVEMENT
(come open access per le pubblicazioni, quindi posso accedere ad una risorsa
in maniera aperta e gratuita senza che ci siano blocchi di nessun genere). Un
dato è aperto quando ognuno lo può riutilizzare come gli pare, e l’unica cosa
che gli si può chiedere è definire chi sia l’autore e far si che anche i propri dati
siano aperti a loro volta; non si tratta di una idea nuova: nasce negli anni ’50,
pf3
pf4
pf5
pf8
pf9

Anteprima parziale del testo

Scarica Competenze digitali appunti e più Appunti in PDF di Sistemi Digitali solo su Docsity!

COMPETENZE DIGITALI PER I BENI CULTURALI

Esame: un progetto singolo scegliendo una delle tecnologie digitali con piccolo report da discutere all’esame Alcuni dicono che siamo entrati nell’era del POST-DIGITAL– parola fondata dall’informatico digitale Kim Cascone – è finito il momento in cui il mondo digitale è dirompente, è ormai diventato qualcosa di comune. Era parzialmente vero 25 anni fa, è sicuramente vero oggi: passiamo da degli aspetti analogici a quelli digitali con estrema facilità. L’interazione che si crea fra i vari tipi di tecnologia digitale e tutto l’analogico crea il MONDO POST-DIGITALE – non un superamento del mondo digitale, ma un’ibridazione da cui possono nascere cose nuove in tutti gli ambiti. Ora siamo in un mondo in cui c’è tutta una parte algoritmica (legata all’AI etc) per cui dobbiamo chiederci se siamo in una fase post-algoritmica, in quanto l’utilizzo dell’intelligenza artificiale è ancora abbastanza dirompente. In questo ambito si colloca il futuro lavoro di chi lavorerà nei beni culturali. Quando ragioniamo su quello che è il mondo digitale, quello che fondamentalmente ci interessa è come elaborare, raccogliere e gestire i dati che vengono dal mondo dei beni culturali = focalizzarci sui dati. Dati = il dato è un insieme di valori che possono essere composti da variabili qualitative o quantitative ( devo descrivere i quadri di una pinacoteca = utilizzo dei dati quantitativi come le dimensioni o qualitativi come la descrizione delle opere etc)- Ci sono dei dati processati e non processati (non esiste il “dato grezzo”: anche quando non sono ancora corretti dal ricercatore, si tratta del dato base ma non del dato grezzo, visto che comunque sono stati utilizzati degli strumenti etc). Uno quindi è il dato prodotto all’inizio (dato non processato), l’altro è un dato in qualche modo corretto da un intervento successivo. Inoltre, i dati non sono dei dati che esistono “di per sé”, ma sono dei dati che noi in qualche modo co-creiamo assieme ad uno strumento. Il dato è quindi un insieme di varie scelte che fanno si che il dato venga creato = il dato non è neutro (come una fotografia) – il dato è una creazione comune, perché se consideriamo il dato come esistente di per sé, il risultato è che analizzando quei dati si arrivi ad una forma di verità / mentre con il dato come creato posso utilizzare dei dati ma sono sicuro che alla fine avrò delle verosimiglianze, delle probabilità. Possiamo scegliere se tenere i dati chiusi o aperti -> OPEN DATA MOVEMENT (come open access per le pubblicazioni, quindi posso accedere ad una risorsa in maniera aperta e gratuita senza che ci siano blocchi di nessun genere). Un dato è aperto quando ognuno lo può riutilizzare come gli pare, e l’unica cosa che gli si può chiedere è definire chi sia l’autore e far si che anche i propri dati siano aperti a loro volta; non si tratta di una idea nuova: nasce negli anni ’50,

dopo il congresso dell’anno geofisico nazionale in cui gli ricercatori vollero mettere a disposizione i propri dati geofisici velocizzando la ricerca e diminuendo il rischio di perdita.

  • Nel 1965 decisero che non solo i dati dovessero essere aperti, ma che fossero anche in dei formati leggibili da un computer (machine-readable).
  • Nel 2004 l’OCSE decise che tutti i dati pubblici dovevano essere resi al pubblico come dati aperti
  • nel 2013 il parlamento europeo decise che ad essere aperti non dovevano essere aperti solo i dati di genere pubblico ma anche quelli sul patrimonio culturale. La prima cosa che venne aperta furono le mappe geografiche. Lo stesso anno si decise che i dati delle amministrazioni pubbliche dovevano essere aperti di default, per non essere aperti bisogna dire perché non lo sono. Problema: non ci sono meccanismi coercitivi. I formati non sono tutti uguali, possiamo trovare ad esempio dei PDF, ma essi non sono formati aperti perché si devono trovare dei modi per estrarre delle informazioni. Dei formati effettivamente aperti sono come CSV (comma- separated values) , formato di testo in cui è come se ci fosse una tabella e le informazioni sono divise dalle virgole e dalle virgolette. Il formato fa la differenza: a seconda del formato le informazioni sono costruite in maniera diversa. Le licenze ci dicono che cosa possiamo fare con i dati, e le licenze aperte sono definite dalla fondazione Creative Commons, la quale ha creato dei tipi di licenze e ha tradotto in una quarantina di lingue, così quando troviamo un prodotto in una lingua che non conosciamo sappiamo che cosa dobbiamo fare. Licenze aperte:
  • Cc by = i miei dati vengono resi pubblici e possono essere citati usando autore o autrice
  • CC by sa (sharealike) = quando utilizzo dei dati aperti devo ridistribuirli in maniera aperta
  • CC zero = il dataset è di dominio pubblico e ognuno può fare quello che vuole senza citare l’autore Si possono trovare dati con i copyleft (simbolo dell’uguale, vedi slides) non completamente aperti – posso utilizzare i dati ma non posso ridistribuirli; oppure no commercial = non si possono rivendere. Metadati = come delle etichette, è la descrizione del contenuto del nostro dataset = chi lo ha fatto, quando, in che lingua, il soggetto, che tipo di formati di file sono, che tipo di estensione cronologica o spaziale – i metadati ci permettono quindi di trovare i dati online. Si usa quindi l’acronimo FAIR per descrivere i dati accessibili online:

- Findable – necessario quindi identificatori persistenti

- Interoperabili: da un punto di vista semantico (cioé che si possano

parlare tra di loro) e tecnologico (che utilizzino dei protocolli Internet che permettano la rielaborazione). Queste informazioni sono legate ai dati, e all’interno del web semantico ci sono vari tipi di risorse: possono essere immagini, orari, pagine web… - ogni informazione è indipendente, non deve stare necessariamente dentro un database gerarchico, ma si può collegare grazie ai metadati. Ogni risorsa si dice che è autodescrittiva: non ci interessa il contenitore, ma la singola cosa.

Per “ risorsa” noi intendiamo tutto ciò che può essere riferito ad un URL, è un

indirizzo: dice che quella risorsa sta in quella posizione. Per essere utilizzabile quella risorsa deve rimanere lì per poi poterla ricercare. La risorsa deve essere riferita ad un indirizzo Internet. Ci permette di unire le risorse il concetto di LINKED DATA/LINKED OPEN DATA (LD/LOD) – sono delle risorse che sono connesse ad altre risorse, attraverso un sistema leggibile sia dagli umani che dalle macchine. Ogni oggetto non sta più da sé, ma è collegabile agli altri in qualche modo.

Ontologie = sono la concettualizzazione di una parte della conoscenza. Le

ontologie servono ad esprimere i concetti legati a quella disciplina. Esistono quindi:  ontologie di dominio, specifiche per diverse discipline (botanica, beni culturali)  ontologie fondazionali (interdisciplinari, linguaggio generale). Tutte le informazioni che devono esprimere la nostra risorsa stanno nei metadati. La descrizione per rendere i metadati veramente “linked” va nei metadati. (tieni a mente per il progetto d’esame, chiedi chiarimenti se rimane poco chiaro come).

Dublin core = località dell’Ohio dove c’è stata una conferenza di bibliotecari

dove si è discusso di come tutti potessero avere le stesse informazioni riguardo ai libri – si tratta quindi di uno schema di metadati. Ci sono due versioni, una di 15 elementi e una di 33 elementi (avanzato), ma il concetto è lo stesso. Vd slide con gli elementi da compilare – si tratta di uno schema applicabile a qualsiasi tipo di risorsa, non solo libri. Ogni elemento è ripetibile, l’ordine è quello che vogliamo perché non c’è una struttura gerarchica. Gli elementi non descrivono il libro fisico, ma la risorsa digitale. Per rendere effettivamente i dati linked bisogna andare avanti: infatti nei linked data bisogna scrivere per intero, in maniera semantica attraverso le ontologie i dettagli relativi all’oggetto. Ciò funziona grazie al sistema dell’RDSF (resource description framing) -> struttura: soggetto – predicato – oggetto. Ex. GG  ha fatto  la statua brutta = per creare effettivamente i collegamenti dobbiamo utilizzare degli URI (uniform research identifier) dove si spiega cosa

si intende con ogni elemento (in questo caso GG), fondamentalmente quindi una pagina web che descrive questo elemento. “Ha fatto” viene descritto in maniera specifica tramite l’ontologia, e poi per “la statua brutta” abbiamo due possibilità, o URI, altrimenti ci potremmo trovare di fronte ad un caso di mancanza. Però se dico che “la statua brutta” sta a Pisa, anche Pisa avrà una URI e quindi si troverà un URI per “la statua brutta” (ricercando Pisa, troverò anche “la statua brutta”) – il risultato è che vado ad ampliare le informazioni. Non esiste una gerarchia per le connessioni che si possono creare. Non c’è un limite, anzi più triplette si creano più ci sono connessioni.

Ci sono URI per qualsiasi cosa, anche le relazioni – friend of a friend (OAF), per

esprimere le relazioni umane nella nostra vita che ci legano alle persone.

Dbpedia sono le informazioni di wikipedia trasformate in linked data.

Usare RDF e contenuti – abbiamo un punto di partenza non per forza gerarchico, ci sono dei collegamenti con frecce orientate secondo i predicati. Anche i database stanno diventando a grafo perché non hanno una struttura così fortemente gerarchica. Soggetto – predicato – oggetto -> la tripla si rappresenta con un grafo e si chiama statement. Il soggetto può essere anche il punto di arrivo, più frasi mettiamo più abbiamo informazioni. E’ necessario disambiguare e inserire tutti i possibili nomi ed errori di ortografia di una determinata informazione, ci sono persone e intelligenze artificiali proprio preposte a questo. Si può creare un’unione di grafi (merging), senza dover ripartire ogni volta daccapo, dato che l’oggetto della prima statement diventa il soggetto della seconda. Le URI più sono meglio è: per Beethoven ce ne sono diverse, più ne mettiamo più il nostro grafo si espande. Una URI è uguale all’altra -> proprietà

owl:sameAs (vd).

Assieme al concetto delle ontologie dobbiamo ricordare il concetto dei vocabolari – classificano i termini che vengono usati in un determinato settore disciplinare, inoltre indicano le relazioni semantiche tra i concetti di un dominio di conoscenza. Possiamo utilizzare dei vocabolari che spiegano anche i materiali. I vocabolari possono disambiguare dei termini già in molte lingue, senza dover necessariamente specificare con sameAs. Esempi di vocabolari:  Heritage Data, con informazioni legate alle scienze archeologiche e ai metodi diagnostici che si possono utilizzare.  Art and Architecture Thesaurus per l’arte, le tecniche…  Iconoclass – vocabolario per l’iconografia.

adesso con l’evoluzione del computer le cose sono migliorate, non è cambiata l’idea ma lo strumento). A partire dagli anni Quaranta si sviluppano i primi calcolatori meccanici capaci di connettere i dati ma senza memoria. Successivamente, anni Cinquanta, primi sistemi di memorizzazione elettronica, ancora più sviluppati negli anni Settanta: Edgar Frank Codd introduce infatti il modello relazionale – prima i dati erano separati e rigidi (schema ad albero), adesso i dati diventano indipendenti dalla struttura fisica di memorizzazione del database. Negli anni Ottanta queste strutture diventano ancora più complicate, cominciano ad essere commercializzate. Negli anni Novanta nascono i database object-oriented, ovvero delle tabelle di dati che organizzavano i dati come oggetti, in possesso di proprietà e comportamenti. Quindi, non dobbiamo ogni volta andare a riscrivere determinate azioni, ma esse vanno automaticamente ad essere gestite. Oggi abbiamo fatto un grande passaggio: ci sono i databasse NoSQL, Graph Db – databsse basati su relazioni tra nodi o triplette (soggetto – predicato – oggetto). Informazione non più testuale ma semantica. Un database è una raccolta organizzata di dati strutturati che va a facilitarne l’inserimento, la gestione, la ricerca e l’analisi. Tutto parte dalla domanda di ricerca, e per potervi rispondere abbiamo bisogno di dati -> vanno organizzati in una struttura di immagazzinamento coerente, appunto i database. In base quindi alla nostra domanda di ricerca struttureremo i nostri dati in base alle esigenze della domanda di ricerca. Il concetto di database non va confuso con dataset -> il primo parte iniziale del progetto di ricerca, il secondo analisi, può derivare da un database, contengono solo dati omogenei, raccolte statiche, distribuiti in formati leggibili. Database -> struttura principale la tabella (entità), contiene l’oggetto della nostra ricerca (musei, siti archeologici, quadri…), composta da campi (colonna, vanno a descrivere una proprietà specifica della tabella), righe (record, singolo elemento o caso reale). Spesso le tabelle sono dotate di maschere (che permettono di visualizzare, inserire o modificare i dati in tabella. Fondamentalmente simile alla tabella degli attributi su QGis. La cella, ovviamente, rappresenta il dato – un elemento grezzo, descrizione elementare che presa singolarmente non vale niente, semplicemente un valore non ancora messo in comunicazione con niente. Un dato diventa informazione quando viene unito ad un contesto. I dati possono essere di vari tipi, vd foto slide. I dati possono essere anche omogenei o eterogenei -> omogenei: dati dello stesso tipo o formato (ex. Misure del quadro, tutte in cm), eterogeneo = dati di diversa natura, la grande sfida attuale è di fatto espandere i limiti incrociandosi anche con altre discipline per andare a acqusire informazioni anche da altre discipline – può essere un dato che mescola testo e numeri (ex. 5g di bronzo). Il dato è ciò che muove tutto: a partire dalla fase di:

  • Raccolta
  • Gestione
  • Analisi
  • Disseminazione I campi che creiamo hanno delle proprietà:
  • Nome del campo – identifica in modo univoco la colonna della tabella. Deve essere chiaro, descrittivo e privo di spazi. No maiuscole.
  • Tipo di dato – definisce il tipo di informazione del campo
  • Lunghezza – indica la dimensione massima dei dati (solo per tipi di testo o numerici) – comunque sempre relazionata alla tipologia di formato che vogliamo utilizzare. Formati:
  • Integer – sottolinea che il numero di informazione nella cella è un numero intero
  • Decimal o numerici – numeri con decimali e precisione definita
  • Float o real – numeri con virgola mobile (decimali variabili)
  • Text o varchar – testo, stringhe di caratteri (lunghezza variabile)
  • Char(n) – testo a lunghezza fissa
  • Date – data
  • Time – ora (ore minuti secondi)
  • Timestamp – data e ora insieme
  • Boolean – valori logici vero/falso (principali) Proprietà dei campi – vd slides. DBMS – Database management system Il Database viene gestito da un DBMS (Database Management System), ovvero un software che garantisce:
  • Persistenza – i dati restano memorizzatyi in modo affidabile su supporti di massa
  • Integrità – regole che assicurano coerenza e correttezza dei dati (entità referenziale)
  • Sicurezza – controllo degli accessi e protezione delle informazioni
  • Efficienza – operazioni di lettura/scrittura ottimizzate per i grandi volumi di dati Il DBMS non è un database, ma un sistema che gestisce il database. Perché utilizziamo i database? Vd slides. Tipologie di database, vd slides. La chiave primaria, in un’entità, è una sola, e non può essere cambiata.