Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Fondamenti di informatica 1, Sintesi del corso di Fondamenti di informatica

Riassunto del manuale di fondamenti di informatica 1

Tipologia: Sintesi del corso

2019/2020

Caricato il 04/01/2020

laura-bellotto
laura-bellotto 🇮🇹

7 documenti

1 / 10

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
CAP. 8: biblioteconomia e ricerca delle informazioni in
internet
8.1 La ricerca dell’informazione: oggetto e attori.
L’ambito umanistico è in continua evoluzione, accompagnata anche dal fatto che
vengono abbandonati determinati filoni di ricerca e soprattutto per il riuso delle
conoscenze. Questo particolare tipo di informazione è chiamato “letteratura di
riferimento”.
La produzione di conoscenze si basa sui dati: osservazione e rilevamenti di dati
o eventi oggettivi nonché dell’ambiente in cui si pongono; chiamiamo questo
ulteriore tipo di informazione “informazione fattuale”.
L’accesso all’informazione presuppone di sapere che l’informazione esiste e
dove trovarla.
Le informazioni sono entità astratte e per manifestarsi devono essere contenute
nei supporti. L’entità composta da un contenuto intellettuale e dal supporto sul
quale è registrato viene definito documento o risorsa informativa.
Accedere ad un contenuto vuol dire disporre di un oggetto analogico o digitale.
Attualmente una buona parte dell’informazione è registrata su documenti
digitali: l’accesso al contenuto è tecnologicamente mediato da un elaboratore
elettronico. Alcuni documenti digitali sono su supporti manipolabili o locali e
una massa si trova su supporti localmente remoti: server a centinaia di
chilometri dall’utente.
Le nuove tecnologie hanno consentito al diffusione di contenuti non testuali:
immagini o suono assistendo al fenomeno della multimedialità cioè alla
coesistenza all’interno di uno stesso documento, di diverse forme di contenuto.
Esistono poi le risorse continuative ovvero documenti che consistono in più
parti che vanno ad aggiungersi al contenuto iniziale.
Nel web la modifica di quelli esistenti è facile e veloce e si parla in questo senso
di risorse integrative.
Ogni documento non digitale ha un proprio ciclo di vita che è definita dal
periodo di tempo nel quale l’informazione che esso contiene è aggiornata o
rilevante, perciò sempre è opportuno valutare il grado di aggiornamento di un
documento.
Nel web è sempre difficile stabilire il confine del documento reso indefinito dalla
presenza di contenuti esterni integrati sia da web feeds e questo fenomeno viene
definito riaggregazione dei contenuti.
pf3
pf4
pf5
pf8
pf9
pfa

Anteprima parziale del testo

Scarica Fondamenti di informatica 1 e più Sintesi del corso in PDF di Fondamenti di informatica solo su Docsity!

CAP. 8: biblioteconomia e ricerca delle informazioni in

internet

8.1 La ricerca dell’informazione: oggetto e attori. L’ambito umanistico è in continua evoluzione, accompagnata anche dal fatto che vengono abbandonati determinati filoni di ricerca e soprattutto per il riuso delle conoscenze. Questo particolare tipo di informazione è chiamato “letteratura di riferimento”. La produzione di conoscenze si basa sui dati: osservazione e rilevamenti di dati o eventi oggettivi nonché dell’ambiente in cui si pongono; chiamiamo questo ulteriore tipo di informazione “informazione fattuale”. L’accesso all’informazione presuppone di sapere che l’informazione esiste e dove trovarla. Le informazioni sono entità astratte e per manifestarsi devono essere contenute nei supporti. L’entità composta da un contenuto intellettuale e dal supporto sul quale è registrato viene definito documento o risorsa informativa. Accedere ad un contenuto vuol dire disporre di un oggetto analogico o digitale. Attualmente una buona parte dell’informazione è registrata su documenti digitali: l’accesso al contenuto è tecnologicamente mediato da un elaboratore elettronico. Alcuni documenti digitali sono su supporti manipolabili o locali e una massa si trova su supporti localmente remoti: server a centinaia di chilometri dall’utente. Le nuove tecnologie hanno consentito al diffusione di contenuti non testuali: immagini o suono assistendo al fenomeno della multimedialità cioè alla coesistenza all’interno di uno stesso documento, di diverse forme di contenuto. Esistono poi le risorse continuative ovvero documenti che consistono in più parti che vanno ad aggiungersi al contenuto iniziale. Nel web la modifica di quelli esistenti è facile e veloce e si parla in questo senso di risorse integrative. Ogni documento non digitale ha un proprio ciclo di vita che è definita dal periodo di tempo nel quale l’informazione che esso contiene è aggiornata o rilevante, perciò sempre è opportuno valutare il grado di aggiornamento di un documento. Nel web è sempre difficile stabilire il confine del documento reso indefinito dalla presenza di contenuti esterni integrati sia da web feeds e questo fenomeno viene definito riaggregazione dei contenuti.

8.1.2: l’information retrival. Il punto di partenza nella ricerca di una informazione è la percezione di una lacuna di una conoscenza. Ciò viene indicato con l’acronimo ASK e da questa lacuna nasce un’esigenza informativa che costituisce la motivazione a intraprendere la ricerca stessa. L’utente sceglie tra una serie di alternative:

  1. rivolgersi ad un esperto per ricevere l’informazione desiderata o l’indicazione di una o più fonti nel quale ricavarla.
  2. Interrogare il catalogo in biblioteca, per reperibili le possibili fonti dell’informazione.
  3. Consultare un documento pertinente per ricavarne l’informazione desiderata.
  4. Consultare un documento pertinente per reperire nella bibliografia altre possibili fonti dell’informazione. L’ information retrival , è l’attività di selezione dell’informazione rilevate all’interno di una collezione di documenti ben organizzata. L’IR è un processo interattivo o comunicativo che comincia con una domanda e termina con una risposta fornita da un sistema che raccoglie e indicizza (creazione di una segnalazione per favorirne il reperimento) l’informazione stessa. Il sistema IR informa l’utente sull’esistenza e sulla localizzazione dell’esistenza delle fonti e dove poterle trovare. Il processo di IR è una selezione attuata sulla totalità delle informazioni disponibili: l’utente non è interessato a tutte le informazioni ma solo quelle che hanno determinate caratteristiche di suo interesse. Alcuni IR forniscono il risultato per grado di rilevanza regolato da algoritmi di calcolo, inoltre i sistemi IR processano solo stringhe di testo, non il loro significato. L’IR risale agli anni 50 del ‘900 ed è una disciplina se stante e non presuppone l’utilizzo di tecnologie informatiche poiché i primi strumenti IR sono nati 4000 anni fa e via via si sono evoluti ma hanno avuto il loro punto di svolta con la nascita del world wide web che ha reso disponibile una quantità enorme di informazioni ad un pubblico vasto ed eterogeneo. 8.2 indicizzazione dei documenti e metadati. Considerando: “ il relatore mi ha consigliato di consultare il famosissimo libro di Umberto Eco sulla stesura della tesi”. Per trasmetterla ad un sistema di IR dobbiamo tradurla in una richiesta (query), costituita da una stringa o più di testo che deve prevedere determinate caratteristiche. Prendendo ad esempio google bisogna digitare nella casella di immissione, si otterranno in questo caso tantissimi risultati e ciò accade perché i motori di ricerca generici come google qualificano i termini come parole

8.2.3: l’uso dei metadati. I metadati possono essere registrati internamente ed esternamente al documento primario. In ambito analogico i metadati sono registrati sempre esternamente costituendo un surrogato o un documento secondario, lo stesso vale per i documenti digitali locali. Nel caso dei documenti digitali remoti, quasi tutti i formati dispongono di TAG posti nella parte iniziale del file cosicché l’autore della risorsa può incorporare alcuni metadati nel documento. I motori di ricerca generalisti come google non indicizzano i metadati nelle pagine che visitiamo poiché l’indicizzazione viene effettuata solo da motori di ricerca specializzati. I metadati inoltre si possono trovare anche sotto forma di citazione o criptobibliografia, ma anche di link diretti. Gli indici sono liste di citazioni bibliografiche di documenti appartenente a determinate categorie su determinati argomenti prodotti da determinati autori. I surrogati vengono gestiti in modalità database come nei cataloghi online delle biblioteche. Gli indici e i database di metadati sono risorse informative che possono essere raccolte in indici di indici, indici di database ecc. 8.3 la biblioteca come sistema di informational retrival. La biblioteca è l’istituzione che ha come missione il rendere liberamente accessibili le informazioni di interesse per il pubblico di riferimento, essa predispone e organizza i documenti secondo diverse funzioni:  seleziona e acquisisce i documenti;  li dispone entro la collezione;  ne segnala la presenza agli utenti;  ne facilita la ricerca e l’acceso attraverso il servizio di reference;  ne gestisce la circolazione attraverso prenotazioni, prestito e regolamentazione della creazione di copie analogiche e digitali;  ne gestisce la conservazione;  al termine del ciclo di vita del documento ne decide lo scarto. La biblioteca raccoglie principalmente documenti di stampa ed eventualmente anche microfonati o audio e videocassette. Oggi la biblioteca acquisisce documenti digitali sia testuali e multimediali e si presentano come aggregati in super- risorse che comprendono centinaia di risorse di vario tipo, disponibili in internet che spinge la biblioteca ad una selezione di risorse liberamente accessibili in rete. Anche l’utenza è cambiata: nella società dell’informazione la conoscenza è considerata una risorsa strategica sempre più irrinunciabile. Si pone quindi per la biblioteca il confronto con le nuove realtà di circolazione e gestione delle conoscenze. Tale integrazione consiste soprattutto sullo scambio di dati biografici con altri servizi informativi consentendone un utilizzo ben più ampio.

8.3.2: l’IR in biblioteca. Gli strumenti di IR usati dalle biblioteche sono gli indici o elenchi ordinati. Gli indici in biblioteca si concretizzano nella disposizione fisica dei documenti e negli indici di registrazione bibliografiche o cataloghi. Nelle biblioteche a scaffale aperto i documenti sono disposti secondo un ordinamento numerico, e questo costituisce la prima parte della segnatura , esso normalmente è seguito da una stringa alfabetica che crea un ordinamento di secondo livello ovvelo il numero Dewey (es. 808.02 ECO COM). Il numero decimale 808.02 indica nel codice dewey la classificazione per argomento, in questo caso letteratura. La stringa alfabetica è costituita dalle prime tre lettere del cognome dell’autore e del titolo. Il browsing a scaffale fornisce il vantaggio di consentire la valutazione di alcune caratteristiche del documento che orientano l’utente nella scelta. Vi sono però particolari sezione a scaffale chiuso al quale possono accedere sono i dipendenti della biblioteca; infine non è detto che l’utente conosca del documento il metadato utilizzato. Per superare questi limiti le biblioteche compilano delle mappe dette catalogo, in cui ogni documento è supportato dalla scheda catalografica: contiene l’intersezione, il metadato, l’indicazione sulla collocazione, una descrizione. Questi criteri costituiscono un importante strumento di IR che offre all’utente uno strumento di valutazione del documento in fase di consultazione del catalogo. L’intersezione determina il tipo di catalogo: nel catalogo per autore/titolo i documenti vengono inseriti alfabeticamente in base al cognome dell’autore; nel catalogo per soggetto i documenti sono inseriti alfabeticamente in base ad una stringa di testo che esprime l’argomento del documento. Entrambi i cataloghi sono consultabili tramite liste di browsing, elenchi di record formativi ridotto, presenti in un elenco ordinato scorribile a partire da un punto qualsiasi della lista, anche se questi cataloghi erano limitati al materiale monografico. A partire dagli anni 60 del secolo scorso il catalogo fu presente online e l’utente può consultare il catalogo anche all’esterno dei locali della biblioteca. 8.3.3: i principi della catalogazione bibliotecaria. La catalogazione è la più antica forma di creazione di metadati: è una tradizione millenaria risalente alle biblioteche sumere e babilonesi. Oggi la disciplina della catalogazione è una parte della biblioteconomia (disciplina che attiene tutte le funzioni della biblioteca). La catalogazione attuale è basata su principi concordati a livello internazionale essi specificano la funzione del catalogo e le regole guida per la creazione delle registrazioni bibliografiche dei documenti che fanno parte del mondo bibliografico. È dal 2009 la creazione dei nuovi principi internazionali di catalogazione.

8.3.6: le relazioni bibliografiche. Tra le funzioni dei cataloghi vi è quella di consentire la navigazione tra registrazioni di documenti a priori e a posteriori. Per capire la differenza si effettua una ricerca nell’OPAC BNCF e otterremo una serie di documenti disparati la cui unica caratteristica in comune è l’appartenenza alla stessa serie, tra di essi ve ne sono alcuni collegati. Queste relazioni sono importanti ai fini dell’IR poiché l’utente deve essere indirizzato alla versione più aggiornata del documento  metadati di legame. Un documento consiste in una componente astratta e una fisica; dividiamo queste due entità in altre quattro: chiamiamo opera il contenuto intellettuale del documento; espressione il modo in cui si realizza l’opera; manifestazione l’oggetto fisico in cui l’espressione si materializza; esemplare la singola copia che esemplifica la manifestazione. Con questa suddivisione avremo fra due documenti:  relazione di equivalenza: nel cui cambia solo l’oggetto fisico di supporto e la manifestazione;  relazioni derivative: cambia la sua espressione (traduzioni, nuove edizioni, revisioni, traduzioni);  relazioni descrittive: cambia il contenuto intellettuale (l’opera), perché uno dei due documenti commenta, critica o recensisce l’alto. Esistono relazioni che ne costituiscono la parte logica:  relazioni sequenziali: in cui un documento continua l’altro;  relazioni di accompagnamento: un documento si aggiunge ad un altro. Tali relazioni non vanno confuse con quelle semplici che legano un documento nelle sue parti fisiche. L’utilizzo del metadato di legame “traduzione di” consente la navigazione diretta alla versione in lingua originale. 8.3.7: la catalogazione semantica: il soggetto La soggettazione consiste nella creazione di una o più stringhe di testo che sintetizzano l’argomento principale del documento. Il processo di creazione dl soggetto viene effettuato secondo gli standard nazionali Italiani del “nuovo soggettario”. Il catalogatore procede inizialmente all’analisi concettuale del documento che consiste nella presa visione delle parti del paratesto che contengono informazioni di tipo semantico: il titolo, l’indice dei contenuti, le parti introduttive o about, gli abstract. Se il catalogatore non trova le fonti con l’indicazione precisa deve procedere alla costruzione dell’argomento. A questo punto il catalogatore dispone di un abbozzo chiamato enunciato di soggetto tradotto i una stringa di soggetto. Sistemi di incizzazione come la soggettazione vengono detti pre-coordinanti. Oggi la modalità dei semantica più diffusa è la post-coordinazione, poiché è l’utente con la costruzione della query a ordinarli con gli operatori di ricerca.

In particolare gli operatori booleani, and e or vengono utilizzati per esprimere le relazioni tra due termini di ricerca, not per escludere uno o più termini. L’operatore OR allarga la ricerca mentre AND e NOT la restringono. 8.3.8: la catalogazione semantica: la classificazione. La classificazione si basa sull’utilizzo di uno schema di classificazione bibliografica. Vi sono schemi generali estesi a tutto il mondo come la classificazione decimale dewey e schemi specialistici limitati ad una singola disciplina chiamata MSC. A livello mondiale il sistema più diffuso è la classificazione decimale dewey (CDD). Essa è stata ideata da Melvil Dewey a metà del XIX sec. E l’ultima edizione risale al 2003. L’intero sapere umano è diviso in 10 aree disciplinari principali riprendendo la classificazione ideata dal filoso Francis Bacon. La classe 000è sui generis e la si definisce afferente alla facoltà di autoriflessione della ragione: riguarda la conoscenza in generale e il modo di organizzarla. Nella classificazione l’argomento è rappresentato da un codice di classificazione: il codice CDD è in notazione numerica pura. Ogni argomento è rappresentato da un numero decimale composto da 3 cifre: la cifra delle centinaia rappresenta una delle dieci classi; la cifra delle decine una delle dieci suddivisioni di ogni classe; la cifra delle unità una delle dieci sezioni. A quasi ogni cifra possono essere accodate alcune cifre aggiuntive che rappresentano particolari aspetti sotto i quali un argomento è considerato. La gerarchia dei concetti viene espressa dalla lunghezza della stessa notazione: dato un argomento il cui codice è formato da un certo numero di cifre, esso è subordinato a quelli che hanno una notazione di cifra più breve ed è sovraordinato rispetto a quelli che hanno una cifra in più e soggetti con pari numero di cifre sono coordinati hanno lo stesso livello di gerarchia. La CDD viene utilizzata in biblioteca per disporre i documenti a scaffale: il numero dewey rappresenta la posizione del documento entro la collezione. Alcuni OPAC propongono un navigatore dewey tramite i quali i documenti vengono raggruppati dall’ambito disciplinare di appartenenza. 8.3.9: il controllo del vocabolario. Ci chiediamo quale vocabolario o linguaggio di indicizzazione viene usato dal catalogatore, esso è di due tipi:  linguaggi di indicizzazione non controllata: derivano i termini del documento stesso attraverso il titolo o altre parti significative del documento e le liste di keyword sono le più semplici perché elencano alfabeticamente i termini derivati.  Linguaggi di indicizzazione controllati: assegnano ai vari concetti, termini appositamente scelti e il vocabolario controllato è una lista in ordine alfabetico dei termini e indica anche i termini non preferiti e solitamente si tratta di sinonimi.

8.4.2: le biblioteche e la disseminazione di contenuti digitali. Un ruolo importantissimo è svolto dalle biblioteche perché si pongono come produttori di contenuti attraverso la creazione e la gestione di database a tempo pieno. Esistono tre tipologie di strumenti offerti dalle biblioteche:

  1. una digital library: che consiste in una collezione di documenti digitali in rete con una funzionalità tecniche per selezione, creazione, reperimento , utilizzo e conservazione dei documenti stessi. I documenti contenuti nelle DL possono essere digitalizzazioni di documenti analogici che consente l’accesso a materiali fragili;
  2. un archivio aperto: rende liberamente disponibili i propri contenuti e consente l’autoarchiviazione da parte degli autori dei propri documenti soprattutto in ambito accademico.
  3. Riviste scientifiche ad accesso aperto: sono riviste classiche ma cambia il modello di pubblicazione poiché non sono i lettori a pagare la rivista ma le istituzioni a cui afferiscono gli autori a sostenere i costi per la pubblicazione.