Docsity
Docsity

Prepara i tuoi esami
Prepara i tuoi esami

Studia grazie alle numerose risorse presenti su Docsity


Ottieni i punti per scaricare
Ottieni i punti per scaricare

Guadagna punti aiutando altri studenti oppure acquistali con un piano Premium


Guide e consigli
Guide e consigli


Slide Informatica - Appunti TUTTE, Appunti di Elementi di Informatica

Slide Informatica della comunicazione

Tipologia: Appunti

2018/2019

Caricato il 30/01/2019

alessia_piora
alessia_piora 🇮🇹

4

(9)

7 documenti

1 / 34

Toggle sidebar

Questa pagina non è visibile nell’anteprima

Non perderti parti importanti!

bg1
Sistemi complessi (es. organizzazioni, istituzioni, grandi aziende) intrattengono relazioni tra
elementi, la rete ha determinate caratteristiche strutturali Internet e il Web sono esempi di
sistemi complessi.
La struttura di una rete (proprietà dei legami, ampiezza della rete, criticità o punti deboli) sono
studiati dalla scienza delle reti. Queste caratteristiche strutturali sono determinate dagli
elaboratori, fondamentali:
- Connessione tra elementi
- Parti delle reti con caratteristiche specifiche
Il computer è un elaboratore di informazione: input riceve dati in ingresso – li elaboraoutput ne
restituisce un’elaborazione – può memorizzare informazione.
La memoria dell’elaboratore può essere temporanea o permanente e avere diverse caratteristiche,
quali la velocità di accesso, costo e capacità.
In fase di elaborazione avviene l’esecuzione di programmi istruzioni sono scritte in un
opportuno linguaggio di programmazione da un programma (implementa un algoritmo
comprensibile alla macchina).
Uno stesso algoritmo può essere implementato in più linguaggi di programmazione.
Algoritmo: procedimento per la risoluzione di un problema utilizzando un numero finito
d’istruzioni (ricetta di cucina, metodo di risoluzione di un’equazione di 2ndo grado); esso
dev’essere efficiente e corretto.
La progettazione di un sito web è un processo iterativo: progettazione – realizzazione – verifica.
Nelle fasi di progettazione, intervengono specifiche figure professionali: consulente per strategie,
designer per il web design e visual designer per il visual, sviluppo del software, content editor per
gestire contenuti.
Internet è nato da un progetto di collegamento tra elaboratori. Il primo progetto: ARPANET (1969)
d-dell’agenzia ARPA (Advanced Research Projects Agency).
Caratteristiche: ridondanza delle connessioni e rete di reti
Rete di reti è l’interconnessione di reti di tipo differente.
Ogni sottorete è collegata a Internet tramite un dispositivo: gateway.
La comunicazione su rete internet avviene secondo protocolli di comunicazione, ovvero regole
condivise per lo scambio e l’interpretazione delle comunicazioni. In una pila di protocolli ogni
livello risolve una serie di problemi che riguardano la trasmissione di dati.Ogni livello esegue una
specifica serie di operazioni; ad ogni livello, ci si avvicina sempre più dall'interfaccia utente (quella
con cui interagiamo) all'interfaccia di rete.
Alcuni standard sono:
- il modello ISO/OSI, standard per la progettazione delle reti stabilito dall’ISO (organizzazione
internazionale per la normazione), che stabilisce una struttura di rete a strati, composta da una pila
di protocolli suddivisa in 7 livelli (gerarchia), i quali insieme eseguono tutte le funzionalità della
rete.
1
pf3
pf4
pf5
pf8
pf9
pfa
pfd
pfe
pff
pf12
pf13
pf14
pf15
pf16
pf17
pf18
pf19
pf1a
pf1b
pf1c
pf1d
pf1e
pf1f
pf20
pf21
pf22

Anteprima parziale del testo

Scarica Slide Informatica - Appunti TUTTE e più Appunti in PDF di Elementi di Informatica solo su Docsity!

Sistemi complessi (es. organizzazioni, istituzioni, grandi aziende) intrattengono relazioni tra elementi , la rete ha determinate caratteristiche strutturali → Internet e il Web sono esempi di sistemi complessi.

La struttura di una rete (proprietà dei legami, ampiezza della rete, criticità o punti deboli) sono studiati dalla scienza delle reti. Queste caratteristiche strutturali sono determinate dagli elaboratori, fondamentali:

  • Connessione tra elementi
  • Parti delle reti con caratteristiche specifiche

Il computer è un elaboratore di informazione: input riceve dati in ingresso – li elabora – output ne restituisce un’elaborazione – può memorizzare informazione. La memoria dell’elaboratore può essere temporanea o permanente e avere diverse caratteristiche, quali la velocità di accesso, costo e capacità.

In fase di elaborazione avviene l’esecuzione di programmi → istruzioni sono scritte in un opportuno linguaggio di programmazione da un programma (implementa un algoritmo comprensibile alla macchina). Uno stesso algoritmo può essere implementato in più linguaggi di programmazione.

Algoritmo : procedimento per la risoluzione di un problema utilizzando un numero finito d’istruzioni (ricetta di cucina, metodo di risoluzione di un’equazione di 2ndo grado); esso dev’essere efficiente e corretto.

La progettazione di un sito web è un processo iterativo: progettazione – realizzazione – verifica. Nelle fasi di progettazione, intervengono specifiche figure professionali: consulente per strategie, designer per il web design e visual designer per il visual, sviluppo del software, content editor per gestire contenuti.

Internet è nato da un progetto di collegamento tra elaboratori. Il primo progetto: ARPANET (1969) d-dell’agenzia ARPA (Advanced Research Projects Agency). Caratteristiche: ridondanza delle connessioni e rete di reti

Rete di reti è l’interconnessione di reti di tipo differente. Ogni sottorete è collegata a Internet tramite un dispositivo: gateway.

La comunicazione su rete internet avviene secondo protocolli di comunicazione, ovvero regole condivise per lo scambio e l’interpretazione delle comunicazioni. In una pila di protocolli ogni livello risolve una serie di problemi che riguardano la trasmissione di dati.Ogni livello esegue una specifica serie di operazioni; ad ogni livello, ci si avvicina sempre più dall'interfaccia utente (quella con cui interagiamo) all'interfaccia di rete.

Alcuni standard sono:

  • il modello ISO/OSI, standard per la progettazione delle reti stabilito dall’ISO (organizzazione internazionale per la normazione), che stabilisce una struttura di rete a strati, composta da una pila di protocolli suddivisa in 7 livelli (gerarchia), i quali insieme eseguono tutte le funzionalità della rete.
  • protocolli Internet TCP/IP, in funzione dei due più importanti protocolli in essa definiti: il Transmission Control Protocol (TCP) e l'Internet Protocol (IP). Qui sono presenti 4 livelli: applicazione, trasporto (TCP), rete (IP), collegamento.

Indirizzi IP (Internet Protocol) è un’identificazione univoca del destinatario → attraverso indirizzi numerici (es. 149.132.159.3), che vengono assegnati da ICANN (International Association for Assigned Named and Numbers). Il numero di indirizzi IP è limitato; per ovviare tecniche software di mascheramento(NAT, Network Address Translation) per mascherare gli indirizzi della sottorete; versione 6 dell’Internet Protocol (IPV6) che introduce alcuni nuovi servizi e semplifica molto la configurazione e la gestione delle reti e risolverebbe il problema dell’esaurimento indirizzi.

Gli indirizzi IP sono numerici (192.168.12.1); è possibile risolverli in indirizzi simbolici, costituiti da stringhe dinamico2.unibg.it DNS ( Domain Name System ) : servizio distribuito di traduzione di indirizzi IP in indirizzi simbolici. Gli indirizzi simbolici sono costituiti da diverse stringhe, separate da “.”; ciascuna rappresenta un dominio (eccetto la prima, nome del dispositivo). Da destra, associamo ogni dominio a un livello – più a destra = dominio di primo livello.

Nome 3° livello 2° livello 1° livello server1. informatica. unibg .it

I servizi di rete per utenti sono applicazioni a disposizione degli utenti come:

  • World Wide Web
  • Posta elettronica [SMTP, POP3/IMAP]
  • Telnet, SSH L’architettura di questi si basa su client/server: il nodo client invia le richieste; il nodo server fornisce il servizio.

World Wide Web: progettato al CERN (Ginevra) da Cailliau e Berners-Lee (fine anni ‘80), costituito da pagine web per facilitare le comunicazioni. Le caratteristiche fondamentali:

  1. è distribuito su rete (internet)
  2. ipertestualità, testo costituto da parti elementari e basato su percorsi logici di lettura. Vi sono collegamenti ipertestuali che sono orientati.
  3. Multimedialità indica la presenza di molte forme di comunicazione in un unico contesto (testo, immagini, suoni, filmati). World Wide Web si basa su tre protocolli/standard:
  • URL
  • HTTP
  • HTML Mentre il W3C (World Wide Web Consortium ) è un ente che si occupa di sviluppare tecnologie su cui si basa il Web.

F 02 2URL ( Uniform resource locator ) è l’indirizzo univoco di una risorsa nel Web

Le pagine web memorizzate su server possono essere statiche o dinamiche:

  • Pagina statica : pagina HTML possiede una descrizione completa sul server e presenta un contenuto identico per ogni utente.
  • Pagina dinamica : pagina HTML generata da un programma (linguaggi ASP, PHP,…) che presenta informazioni prelevate da basi di dati che viene generata a seguito di una richiesta dell’utente (es moduli di ricerca), quindi è variabile a seconda della richiesta.

World Wide Web quindi ha un’architettura a tre livelli: RICHIESTA http – SERVER DINAMICO

  • RISPOSTA http.

Reti e grafi Reti sono rappresentazione di elementi e delle possibili relazioni tra elementi considerati.

  • Relazioni fisiche – internet
  • Relazioni immateriali - WWW Essi sono applicati in diversi ambiti (alberi evolutivi, reti di telecomunicazioni, sistemi biologici).

La scienza delle reti – Brevi cenni storici Nel 1741 Eulero affrontò il problema dei ponti di Königsberg, con le tecniche di teoria dei grafi. Nel 1959 venne presentato il modello dei grafi casuali (Erdos- Renyi) Nel 1999 si poté parlare di reti a invarianza di scala/legge di potenza (Barabasi)

Grafo è costituito da due tipi di elementi:

  • Nodi (punti): a, b, c, d, e
  • Archi collegamento tra coppie di nodi: (a,e), (a,b), (b,e), (b,c), (d,e), (c,d)
  • Due nodi a,b sono adiacenti se esiste l’arco (a,b)

Distinguiamo tra grafi non diretti, dove ogni arco è biunivoco, e grafi diretti, ad ogni arco viene associata una direzione.

Grafi pesati prevedono che agli archi venga associato un peso, ovvero l’intensità della relazione (in alcuni casi i pesi associati ai nodi). Archi incidenti nel nodo x, se hanno uno degli estremi in x (a a,b; a,e.

Grado di un nodo (in un grafo non diretto): n° di archi incidenti in quel nodo; in un grafo diretto, indegree n° di archi entranti, outdegree n° di archi uscenti.

Cammino in un grafo è una sequenza di nodi: adiacenti, distinti, in cui si definiscono un nodo sorgente e uno destinazione. Percorso in un grafo: sequenza di nodi adiacenti, di cui si definiscano sorgente e destinazione, nodi possono essere ripetuti.

7 ponti di Könisberg (città natale di Kant) che attraversano il fiume Pregel. Il problema chiede se esista un modo per attraversare tutti i ponti percorrendone ognuno una e una sola volta. Rappresentazione del problema tramite un grafo: nodi come parti della città, archi come ponti. Risposta è l’impossibilità attraversamento sette ponti (Eulero, 1741):

se ogni nodo ha un numero pari di archi (al più due nodi di grado dispari), allora posso trovare tale percorso; altrimenti è inutile provare. {Questo facilita il compito dell’elaboratore (deve solo fare conti)}

Lunghezza di un cammino (percorso) è il numero di archi presenti tra sorgente e destinazione – deve seguire le direzioni in un grafo diretto.

Ciclo è un percorso i cui nodi sono distinti eccetto il primo e l’ultimo. Circuito : percorso in cui il primo e l’ultimo nodo coincidono (gli altri nodi non necessariamente distinti). Componente connessa : insieme dei nodi del grafo che possiede un cammino che collega ogni coppia di nodi. Nei grafi diretti si parla di componente fortemente connessa (ogni nodo della componente può raggiungere gli altri nodi della componente).

Un cammino tra due nodi è minimo quando nessun altro cammino tra i due nodi è composto da un numero inferiore di archi. Ne possono esistere vari. Cammino minimo, nel caso pesato, è quello con la somma dei pesi sugli archi minore.

Il diametro di un grafo è costituito dal numero di archi che compongono il cammino minimo più lungo presente nel grafo.

Cricca : insieme di nodi in cui ogni nodo è collegato a tutti gli altri.

Albero grafo connesso privo di cicli: tra ogni coppia di nodi esiste uno e un solo cammino; foglie : nodi di grado 1; con/senza radice. Questi alberi possono essere applicati ad alberi evolutivi/procedure decisionali.

Fino agli studi di Erdos e Renyii la teoria dei grafi si concentra sulle proprietà di grafi regolari I grafi vengono utilizzati per descrivere diversi sistemi complessi: quali caratteristiche hanno? Per spiegare le caratteristiche di tali sistemi sono stati realizzati dei modelli matematici che definiscono le regole con cui i grafi si formano quando si forma un legame (creazione di un arco)

Grafi casuali: primo modello di riferimento per spiegare la formazione di grafi, introdotto nel 1959 da Erdos e Renyi gli archi che collegano i vertici sono scelti casualmente

- Per ogni coppia di nodi, esiste una certa probabilità che si formi un arco tra i due nodi

  • In alternativa non si forma un arco tra i due nodi

Proprietà dei grafi casuali:

  • vi sono pochi archi →componenti non connesse
  • se vengono inseriti più archi (> metà dei nodi) le componenti si connettono
  • è sufficiente che in media ogni nodo abbia un arco incidente per ottenere una componente con molti nodi (circa |V| 2/3)
  • se i nodi hanno in media meno di un arco incidente il grafo non è connesso
  • se i nodi hanno almeno c archi→componente gigante

Rete di Facebook (2007 - 2011) Utenti attivi: accesso ultimi 28 giorni Considerati utenti con al più 5000 amici Nel 2011: 721 milioni di utenti/nodi 69 miliardi di archi Grado di separazione: 4

Nel 2007 grafo disconnesso Dal 2009 grafo connesso, dati consolidati Nel 2011 grafi regionali con grado di separazione circa 3; grado medio di separazione: 3, 92% nodi con grado di separazione <=

Differenze tra le analisi di Facebook/Web e l’esperimento di Milgram Nelle analisi di Facebook/Web: utilizzo cammini minimi Nell’esperimento di Milgram: i cammini sono minimi?

Amicizie reali/amicizie in Facebook Milgram: 300 volontari; 22% catene completate Facebook: 721 milioni di utenti; 92% nodi con grado di separazione < 4

Esempio di altre reti sociali Collaborazioni scientifiche : esempio di relazione tra individui Collegamento tra due autori: coautori di una pubblicazione

Collaborazioni matematiche-informatiche: Erdos, matematico ungherese con una rete di collaborazioni molto ampia. Numero di Erdos di un matematico/informatico è la lunghezza del più breve percorso che porta da Erdos (numero associato

  1. all’autore.

Stima: 90% dei matematici hanno un numero di Erdos non superiore a 8 la rete di Erdos è in continua evoluzione: -Aumentano i nodi

  • Cammini diventano sempre più lunghi
  • Il diametro della rete aumenta

Reti a piccolo mondo Il modello delle rete casuali non rappresenta le caratteristiche di alcune reti reali (reti sociali, web, reti biologiche). Nel 1969-1973 Granovetter analizzò le reti interpersonali (nella ricerca di lavoro) e i suoi studi individuarono una struttura della rete e diversi tipi di legami (archi).

La rete vede la presenza di un numero significativo di cluster (cricche o sottografi simili a cricche) Esistono alcuni collegamenti tra cluster: i legami possono essere di due tipi

  • Forti : legami tra elementi di uno stesso grafo completo
  • Deboli : legami tra elementi di grafi completi differenti i legami deboli permettono la connessione cricche

Ulteriori studi (Strogatz e Watts , 1998) introdussero un indice per misurare la presenza di cluster con il grado di clusterizzazione (coefficiente di clustering) Il coefficiente di clustering misura quanto un grafo è costituito da cluster

Il modello osservato da Granovetter implica:

  • Un alto coefficiente di clustering: presenza di un numero significativo di cluster
  • Legami non distribuiti casualmente: se due individui hanno un amico in comune è probabile che si conoscano

Diverse reti hanno un alto grado di clustering

  • Rete di collaborazioni scientifiche
  • Rete biologica (C. elegans)
  • World Wide Web
  • Internet Il clustering non è spiegabile con il modello delle reti casuali; i cluster da soli non permettono di avere un grado di separazione limitato : pochi legami tra cluster permettono di avere reti con grado di separazione basso.

I legami deboli hanno una grande importanza:

  • Mettono in comunicazione diversi gruppi
  • Rimozione→scollegamento della rete

Connettori Le analisi di alcune reti hanno dimostrato l’esistenza di nodi con un numero molto elevato di connessioni

  • Reti di attori: Kevin Bacon
  • Collaborazioni scientifiche: Paul Erdos
  • Web: Google

Un hub (connettore) all’interno di una rete è un nodo con un grado estremamente elevato L’esistenza di hub non era spiegabile dai modelli fino ad allora proposti.

Le reti casuali e a piccolo mondo descrivono una situazione egualitaria: ogni nodo ha un ruolo (numero di collegamenti) simili. In molte reti reali → questa regola non è rispettata

Nell’analisi del Web (Albert et al, 1999), 203 milioni di pagine analizzate; 90%di pagine hanno meno di 10 link entranti; 3 pagine con circa 1.000.000 link entranti. Se il Web fosse una rete casuale ci sarebbe una probabilità 10 -99^ di avere nodi con 500 di link entranti

La presenza di hub può essere utilizzata per spiegare il grado di separazione limitato. I nodi del grafo sono collegati a hub con cammini brevi [utilizzando hub: cammini brevi tra ogni coppia di nodi]

Nella rete ci sono un numero limitato di nodi. Essi permettono l’interscambio tra nodi sparsi nella rete. ESEMPIO: rete aeroportuale. La presenza di hub all’interno di una rete viene spiegata con un nuovo modello: reti che seguono una legge di potenza o a invarianza di scala

Collegamento preferenziale, modello proposto ha due limiti :

  • Non sempre i nodi più connessi sono quelli aggiunti prima – es: Google
  • Non è previsto il collegamento tra nodi già esistenti Collegamento basato su fitness, ogni nodo ha una certa capacità di attrarre collegamenti, basato sulla qualità del nodo. Collegamento preferenziale basato sul prodotto tra fitness e numero di collegamenti dei singoli nodi

Le reti basate su fitness dimostrano (Bianconi e Barabasi, 2001):

  • La fitness è determinante nella formazione degli hub
  • Link con fitness maggiore acquisiscono più velocemente collegamenti

Il modello basato su fitness produce due tipi di reti:

  • A invarianza di scala (presenza di alcuni hub)
  • A stella (presenza di un solo hub)

RETI, VULNERABILITA E PROPAGAZIONE reti sociali e grafi Vulnerabilità : aspetto fondamentale delle reti, descrive il comportamento della rete a seguito di guasti, attacchi, tipo di guasto/attacco Robustezza delle reti è stata studiata in diversi ambiti: biologia (r. di una cellula), sociologia (resilienza di una società), economia (stabilità economica). In genere la robustezza è legata alla proprietà della connessione.

RETE CASUALE: viene danneggiata anche per attacchi/guasti isolati ; attacchi mirati non problematici. RETE A INVARIANZA DI SCALA: la rete non subisce danni irreparabili/scollegamenti, se gli attacchi/guasti sono isolati e se gli hub sono protetti ; attacchi mirati contro hub sono problematici.

Propagazione su una rete: le reti sono strumenti per la propagazione di virus, epidemie, mode, tendenze, innovazioni. Quali fattori di una rete influenzano sulla propagazione? Modello a soglia, si basa sulla definizione di un valore (soglia) individuale.

  • Soglia : probabilità di accettare un’innovazione
  • Tasso di diffusione : probabilità di propagazione sulla rete
  • Soglia critica : valore che determina la propagazione

Propagazione: invarianza di scala L’affermazione di un prodotto procede:

  • Come prima cosa adottato da un gruppo di esperti ( innovatori )
  • L’utilizzo si propaga (se possibile) dagli innovatori agli hub
  • Dagli hub al resto della rete

RETE PICCOLO MONDO: soglia critica, al di sotto la propagazione non si espande; al di sopra si espande senza controllo. RETE A INVARIANZA DI SCALA: non esiste soglia critica; la propagazione è legata al raggiungimento degli hub Analisi delle rete sociali, si realizza uno studio delle relazioni sociali tra individui, gruppi in base a

  • Caratteristiche delle relazioni
  • Flusso di informazioni
  • Ruolo degli individui La prospettiva di rete non è individuale

Reti sociali → modellate come grafi

  • Nodi → individui
  • Archi → relazioni
  • Pesi → valore della relazione

Esistono degli indici che permettono di individuare le caratteristiche delle reti sociali

  • Importanza di un nodo all’interno di una rete
  • Caratteristiche strutturali della rete

INDICI DI CENTRALITA: importanza di un nodo in una rete, dipende dal contesto di analisi. Possibili indici: degree, closeness, betweenness, eigenvector centrality.

Degree centrality : capacità di connessione con i vicini. È un valore misurato per uno specifico nodo → grado del nodo Esempio: grafo delle collaborazioni fra studiosi; grado → capacità relazionale

Closeness : somma della distanza di un nodo rispetto a tutti gli altri nodi. Nodi centrali presentano un indice di valore minore. Applicazioni: raggiungibilità dai nodi della rete

Betweenness di un nodo v: numero dei cammini minimi passanti per v. Viene posta importanza nel controllo del flusso della rete e l’influenza sulla rete.

Eigenvector centrality, importanza delle connessioni di un nodo : connessione con elementi/ individui influenti. La centralità di un nodo è proporzionale a quella dei vicini. Esempio: pagerank

Valori per valutare le caratteristiche strutturali dell’intera rete sono DENSITA & INCLUSIVITA.

  • Densità : indica la correlazione tra gli elementi della rete
  • Misura l’integrazione sociale
  • Densità : numero archi del grafo/numero possibili archi
  • Inclusività : elementi/individui coinvolti nella relazione rappresentata dal grafo
  • Inclusività : rapporto tra numero totale di nodi non isolati in un grafo e il numero totale dei nodi

Motori di ricerca Si stima vi siano almeno diversi miliardi di pagine web, oltre un miliardo di siti web, ovvero sistemi per la ricerca e la catalogazione delle pagine web

  • motori di ricerca (Google, Yahoo!, Bing,...)
  • cataloghi sistematici (Yahoo! Directory, Open Directory Project)

Motore di ricerca: strumento di IR, in cui si ricerca per parole chiave. Risultato di una ricerca: è una lista ordinata di pagine che trattano argomenti descritti dalle parole chiave. Vi si nota la presenza collegamenti sponsorizzati.

INTERROGAZIONE: risposta a richieste utenti. Accesso solo all’indice e all’archivio Web. Risultati della ricerca vengono mostrati secondo un determinato le pagine sono ordinate in base a rilevanza ( ranking ). Come funzionano nella realtà? Come costruiscono il ranking?

Distinguiamo tra motori di ricerca GENERALISTI E SPECIALIZZATI. Motori di ricerca generalisti

  • Google (1998)
  • Bing (2009)
  • Yahoo! Search (2004) Difficoltà nel confronto tra i diversi motori di ricerca

Motori di ricerca specializzati Metamotori : sintesi di una ricerca su più motori Plurimotori : ricerche in parallelo Motori specialistici : motori di ricerca per domini specifici

  • Pubblicazioni scientifiche: Google Scholar
  • Notizie: Google News
  • Libri: Google Books
  • Immagini, video

SERP e ordinamento SERP ( Search Engine Results Page ): risultati di un motore di ricerca. Possono essere: risultati organici, a pagamento, ricerca sulle mappe, … Posizionamento nella SERP è un aspetto fondamentale per la visibilità di un sito. Gli utenti usano spesso i motori di ricerca {nel 2017 circa 3,5 miliardi di ricerche al giorno; mercato dei motori di ricerca}.

Importanza del posizionamento: da una ricerca risulta che i primi 10 risultati ricevano il 90% delle selezioni; 11-20 5%; 21-30 3%. In base alla posizione: 42% delle selezioni in 1°; 12% in 2°; 9% in 3°. Visibilità dei risultati: 1,2,3 – 100%; 4 – 85%; 5 – 60%; 6,7 – 50%.

I motori di ricerca costruiscono i risultati da presentare in due fasi:

  1. Individuazione delle pagine rilevanti (IR)
  2. Ordinamento (Ranking) delle pagine rilevanti Essi cercano le pagine che contengono le parole chiave inserite – come funzionano nella realtà? Esempio:
  • Esempio1.html
  • Esempio2.html
  • Esempio3.html
  • Esempio4.html
  • Ordinamento rispetto alla ricerca: Università Bergamo?

Alla fine degli anni ’90 è stata analizzata la struttura del Web per individuare le pagine più rilevanti. Da cosa è costituita questa struttura? Pagine web & link ipertestuali [→ legame tra le pagine web, GRAFO DEL WEB]

Grafo del Web : nodi → pagine web, archi orientati → link ipertestuali.

Caratteristiche del grafo del Web: rete orientata, differenza tra grado uscente e grado entrante; grado di separazione : 19 link (Barabasi); presenza di hub & componenti isolate.

Grafo del Web è utilizzato per

  • Esplorazione del Web e raccolta di dati
  • Ordinamento dei risultati dei motori di ricerca (PageRank)
  • Determinare pagine che si occupano di argomenti simili

La struttura del Web condiziona l’esplorazione e la conseguente indicizzazione. Nel 1997 Hotbot copriva circa il 33% delle pagine, Altavista il 28%, Lycos 2%.

La probabilità che una pagina sia indicizzata dipende dal numero di archi entranti: un link corrisponde al 10% di probabilità; tra 21 e 100 link invece corrisponde al 90% di probabilità.

Ranking: 2 caratteristiche di una pagina web/nodo x:

  • link entranti: stella entrante
  • link uscenti: stella uscente

Parametro con cui valutare le caratteristiche di una pagina:

  • Numero di link nella stella entrante
  • Numero di link nella stella uscente Siti autorità : siti autorevoli su un certo argomento → molti link entranti Ulteriori analisi del grafo del Web per definire migliori criteri di ordinamento. Metodi: HITS e PageRank.

HITS Hyperlink-Induced Topic Search :

  • Analisi di Kleinberg (1999)
  • Nodi del grafo del Web possono essere classificati come autorità / aggregatori

Autorità : nodo con stella entrante molto ampia autorevolezza su un dato argomento. Aggregatore : nodo con stella uscente molto ampia Pagine autorevoli e aggregatori si influenzano vicendevolmente. Aggregatori rilevanti → pagine autorevoli Pagine autorevoli → Aggregatori rilevanti

Successo di Google → metodo/algoritmo di ranking (PageRank) “The heart of our software is PageRank™, PageRank continues to play a central role in many of our web search tools.”

PageRank Vi si basa il ranking di Google; rilevanza di una pagina web , funzione della rilevanza delle pagine web collegate (rilevanza pagine delle stelle entranti). Calcolo PageRank : procedura ricorsiva

  • Rilevanza della mia pagina web dipende dalla rilevanza delle pagine web della stella entrante
  • Rilevanza della delle pagine web nella stella uscente influenzata dalla rilevanza mia pagina web

La teoria di Norman può essere utilizzata per interpretare il comportamento di un utente di fronte ad un sito web. Quest’ultimo compie diversi passi, o meglio azioni, mediante le quali va a colmare la distanza tra l’interfaccia del sito e l’obiettivo finale. Al tempo stesso svolge anche un’attività di valutazione degli effetti ottenuti in riferimento allo scopo esiderato. Quello che segue è un esempio di possibile concatenamento di azioni che un utente può eseguire, associato ai vari stadi illustrati da Norman: 1 Forma lo scopo: L’utente esprime l’intenzione di prenotare un volo online 2 Forma l’intenzione: L’utente cerca si mette alla ricerca di un sito che gli consenta di raggiungere lo scopo prefissato 3 Specifica un’azione: Inizia il suo percorso nel sito, durante il quale esplora le diverse aree, cercando di capire qual è la sezione che gli permetta di prenotare il volo prescelto 4 Esegue l’azione: Trova il campo ‘acquista’, inserisce il metodo di pagamento e procede nell’acquisto 5 Percepisce lo stato del mondo: Resta in attesa di un feedback che possa confermargli la riuscita dell’acquisto 6 Interpreta lo stato del mondo: Vede un segno di spunta e una dicitura che si complimenta per l’acquisto effettuato 7 Valuta il risultato: Ha raggiunto l’obiettivo con successo. Per quanto riguarda il golfo dell’esecuzione, nfatti, l’utente potrebbe riscontrare problemi nel reperimento delle informazioni che sta cercando, trovandosi in difficoltà nel raggiungere la sezione che gli consente di acquistare il servizio in questione. Anche il golfo della valutazione potrebbe essere fonte di problemi, ad esempio, se l’utente, dopo aver cliccato il tasto ‘acquista’, non avesse visto alcun segno di spunta o nessun messaggio di conferma dell’ordine. In questo caso, l’utente sarebbe probabilmente rimasto nel dubbio, chiedendosi se l’acquisto avesse funzionato. I problemi riscontrabili in prossimità dei due golfi costituiscono la maggior parte dei problemi di usabilità dei sistemi, che si tratti di oggetti di uso quotidiano o di tecnologie informatiche.

Norman individua due punti in cui si nascono problemi di interazione:

  • Golfo dell’esecuzione : tra lo stadio delle intenzioni e lo stadio delle azioni distanza tra azioni ipotetiche e le azioni permesse
  • Golfo della valutazione , che divide lo stadio della percezione da quello della valutazione dei risultati distanza tra lo stato del sistema e la percezione dell’utente

2- L’interfaccia Ha lo scopo di superare questi golfi:

  • Golfo dell’esecuzione: specificando in modo chiaro le azioni possibili ( affordance ) [maniglione antipanico]
  • Golfo della valutazione: comunicando in modo chiaro lo stato del sistema ( feedback ) [pagamento avvenuto con successo]

La progettazione dell’interfaccia è basata su un modello concettuale : descrizione del sistema, delle sue funzionalità e del suo comportamento. Nella progettazione troviamo diversi modelli concettuali (del progettista, dell’utente, effettivo del sistema).

La distanza tra modelli concettuali può causare problemi di interazione: la distanza tra modello concettuale del progettista e modello dell’utente – progettisti/utenti tipici, estetica/facilità d’uso, committenti/utenti.

Nei modelli concettuali dei progettisti, Norman evidenzia due problematiche:

  • Proliferazione delle funzioni
  • Culto della complessità

Egli introduce un nuovo approccio per ridurre le distanze tra modelli concettuali , ovvero attraverso l’utilizzo del punto di vista dell’utente e il coinvolgimento dell’utente nella fase di progettazione.

Principi della buona progettazione

  • Visibilità : riconoscibilità dei comandi
  • Mapping : facilità nel determinare rapporto tra comandi e azioni
  • Feedback : informazione sullo stato del sistema
  • Gestione degli errori : prevedere possibili errori e il conseguente comportamento del sistema
  • Utilizzo standard

3- Usabilità È la facilità di utilizzo di un prodotto – l’efficacia, l'efficienza e la soddisfazione con le quali determinati utenti raggiungono determinati obiettivi in determinati contesti.

Grado di usabilità di un prodotto dipende da alcuni fattori:

  • Curva di apprendimento
  • Semplicità di memorizzazione
  • Efficienza
  • Soddisfazione
  • Errori

Approcci all’usabilità nel Web: Norman , Nielsen, Krug, Polillo. La complessità di navigazione nel Web, prevede uno sforzo cognitivo. NAVIGAZIONE: supporto alla navigazione e minimizzare clic inutili. CONTENUTI: organizzazione dei contenuti e fruizione uniforme indipendentemente da dispositivi/browser.

La progettazione di un sito web è un processo iterativo e interattivo.

  • Occorre individuare: utenti potenziali e pratiche in uso ;
  • Realizzazione di prototipi
  • Valutazione : fase di test

Identità digitale Uno sito web ha come obiettivo primario comunicare: identità e attività svolta; possibilmente in modo auto-esplicativo e immediato. Fattori che influenzano l’ interazione iniziale con il sito:

  • Uniformità visiva, coerenza comunicativa
  • Nome del sito

Header Menu Content Footer Header Menu Content

Footer

Struttura di un sito

Homepage Il corso Studiare Global opportunities NAVIGAZIONE PRINCIPALE Piano di studi Orario lezioni Doppio titolo Guida e regolamento Erasmus NAVIGAZIONE SECONDARIA

I menu di navigazione sono:

  • Principale : menu per le voci di primo livello, presente in tutte le pagine
  • Secondaria : suddivisione di ogni sezione del sito
  • Contestuale : elementi correlati [info e sezioni laterali]

Homepage è il primo punto di contatto con l’utente: importante per identità ; individuazione di zone semantiche ; navigazione ; accesso rapido a contenuti (interni)

Uno dei principali problemi nella progettazione dell’homepage è: Cosa collocare? Contenuto essenziale vs esteso. La scelta dipende da diversi fattori quali il tipo di sito e gli obiettivi del sito. Contenuto esteso : portali, giornali,… Contenuto essenziale : siti personali, landing page , minisiti, …

Nella scelta va considerato inoltre l’impegno richiesto all’utente. Il carico cognitivo richiesto all’utente è direttamente proporzionale alla complessità della pagina. Pre-homepage è una pagina che precede l’homepage ( intro-page, splash-page ). Essa va utilizzata solo se strettamente necessaria (dare informazioni, richiedere un’autorizzazione,…). Il rischio che si corre è quello d’ invisibilità per i motori di ricerca.

Oltre all’homepage, altre pagine possono essere visualizzate inizialmente nella visita al sito → landing page Essa è collegata a un’ azione da mettere in risalto:

  • Consultazione : fornire informazioni
  • Transazionale : per compiere un’azione

Struttura di una landing page

Headline

Immagine Descrizione

Architettura dell’informazione - Web L’architettura dell’informazione di un sito web è l’ organizzazione dei contenuti

  • Alberatura e menu di navigazione
  • Etichettatura ( labelling ) dei menu
  • Ricerca interna

Un approccio per la costruzione dell’alberatura è basato sulla classificazione essa si occupa di organizzare i contenuti: divisione in categorie e sottocategorie e definizione della struttura organizzativa

Per la classificazione è possibile ricorrere a Card Sorting, metodo per classificazione partecipativa

  • Classificazione di un insieme di elementi ( cards ) in categorie
  • Raggruppamento di elementi omogenei

Esistono due approcci alla classificazione partecipativa

  • Versione chiusa : assegnazione a categorie predefinite
  • Versione aperta : definizione categorie A seconda del numero di utenti coinvolti: serve un’analisi qualitativa e l’ausilio di metodi statistici.

I principali metodi di organizzazione dell’informazione

  • Per argomento : basato sui contenuti del sito organizzazione semantica
  • Per compiti : basato sui bisogni degli utenti cosa devo fare?
  • Per tipologia di utenza Altri metodi di organizzazione [alfabetica, cronologica, geografica/spaziale] – diversi metodi possono essere utilizzati congiuntamente.

L’architettura dell’informazione nel Web utilizza le seguenti strutture organizzative per presentare l’informazione

  • Approccio gerarchico
  • Approccio a faccette

Nell’approccio gerarchico i contenuti sono disposti seguendo in una struttura ad albero (a livelli)

  • Categorie di alto livello (macro-categorie)
  • Sotto-categorie
  • Foglie In questo caso vanno considerati due aspetti:
  • Profondità dell’albero : lunghezza del cammino per arrivare al contenuto
  • Ampiezza della gerarchia : numero di categorie tra cui scegliere LEGGE DI HICK, quantifica lo sforzo cognitivo nell’utilizzo di menu – scegliere una volta tra un menu di 8 voci è meno impegnativo che scegliere 2 volte da menu di 4 voci

Nell’approccio a faccette ogni informazione del sito può essere considerata da vari punti di vista

  • Elementi selezionati in base a caratteristiche Es.Automobili per cilindrata, tipo di alimentazione, tipo di cambio.

Gli elementi strutturali del sito (e non solo) devono essere opportunamente etichettati ( labelling ), attraverso l’utilizzo di termini distintivi , comprensibili all’utente.