Reti Complesse: Small-World, Clustering e Scale-Free - Prof. Dondi | Appunti di Elementi di Informatica

ESPERIMENTO DI MILGRAM
La teoria dei sei gradi di separazione in semiotica e in sociologia è un'ipotesi secondo la quale ogni persona 
può essere collegata a qualunque altra persona o cosa attraverso una catena di conoscenze e relazioni con non
più di 5 intermediari.
Nel 1967 lo psicologo americano Stanley Milgram, con un esperimento sociale, sottopose l'ipotesi a prova 
empirica e sotto forma di "teoria del mondo piccolo". Selezionò, in modo casuale, un gruppo 
di statunitensi del Midwest e chiese loro di spedire un pacchetto a un estraneo che abitava nel Massachusetts,
a diverse migliaia di chilometri di distanza. Ognuno di essi conosceva il nome del destinatario, il suo 
impiego e la zona in cui risiedeva, ma non l'indirizzo preciso. Fu quindi chiesto a ciascuno dei partecipanti 
all'esperimento di spedire il proprio pacchetto a una persona da loro conosciuta, che, a loro giudizio, poteva 
avere la maggiore probabilità di conoscere il destinatario finale. Quella persona avrebbe fatto lo stesso, e così
via, fino a che il pacchetto non fosse stato consegnato al destinatario finale.
Milgram si aspettava che il completamento della catena avrebbe richiesto almeno un centinaio di 
intermediari, rilevando invece che i pacchetti, per giungere al destinatario, richiesero in media solo tra i 
cinque e i sette passaggi. L'esperimento di Milgram fu pubblicato in Psychology Today e dall'articolo nacque
l'espressione "sei gradi di separazione".
el 2001 Duncan Watts, professore della Columbia University, ricreò l'esperimento di Milgram su internet. 
Watts usò un messaggio e-mail come "pacchetto" che doveva essere consegnato da 48.000 differenti 
persone, residenti in 157 Stati diversi, nei confronti di 19 "obiettivi". Dall'analisi dei dati Watts riscontrò che 
il numero medio di intermediari era effettivamente sei. La ricerca di Watts, pubblicata su Science nel 2003[1],
e l'avvento dell'era del computer, permisero l'applicazione della teoria dei sei gradi di separazione anche ad 
aree differenti, tra cui l'analisi delle reti informatiche ed elettriche, la trasmissione delle malattie, la teoria dei
grafi, le telecomunicazioni, e la progettazione della componentistica dei computer.
Nel 2006 due ricercatori di Microsoft, sfruttando i log delle conversazioni attraverso MSN Messenger, 
ricavarono che fra due utenti del programma vi sono in media 6,6 gradi di separazione. Nello stesso anno, un
servizio-inchiesta della rete televisiva ABC dimostrò che lo status socioeconomico dei "bersagli" non 
influisce in alcun modo sul numero dei gradi di separazione. L'ABC reclutò una nota giornalista newyorkese,
chiedendole di mettersi in contatto con un ex pugile disoccupato: la giornalista ci riuscì nei canonici sei 
passaggi. All'ex pugile, invece, fu chiesto di contattare una nota ballerina: vi riuscì in soli cinque passaggi.
Facebook
Nel 2011 un gruppo di informatici dell'Università degli studi di Milano, in collaborazione con due 
informatici di Facebook, effettuò un esperimento su scala planetaria per calcolare il grado di separazione tra 
tutte le coppie di individui su Facebook. In media i gradi di separazione riscontrati furono 4,74, molto meno 
dell'esito dell'esperimento di Milgram. Il 92% delle coppie è separato da non più di 4 gradi.Tuttavia il dato 
non è rappresentativo delle relazioni di amicizia nella vita reale, dato che molti utenti di Facebook 
annoverano tra gli "amici" persone che non conoscono affatto.
PAGE RANK
Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un insieme di 
documenti connessi per mezzo di collegamenti ipertestuali, ad esempio l'insieme delle pagine nel World 
Wide Web, con lo scopo di quantificare l'importanza relativa all'interno dell'insieme stesso.
L'algoritmo può essere applicato a tutti gli insiemi di oggetti collegati da citazioni e riferimenti reciproci. Il 
peso numerico assegnato ad un dato elemento E è chiamato anche "il PageRank di E", siglato in PR (E). 
L'algoritmo di PageRank è stato brevettato (brevetto US 6285999) dalla Stanford University; è inoltre un 
termine ormai entrato di fatto nel lessico dei fruitori dei servizi offerti dai motori di ricerca. Il nome 
PageRank è un marchio di Google ed il suo nome si deve a Larry Page, uno dei due fondatori di 
quell'azienda. Da tempo ormai il PageRank infatti non è più l'unico parametro con il quale l'algoritmo di 
posizionamento di Google posiziona i siti web all'interno delle sue Search engine results page (SERP), anche
se resta, secondo i ricercatori, il principale. Bisogna però tenere conto che lo studio in questione è del 2013, 
oltre al fatto - ancor più rilevante - che, in generale si tratta di una correlazione, che non deve indurre a 
credere che rappresenti una relazione causa-effetto ("correlazione non implica causalità").
Letteralmente traducibile come rango di una pagina web (ma anche un gioco di parole collegato al nome di 
uno dei suoi inventori, Larry Page), il pagerank è facilmente riconducibile al concetto di popolarità tipico 
delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in 
relazione ai termini ricercati. Gli algoritmiche rendono possibile l'indicizzazione del materiale presente in 
1

Anteprima parziale del testo

Scarica Reti Complesse: Small-World, Clustering e Scale-Free - Prof. Dondi e più Appunti in PDF di Elementi di Informatica solo su Docsity!

ESPERIMENTO DI MILGRAM

La teoria dei sei gradi di separazione in semiotica e in sociologia è un'ipotesi secondo la quale ogni persona può essere collegata a qualunque altra persona o cosa attraverso una catena di conoscenze e relazioni con non più di 5 intermediari. Nel 1967 lo psicologo americano Stanley Milgram, con un esperimento sociale, sottopose l'ipotesi a prova empirica e sotto forma di "teoria del mondo piccolo". Selezionò, in modo casuale, un gruppo di statunitensi del Midwest e chiese loro di spedire un pacchetto a un estraneo che abitava nel Massachusetts, a diverse migliaia di chilometri di distanza. Ognuno di essi conosceva il nome del destinatario, il suo impiego e la zona in cui risiedeva, ma non l'indirizzo preciso. Fu quindi chiesto a ciascuno dei partecipanti all'esperimento di spedire il proprio pacchetto a una persona da loro conosciuta, che, a loro giudizio, poteva avere la maggiore probabilità di conoscere il destinatario finale. Quella persona avrebbe fatto lo stesso, e così via, fino a che il pacchetto non fosse stato consegnato al destinatario finale. Milgram si aspettava che il completamento della catena avrebbe richiesto almeno un centinaio di intermediari, rilevando invece che i pacchetti, per giungere al destinatario, richiesero in media solo tra i cinque e i sette passaggi. L'esperimento di Milgram fu pubblicato in Psychology Today e dall'articolo nacque l'espressione "sei gradi di separazione". el 2001 Duncan Watts, professore della Columbia University, ricreò l'esperimento di Milgram su internet. Watts usò un messaggio e-mail come "pacchetto" che doveva essere consegnato da 48.000 differenti persone, residenti in 157 Stati diversi, nei confronti di 19 "obiettivi". Dall'analisi dei dati Watts riscontrò che il numero medio di intermediari era effettivamente sei. La ricerca di Watts, pubblicata su Science nel 2003 [1], e l'avvento dell'era del computer, permisero l'applicazione della teoria dei sei gradi di separazione anche ad aree differenti, tra cui l'analisi delle reti informatiche ed elettriche, la trasmissione delle malattie, la teoria dei grafi, le telecomunicazioni, e la progettazione della componentistica dei computer. Nel 2006 due ricercatori di Microsoft, sfruttando i log delle conversazioni attraverso MSN Messenger, ricavarono che fra due utenti del programma vi sono in media 6,6 gradi di separazione. Nello stesso anno, un servizio-inchiesta della rete televisiva ABC dimostrò che lo status socioeconomico dei "bersagli" non influisce in alcun modo sul numero dei gradi di separazione. L'ABC reclutò una nota giornalista newyorkese, chiedendole di mettersi in contatto con un ex pugile disoccupato: la giornalista ci riuscì nei canonici sei passaggi. All'ex pugile, invece, fu chiesto di contattare una nota ballerina: vi riuscì in soli cinque passaggi. Facebook Nel 2011 un gruppo di informatici dell'Università degli studi di Milano, in collaborazione con due informatici di Facebook, effettuò un esperimento su scala planetaria per calcolare il grado di separazione tra tutte le coppie di individui su Facebook. In media i gradi di separazione riscontrati furono 4,74, molto meno dell'esito dell'esperimento di Milgram. Il 92% delle coppie è separato da non più di 4 gradi.Tuttavia il dato non è rappresentativo delle relazioni di amicizia nella vita reale, dato che molti utenti di Facebook annoverano tra gli "amici" persone che non conoscono affatto. PAGE RANK Il PageRank è un algoritmo di analisi che assegna un peso numerico ad ogni elemento di un insieme di documenti connessi per mezzo di collegamenti ipertestuali, ad esempio l'insieme delle pagine nel World Wide Web, con lo scopo di quantificare l'importanza relativa all'interno dell'insieme stesso. L'algoritmo può essere applicato a tutti gli insiemi di oggetti collegati da citazioni e riferimenti reciproci. Il peso numerico assegnato ad un dato elemento E è chiamato anche "il PageRank di E", siglato in PR (E). L'algoritmo di PageRank è stato brevettato (brevetto US 6285999) dalla Stanford University; è inoltre un termine ormai entrato di fatto nel lessico dei fruitori dei servizi offerti dai motori di ricerca. Il nome PageRank è un marchio di Google ed il suo nome si deve a Larry Page, uno dei due fondatori di quell'azienda. Da tempo ormai il PageRank infatti non è più l'unico parametro con il quale l'algoritmo di posizionamento di Google posiziona i siti web all'interno delle sue Search engine results page (SERP), anche se resta, secondo i ricercatori, il principale. Bisogna però tenere conto che lo studio in questione è del 2013 , oltre al fatto - ancor più rilevante - che, in generale si tratta di una correlazione, che non deve indurre a credere che rappresenti una relazione causa-effetto ("correlazione non implica causalità"). Letteralmente traducibile come rango di una pagina web (ma anche un gioco di parole collegato al nome di uno dei suoi inventori, Larry Page), il pagerank è facilmente riconducibile al concetto di popolarità tipico delle relazioni sociali umane, ed indica, o si ripromette di indicare, le pagine o i siti di maggiore rilevanza in relazione ai termini ricercati. Gli algoritmiche rendono possibile l'indicizzazione del materiale presente in

rete utilizzano anche il grado di popolarità di una pagina web per definirne la posizione nei risultati di ricerca. Questo metodo può esser descritto come analogo ad una elezione nella quale ha diritto al voto chi può pubblicare una pagina web, e il voto viene espresso attraverso i collegamenti in essa presenti. I voti non hanno tutti lo stesso peso: le pagine web più popolari esprimeranno, coi propri link, voti di valore maggiore. L'interpretazione e la definizione della popolarità di un sito non sono però legate soltanto a queste votazioni, ma tengono conto anche della pertinenza del contenuto di una pagina, nonché delle pagine correlate, con i termini ed i criteri della ricerca effettuata. Altro importante elemento che lega un sito alla sua popolarità è relativo alla diffusione, alla popolarità dell'argomento trattato in esso. Per argomenti poco richiesti i siti raggiungono facilmente le prime posizioni nelle ricerche, ma altrettanto verosimilmente posseggono e mantengono un page rank che potrebbe essere bassissimo. Tutto questo permette, o perlomeno ha lo scopo, di attuare un controllo incrociato che garantisca la validità dei risultati di ricerca. Per ottenere informazioni riguardo, ad esempio, alla notorietà di una pagina web in Google è possibile installare la Google Toolbar nel browser di navigazione oppure si possono utilizzare servizi proposti da terze parti in grado di determinare tale informazione ed implementabili su siti internet. Per aumentare il page rank si possono sfruttare dei piccoli accorgimenti. Uno dei più usati è cercare di attrarre l'attenzione di utenti che si interessino ad argomenti correlati al nostro sito o blog. Lo scopo è conquistare gli utenti veramente interessati a seguire i nostri post. Tale accorgimento serve per confermare una delle regole di Google: i link che possono puntare a un sito devono essere "naturali", ovvero non richiesti o generati da scambio di link o a pagamento. Se Google si accorge che un sito fa richieste che non rispettano le regole del motore di ricerca, lo penalizza immediatamente, arrivando anche a bannare il proprietario che vada contro le regole di condotta sottoscritte al momento dell'iscrizione al servizio del motore di ricerca. Per cercare di ottenere link naturali è necessario proporre argomenti sempre aggiornati, non copiati, con approfondimenti interessanti per i fruitori del servizio web. L'algoritmo completo per il calcolo del PageRank fa ricorso all'uso della teoria dei processi Markov ed è classificato nella vera categoria degli algoritmi di Link Analysis Ranking. Dalla formula inizialmente sviluppata dai fondatori di Google, Sergey Brin e Larry Page, è possibile comprendere come il PageRank viene distribuito tra le pagine: Dove:  PR[A] è il valore di PageRank della pagina A che vogliamo calcolare.  N è il numero totale di pagine note.  n è il numero di pagine che contengono almeno un link verso A. Pk rappresenta ognuna di tali pagine.  PR[Pk] sono i valori di PageRank di ogni pagina Pk.  C[Pk] sono il numero complessivo di link contenuti nella pagina che offre il link.  d (damping factor) è un fattore deciso da Google e che nella documentazione originale assume valore 0,85. Può essere aggiustato da Google per decidere la percentuale di PageRank che deve transitare da una pagina all'altra e il valore di PageRank minimo attribuito ad ogni pagina in archivio. Dalla formula si nota quindi che all'aumentare del numero di link complessivi dei siti che puntano ad A il PageRank aumenta. DIAMETRO DEL GRAFO, STRUTTURA BROSWER E RANKING I grafi sono strutture matematiche discrete che rivestono interesse sia per la matematica che per un'ampia gamma di campi applicativi. In ambito matematico il loro studio, la teoria dei grafi, costituisce un'importante parte della combinatoria; i grafi inoltre sono utilizzati in aree come topologia, teoria degli automi, funzioni speciali, geometria dei poliedri, algebre di Lie. I grafi si incontrano in vari capitoli dell'informatica(ad esempio per schematizzare programmi, circuiti, reti di computer, mappe di siti). Il diametro di un grafo altro non è che la distanza massima tra i cammini minimi tra due nodi. Ma la domanda è: come lo calcoliamo? Semplice! L’idea di base, considerando il grafo non pesato (quindi ogni arco ha lo stesso peso degli altri, se vogliamo comunque ragionare in questi termini), potrebbe essere di far partire una BFS (Breadth First Search) dal nodo situato al primo “livello” (quello a sinistra) e vedere quanto dista dall’ultimo a destra. C’è un MA. Infatti, non è detto che la distanza massima sia quella, in quanto potrebbe essere anche tra due nodi dello stesso livello. Questo ci fa capire che la BFS non deve partire da un nodo e basta, ma deve partire da ogni singolo nodo, e

La diversa diffusione dei vari browser, con tecnologie compatibili tra loro, ma con alcune peculiarità uniche, ha portato in passato con Internet Explorer 6 e attualmente con i sistemi basati sul WebKit a progettare le pagine web tenendo conto di un solo browser causando in alcuni casi il funzionamento solo su specifici browser, il che può portare a creare uno standard ancora prima che venga approvato dagli organi competenti. Alla fine del 2015, i principali browser hanno annunciato o eliminato del tutto il supporto ai plugin esterni "standard", come Flash, Silverlight, applet Java. Java Web Start a partire da un link nella pagina Internet scarica e installa l'ultima versione di JDE e dell'applicazione, eseguendoli all'esterno del browser. Fra i vari linguaggi di markup, supportati, la maggior parte dei browser implementa HTML5, ultima versione proposta dal consorzio di standardizzazione W3C. La maggior parte dei browser supporta il JPEG, ma non ancora il più efficiente formato di compressione delle immagini, il JPEG 2000. Descrizione Un web browser si appoggia sempre ad un motore di ricerca per raggiungere i siti web interessati: una volta che quest'ultimo restituisce in output i risultati desiderati, cliccando sull'URL desiderato dall'utente viene eseguita in background una risoluzione tra URL e indirizzo IP interrogando un DNS database, a partire dalla quale parte la richiesta verso il server di destinazione della risorsa con annesso instradamento IP in richiesta e risposta. Le principali funzionalità dei browser disponibili includono:  navigazione a schede (tabbed browsing)  supporto alla navigazione off-line tramite la memoria cache e plugin dedicati per mantenere i link tra le pagine salvate  funzione di download manager con arresto/ripresa sempre tramite la memoria cache  anteprima delle pagine da scaricare  sintesi vocale  integrazione dei feed RSS e di client di posta elettronica o di chat o di assistenza remota  installazione di componenti aggiuntivi ed estensioni per diversi scopi  comando di pulizia (cache, cookie, cronologia, dati di compilazione moduli, ecc)  barre comandi di moltissime applicazioni. Tali programmi fanno utilizzo di protocolli di rete forniti dal sistema operativo (a partire da quelli di livello applicativo come HTTP, ma anche i meno noti FTP, Telnet per lo scambio di file o cartelle, ecc.) attraverso opportune API, permettendo di visualizzare i contenuti delle pagine dei siti web, specificandone l'URL, e interagendo con essi. Queste ultime funzionalità sono supportate dalla capacità del browser di interpretare l'HTML — il codice con il quale sono scritte la maggior parte delle pagine web — e di visualizzarlo in forma di ipertesto grazie al motore di rendering. Nell'architettura di rete client-server di Internet il browser rappresenta dunque il client che fa richieste di risorse web ai vari web server e application serverospitanti rispettivamente siti web e applicazioni web. Esso rappresenta dunque il sistema software di interfacciamento dell'utente con la rete che rende la navigazione dell'utente tipicamente user-friendly, sebbene ai primordi della rete siano esistiti anche browser testuali da riga di comando su shell. I browser vengono principalmente utilizzati su personal computer, ma anche su altri dispositivi che consentono la navigazione in Internet, come i palmari e gli smartphone. Quelli più noti e diffusi sono Internet Explorer, Mozilla Firefox, Google Chrome, Safari e Opera. Navigazione criptata e anonima HTTPS Everywhere è un'estensione per Google Chrome, Mozilla Firefox, Opera, su cellulari con sistema operativo Android, e inserita nell'installazione di Tor Browser, che forza i siti a creare una connessione HTTPS anziché HTTP, se essi supportano il protocollo HTTPS. HTTPS Everywhere è realizzato dalla Electronic Frontier Foundation, in collaborazione con la The Tor Project, Inc. Lato server HTTPS Elsewhere può essere sostituito e reso superfluo dal più sicuro e restrittivo HSTS, in cui il server non solo dichiara di supportare le connessioni HTTPS, ma le impone a tutti gli user agent, rifiutando la comune

connessione HTTP non crittata. HTTPS Elsewhere non segnala all'utente se il sito supporta la sola connessione HTTPS, oppure in aggiunta anche gli standard HSTS e Perfect Forward Secrecy. AdBlock e Adblock Plus sono le prime e tra le più diffuse estensioni gratuite per bloccare qualsiasi tipo di banner pubblicitario. Tor Browser è un programma del progetto The Guardian Project che consente la navigazione anonima su rete Tor sia su siti accessibili dai comuni browser che nel cosiddetto deep web, ma non cifrata (che avviene se e sole viene settata una Virtual Private Network, che Tor Browser non ha): gratuito, a sorgente aperto, portabile (può essere lanciato da chiavetta USB) e stand-alone. Per la cifratura al 2016 l'utente deve affidarsi a una VPN esterna al programma, e in genere con un client proprietario. Tor Browser per Android e il suo plug-in Orbot (client per rete Tor) hanno le stesse caratteristiche per cellulari con sistema operativo Android. Android offre già di suo all'utente la possibilità di indirizzare tutto il traffico Internet del cellulare (da qualsiasi applicazione) ad una rete VPN, laddove Orbot VPN si limita invece a indirizzare verso una rete Tor di tipo VPN i soli siti aperti tramite Orbot ([1]), e non quelli aperti con le altre applicazioni. Col termine "navigazione anonima" spesso si intende che al termine della sessione Internet (una volta chiusa la finestra del browser) i dati raccolti non saranno salvati nel PC locale, cosa che ovviamente non impedisce di visualizzare e salvare copia delle stesse informazioni durante la navigazione (indirizzo IP, luogo da cui si è connessi, cookie, password, siti precedenti visitati), né all'Internet Service Provider (l'operatore tlc che fornisce la connessione Internet) - e che peraltro vi è obbligato per legge -, né ai proprietari dei siti visitati. Dove non è possibile stabilire una connessione anonima e cifrata, se questa connessione è di tipo punto- punto con un altro utente, il contenuto può essere protetto prima di renderlo disponibile crittografandolo con programmi come VeraCrypt, che deve avere installato anche il destinatario per poter decrittare la chat e gli allegati; mittente e destinatario dovranno scambiarsi la relativa password tramite un canale indipendente, come cellulare o fax. I comuni programmi per la compressione dei dati, hanno l'opzione di crittografia con password e di scelta fra algoritmi di cifratura recenti e non ancora violati (quale è il diffuso AES 512). Altri utilizzi I browser non si utilizzano solo per navigare in internet. Infatti, anche strumenti di tipo aziendale (come i sistemi gestionali ERP), sviluppati in versione con interfaccia web, richiedono l'impiego di un browser per navigare fra le tabelle del database, presentare dati elaborati all'utente. L'esempio può essere esteso ad altre tipologie di applicazioni. Attualmente il browser più usato al mondo è Google Chrome. Non esiste un unico metodo per verificare l'uso di un determinato tipo di browser rispetto agli altri, per questo i risultati dei diversi contatori possono differire anche di diversi punti percentuali. RANKING Il ranking è una sorta di punteggio che Google attribuisce al tuo sito web e alle pagine che lo compongono. Le pagine con un valore di ranking più alto hanno maggiori probabilità di comparire nelle prime posizioni dei risultati del motore di ricerca su particolari parole chiave. E' quindi molto importante perché avere un ranking basso o alto equivale a dire avere poca o molta visibilità su internet. Gran parte del traffico online arriva dai motori di ricerca. RANKING: Nel posizionamento nei motori di ricerca, è il metodo con cui un motore dispone i risultati di ricerca. Il ranking è quindi la posizione che un motore di ricerca, attribuisce ad un sito, nella classifica. Letteralmente ( classificazione, collocamento ) indica la posizione di un sito in base ai risultati di una ricerca effettuata con un motore di ricerca. Maggiore è il Ranking è maggiore sarà la possibilità che un sito venga visitato. PAGERANK: Il pagerank di Google è un valore numerico (che va da 0 a 10) che rappresenta l'importanza di una data pagina nel web. Il pagerank è importante perché può influenzare il ranking nei risultati di ricerca di Google.

le interfacce chiamate SAP (Service Access Point). Ogni livello parla solo con quello immediatamente superiore e con quello immediatamente inferiore. I protocolli regolano invece la comunicazione tra due entità dello stesso livello, che serve a fornire servizi al livello superiore. In una rete a pacchetto ciascun livello aggiunge ai pacchetti una intestazione, attraverso una operazione detta imbustamento. In particolare l'unità dati di ciascun livello o protocollo è detta PDU suddivisa a sua volta in SDU che rappresenta la parte di dati utili proveniente dagli strati superiori e la PCI che rappresenta l'informazione di overhead aggiunta dal protocollo del livello N cioè l'intestazione. Ciascun protocollo quindi regola normalmente solo una parte degli aspetti di una comunicazione e le funzionalità stesse del protocollo sono immediatamente ricavabili dall'intelligibilità, cioè dal significato logico, dei loro campi dato aggiuntivi. I vari livelli sono dunque organizzati in pile di protocolli (figura 2). Le "pila protocollare" di protocolli sono un modo flessibile per combinare componenti per realizzare un servizio. Un esempio reale di una organizzazione a livelli protocollari, classico nelle trattazioni inerenti alle reti di calcolatori, è quello del percorso di una valigia in un viaggio aereo partendo dalla casa di origine all'hotel di destinazione. Il primo livello che notiamo è quello della preparazione della valigia: il turista prende i vestiti e ve li ripone per poi chiuderla, come ciò viene fatto è definito dal protocollo del primo livello. Il secondo livello è quello dell'addetta alle valigie all'aeroporto di partenza, il turista le consegna la valigia (passaggio dal primo al secondo livello) e l'addetta attacca alla valigia le informazioni relative al volo e alla destinazione. Qui notiamo l'aspetto fondamentale dell'organizzazione a livelli protocollari, cioè che per l'addetta non è necessario conoscere come i vestiti sono stati riposti nella valigia, altresì non è necessario per il viaggiatore conoscere le operazioni che deve effettuare l'addetta, egli infatti otterrà ciò che vuole (avere i vestiti all'hotel d'arrivo), senza che ciò influisca affatto su come gli altri protocolli debbano lavorare, a patto che lo facciano correttamente. La struttura serve ad adempiere ad alcuni compiti:  controllo dell'errore;  controllo del flusso;  frammentazione e riassemblaggio;  multiplexing, in modo che sessioni dello strato più alto possano condividere una singola connessione dello strato più basso;  instaurazione della connessione. Tale architettura presenta vantaggi concettuali e strutturali anche se alcuni si sono opposti in maniera decisa in quanto uno strato spesso duplica le funzionalità di un altro strato in maniera ripetitiva. Ad esempio, il servizio di ADSL viene fornito con diverse modalità, le più comuni sono chiamate PPP over ATM (ovvero il protocollo Point to Point usa i servizi forniti dal protocollo ATM) e PPP over Ethernet. Il livello più basso (livello 1) è detto "livello fisico" e si occupa di gestire la trasmissione dei segnali attraverso il mezzo di trasporto (cavo, fibra ottica, infrarossi, ecc.). Il livello più elevato (livello 7) è chiamato "livello applicativo" ed è quello che permette all'utente di creare il messaggio da comunicare. La divisione in livelli è piuttosto rigida a livello di specifica dei protocolli, mentre nell'implementazione spesso diversi livelli vengono implementati insieme in uno stesso modulo software. Non è detto che due macchine che comunicano usino la stessa pila di protocolli. Ad esempio, se vi connettete ad internet attraverso un modem voi appoggiate il livello di rete IPsu una connessione PPP, mentre il server a cui vi collegate probabilmente appoggia la rete IP su una connessione ethernet. Il termine protocollo si applica anche ad alcune reti a commutazione di circuito, come SDH, dove l'imbustamento è un circuito dedicato a trasmettere informazioni di controllo. L’ISO L'International Organization for Standardization (ISO) nel 1979 ha definito la pila di protocolli Open Systems Interconnection (modello OSI), con l'intenzione di creare uno standard per le telecomunicazioni da usare nelle reti di tutto il mondo. All'atto pratico però, lo standard de facto che viene comunemente usato nella maggior parte delle reti, è il TCP/IP, definito nella RFC 1155. Le differenze fondamentali dei due standard sono semplici: il primo è stato definito a tavolino da un'organizzazione super partes, mentre il secondo è opera di chi costruì materialmente le prime reti, sviluppandolo sul campo. Inoltre, lo standard ISO/OSI assegna un determinato compito ad ogni livello, mentre il TCP/IP è più "elastico" e permette di sviluppare protocolli che svolgono più di un compito-base.

RETI CASUALI E SORRETTE DALLA LEGGE DI POTENZA (lezione 28/11) Viene definita rete a invarianza di scala (in inglese scale-free network) un grafo che gode della seguente proprietà: se si considera la relazione tra il numero di nodi ed il numero delle loro connessioni si vede che il suo grafico è di tipo esponenziale negativo, e quindi invariante per cambiamenti di scala. Questa invarianza di scala significa che paragonando il numero di due tipi di nodi, ad esempio quelli con 10 connessioni e quelli con 15, si vede che la proporzione fra i due è , dove Nb ed Na sono il numero di nodi del denominatore e numeratore rispettivamente mentre a è un parametro del tipo di rete considerato. Questa legge è detta legge di potenza, di cui a è il parametro. Il termine fu coniato da Albert-László Barabási dell'Università di Notre Dame (USA) nel 1998. Complessità e reti di interazione Il termine “complesso” deriva dal latino cum (insieme) – plexus (intrecciato), “intrecciato insieme”: un sistema complesso è infatti composto da più parti collegate tra di loro ed “intrecciate” le une alle altre sicché il risultato è diverso dalla somma delle parti. Il comportamento di un sistema complesso non si può desumere dalla analisi, per quanto accurata, degli elementi che lo compongono: bisogna invece osservare le interazioni tra essi. Entità semplici interagenti tra loro e con l’ambiente circostante possono infatti dare luogo a comportamenti macroscopici non banali detti “comportamenti emergenti”. Un comportamento emergente è un fenomeno collettivo: si presenta cioè spontaneamente e non grazie ad un’organizzazione centralizzata. Sistemi che apparentemente non hanno nulla in comune, come ad esempio uno stormo di uccelli, la rete internet e le reti metaboliche, hanno sorprendentemente delle similarità nascoste. Condividono infatti lo stesso tipo di architettura nella struttura delle interazioni: una sorta di “scheletro” che specifica quali parti di ciascun sistema interagiscono tra loro. Questo scheletro è una rete complessa, un oggetto astratto che può essere visualizzato come un grafo in cui nodi, che corrispondono alle componenti individuali del sistema, sono collegati da legami, che schematizzano le interazioni. Sistemi molto diversi per la natura delle entità costituenti si assomigliano molto dal punto di vista di questa struttura sottostante. Sebbene la specifica forma dell’interazione che avviene lungo i contatti abbia anch’essa un ruolo nella dinamica di un sistema complesso, la struttura (topologia (1)) della rete dei contatti è cruciale nel determinare il comportamento collettivo. Per questo motivo la “teoria delle reti” ha assunto un ruolo centrale nella scienza della complessità: permette di investigare con un approccio unitario fenomeni molto diversi tra loro e tradizionalmente oggetto di discipline diverse. Questo è all’origine della natura fortemente interdisciplinare della scienza della complessità. Trasversale alle tante applicazioni interdisciplinari, la teoria delle reti si occupa dunque dello studio delle proprietà topologiche di questi oggetti astratti e di come queste proprietà si riflettano sui comportamenti emergenti e sulla dinamica dei sistemi complessi, nonché di come la rete stessa delle interazioni possa a sua volta modificarsi e riaggiustarsi in modo adattivo. L’obiettivo di questa analisi non è solo descrittivo, ma spesso è volto a comprendere come, agendo sulla rete dei contatti, si possano modificare i pattern emergenti. Come esempio pensiamo ai modelli epidemiologici. Fino a tempi recenti l’effetto della struttura della rete di contatti della popolazione ospite non veniva preso in considerazione. Oggi si sa invece che l’esito di una dinamica di diffusione di un agente patogeno risulta pesantemente influenzato dalla rete di interazione della popolazione in cui l’agente infettivo si diffonde. Le caratteristiche specifiche delle reti sociali, soprattutto la alta eterogeneità, rafforzano fortemente l’incidenza dell’infezione, e cambiano radicalmente il quadro epidemiologico rispetto a quello classicamente adottato nel descrivere la propagazione delle malattie. Conoscere il ruolo della rete di interazione nella dinamica della diffusione è essenziale non solo per la modellizzazione, ma anche per la prevenzione ed il controllo degli outbreak epidemici: l’efficacia della campagne vaccinali, che agiscono riducendo la frazione della popolazione suscettibile alla malattia, dipende in modo specifico da come si va a modificare la rete dei contatti e formulare campagne vaccinali mirate può modificare l’esito della dinamica epidemica.  Alcuni problemi geometrici non dipendono in dettaglio dalla forma degli oggetti coinvolti, ma piuttosto dal modo in cui questi sono connessi. Di questo si occupa una delle più importanti branche della matematica moderna: la topologia, dal greco, studio dei luoghi (tópos (luogo) -lógos (studio)). Più precisamente la topologia è lo studio delle proprietà che accomunano tra loro forme geometriche che non

differiscono per un altro importante aspetto: il coefficiente di clustering di una tipica rete di interazione è di solito molto più grande di quello del random network corrispondente (ossia di una rete con lo stesso numero di nodi e legami, ma dove ciascun legame collega una coppia di nodi scelti a caso). LA FORZA DEI LEGAMI DEBOLI Nel capire come mettere insieme queste due proprietà (small-world e clustering) ha avuto un ruolo molto importante un celebre lavoro del sociologo Mark Granovetter dal titolo “The strength of weak ties” (La forza dei legami deboli, 1973). Granovetter intuì che nelle reti sociali i legami più importanti che mantengono insieme una rete sono, paradossalmente, i legami “deboli”: sono le conoscenze più superficiali a fare da ponte tra gruppi stretti di persone. Questa intuizione venne ripresa venticinque anni dopo (nel 1998) da Steven Strogatz e Duncan Watts. Ispirati dal lavoro di Granovetter, intuirono che è proprio la presenza di legami deboli tra comunità separate tra loro, ma internamente molto coese, a garantire l’effetto small-world, mentre i legami “forti” garantiscono l’aggregazione locale. MODELLO DI WATTS E STROGATZ Il modello di Watts e Strogatz nasce dal tentativo di unire le due proprietà di small-world e clustering osservate nelle reti di interazione. Watts e Strogatz studiarono reti reali di contatti in sistemi molto diversi tra loro, come la rete neurale del verme Caenorhabditis elegans, la rete elettrica degli Stati Uniti occidentali e la rete di collaborazione degli attori cinematografici. Realizzarono che la proprietà di small-world non appartiene solo alle reti sociali, ma anche a molte reti biologiche e tecnologiche. Osservarono che queste reti non somigliano né a grafi regolari né a grafi casuali, ma si trovano in qualche modo a metà tra questi due estremi: presentano una forte aggregazione, come le reti regolari (che però non sono small-world), ma sono small-world come una rete random (che però ha bassa aggregazione). Ispirati dall’idea di Granovetter sull’importante ruolo dei legami deboli ipotizzarono che proprio i legami deboli potessero garantire la proprietà di small-world. Capirono anche che non è affatto necessario che i legami deboli siano numerosi, come in una rete random, ma che al contrario sono sufficienti poche connessioni di lunga distanza perché anche una rete sostanzialmente ordinata, quindi con alto clustering, veda diminuire drasticamente il suo “diametro”, cioè la distanza massima tra le coppie di punti, diventando small-world. Proposero dunque un modello di rete che interpola tra i due casi estremi di una rete regolare e di una rete completamente casuale. Nel modello di Watts e Strogatz, partendo da una rete regolare, alcune connessioni vengono riallacciate in maniera casuale creando delle “scorciatoie”, o “shortcuts”. Se indichiamo con p la frazione di legami riallacciati: per p uguale a zero la rete è regolare, per p uguale a 1 la rete è completamente random. Per valori di p intermedi si ottengono reti con alto clustering che contemporaneamente sono small-world. L’influenza degli shortcuts è drammatica anche quando p è piccolo: riallacciando anche un solo link si può dimezzare il diametro della rete. Sono proprio queste connessioni riallacciate, questi cortocircuiti, i “legami deboli” di cui parla Granovetter, che sono in ultima analisi responsabili dell’effetto small-world. RETI SCALE-FREE E MODELLO DI BARABÁSI-ALBERT Le reti generate dal modello di Watts-Strogatz sono reti small-world ad elevata connettività e somigliano dunque molto alle reti di interazione di un sistema complesso per quanto detto fino ad ora. Tuttavia, si discostano da molte di esse per quanto riguarda la distribuzione del grado, ossia del numero di vicini, cioè la probabilità che un nodo scelto a caso abbia un certo valore del grado. Le reti prodotte dal modello di Watts- Strogatz sono omogenee: il numero di vicini di un nodo è circa lo stesso per tutti i nodi, e si discosta di poco dal valore medio (il grado è distribuito secondo la distribuzione cosiddetta di Poisson). Nella maggior parte delle reti reali la distribuzione del grado devia invece in modo significativo da una distribuzione di questo tipo. In molti casi, come per il World Wide Web, per la rete dei router di Internet, o per le reti metaboliche, la distribuzione del grado è fortemente disomogenea, e segue una cosiddetta “legge a potenza” (power-law): ci sono molti nodi con poche connessioni e pochi nodi con molte connessioni. Più precisamente, la frazione di nodi che ha un dato grado k è proporzionale ad una potenza negativa di k. Questa particolare legge vale

indipendentemente dalla scala, ossia dal numero di nodi della rete che si osserva. L’esponente che compare nella legge a potenza è diverso in reti differenti, ma risulta quasi sempre compreso tra -1 e -3. La scoperta di questa ulteriore caratteristica delle reti di interazione ha portato alla elaborazione di modelli di rete cosiddetti scale-free, il più celebre dei quali è quello proposto da A.L. Barabási e R. Albert (1999). L’idea alla base del modello di Barabási-Albert è di ragionare su come la rete si è formata tramite aggregazione successiva di nodi. Barabási e Albert fanno un’ipotesi molto semplice sulla crescita della rete e cioè che quando nuovi nodi si aggiungono, si collegano con maggiore probabilità a nodi già ricchi di connessioni (“preferential attachment”). Questa semplice ipotesi dà luogo ad un fenomeno noto come “rich get richer” (i ricchi diventano ancora più ricchi). In ambito economico questo stesso meccanismo si manifesta nella famosa legge di Pareto per cui la ricchezza tende a concentrarsi nelle mani di pochi individui molto ricchi mentre è molto scarsa nel resto della popolazione. L’economista Vilfredo Pareto osservò infatti che la ricchezza è distribuita in modo fortemente eterogeneo, proprio secondo una legge a potenza. Nel caso delle reti, questo meccanismo si manifesta matematicamente nella distribuzione a potenza del grado dei nodi. La topologia di queste reti scale-free è dominata da un numero piccolo di nodi molto importanti e molto collegati, detti “hub”, che uniscono il resto degli elementi meno connessi del sistema. Sono gli hub questa volta, accorciando tutte la distanze tra coppie di nodi, a garantire alla rete la proprietà di small-world.

Reti Complesse: Small-World, Clustering e Scale-Free - Prof. Dondi, Appunti di Elementi di Informatica

Documenti correlati

Anteprima parziale del testo

Scarica Reti Complesse: Small-World, Clustering e Scale-Free - Prof. Dondi e più Appunti in PDF di Elementi di Informatica solo su Docsity!

ESPERIMENTO DI MILGRAM