(Laboratorio di ) Sistemi Informatici Avanzati

Slides:



Advertisements
Presentazioni simili
Il problema del cammino minimo tra 2 nodi in un grafo non cooperativo
Advertisements

08 Febbraio 2008 BOZZA Laboratorio di ricerca operativa I grafi e il problema del cammino minimo a.a. 2007/2008 Calogero Vetro.
Introduzione ai grafi Grafo diretto e non diretto
Estendere i linguaggi: i tipi di dato astratti
CONOSCERE CONOSCERSI COMUNICARE
Grafi Algoritmi e Strutture Dati. Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano Algoritmi e strutture dati 2/ed 2 Copyright © The McGraw.
Algoritmi e Strutture Dati
Cammini minimi con una sorgente
Rappresentazione di grafi
Breath-first search Visita in ampiezza di un grafo Algoritmo Esempio
Depth-first search Visita in profondità di un grafo Algoritmo Esempio
3. Modelli di reti complesse
grafi nel mondo reale: reti stradali internet incontri sportivi nodi = incroci, archi = strade internet nodi = pagine, archi = links incontri sportivi.
Analisi Interprocedurale
Algoritmi e Strutture Dati
Algoritmi e Strutture Dati
Università degli Studi di Roma Tor Vergata
Algoritmi e Strutture Dati con Laboratorio (Modulo II)
Capitolo 13 Cammini minimi: Algoritmo di Floyd e Warshall Algoritmi e Strutture Dati.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Algoritmi e Strutture Dati
Visite di grafi Algoritmi e Strutture Dati. Camil Demetrescu, Irene Finocchi, Giuseppe F. ItalianoAlgoritmi e strutture dati Copyright © The McGraw.
Algoritmi e Strutture Dati
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Cammini minimi Algoritmo SPT.Acyclic
Algoritmi e Strutture Dati (Mod. B)
Algoritmi e Strutture Dati (Mod. B)
Modelli e Algoritmi per la Logistica
Modelli e Algoritmi per la Logistica
Alberi ricoprenti minimi Alcune applicazioni Lunedì 17 novembre 2003.
Esercizi 5 Grafi.
Esercizi 5 Grafi.
Richiami di matematica discreta: grafi e alberi
grafi e reti Ottimizzazione su Reti - Network Optimization Testi :
(Laboratorio di ) Sistemi Informatici Avanzati
Automi LAVORO SVOLTO DA MARIO GERMAN O
Prof. Cerulli – Dott.ssa Gentili
Andrea Martire – Salvatore Loria Sistemi intelligenti A.A. 2011/2012.
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
Algoritmi e Strutture Dati
2. Grafi.
Algoritmi e Strutture Dati
Componenti fortemente connesse
Cammini minimi tra tutte le coppie
Prevedere i risultati elettorali su Facebook!!! Non cè solo Mi Piace… Elaborato di: Stefano GUERRETTI.
Lezione n° 18: Maggio Problema del trasporto: formulazione matematica Anno accademico 2008/2009 Prof. Cerulli – Dott.ssa Gentili Lezioni di.
COMUNICAZIONE ONLINE, RETI E VIRTUALITA MATTEO CRISTANI.
Alberi di copertura minimi. Dato un grafo pesato G = (V,E), si richiede di trovare un albero T = (V,E’), E’  E, tale che la somma dei pesi associati.
Grafi CORDA – Informatica A. Ferrari Testi da Marco Bernardo Edoardo Bontà Dispense del Corso di Algoritmi e Strutture Dati.
Master Bioinformatica 2002: Grafi
4/4/2015E. Giovannetti -- OI09.1 Olimpiadi di Informatica 2010 Giornate preparatorie Dipartimento di Informatica Università di Torino marzo – Un.
Reti Complesse seconda lezione
AMBIENTE E RIUTILIZZO Scuola Media Carozzi - laboratorio di informatica.
Capitolo 13 Cammini minimi: Ordinamento topologico Algoritmi e Strutture Dati.
Olimpiadi di Informatica 2010 Giornate preparatorie
Algoritmi elementari su grafi
Ordinamento topologico
Componenti fortemente connesse
Capitolo 13 Cammini minimi Algoritmi e Strutture Dati.
Capitolo 13 Cammini minimi: Bellman e Ford Algoritmi e Strutture Dati.
Capitolo 13 Cammini minimi Algoritmi e Strutture Dati.
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati.
Grafi: rappresentazione e visita
LA SOCIAL NETWORK ANALYSIS
Capitolo 11 Grafi e visite di grafi Algoritmi e Strutture Dati Camil Demetrescu, Irene Finocchi, Giuseppe F. Italiano.
OTTIMIZZAZIONE DI UN PERCORSO GRAFO CAMMINO MINIMO.
4 maggio 2016 Fiorenza Deriu Linee, direzione e densità XII Modulo Dipartimento di Scienze Statistiche.
Lezioni di Ricerca Operativa Corso di Laurea in Informatica
AA LEZ 26Sistemi per la Gestione Aziendale - Prof. Giuseppe Zollo1 Sistemi per la Gestione Aziendale. AA Ingegneria Gestionale (LS) Facoltà.
Transcript della presentazione:

(Laboratorio di ) Sistemi Informatici Avanzati Giuseppe Manco

Grafi

Teoria dei grafi Grafi Grafi diretti Dimensione, ordine Degree, degree distribution Sottografi Cammini, componenti Geodetica Alcuni grafi particolari centralità Diadi e triadi Cmmini, geodetia, componenti fortemente/debolmente connesse Centralità Alcuni grafi diretti particolari

Definizione Un grafo G è una coppia (V,E) di vertici (V) e archi (E)

Grafo indiretto Digrafo Archi simmetrici Archi diretti L A D M B F C I D B G E G A H C F coauthorship links Actor network protein interactions URLs su www Chiamate telefoniche metabolic reactions

Dimensione, ordine Dimensione Ordine Numero di nodi in V Numero L di archi in E Dimensione 7 Ordine 8

Grado Il numero di archi in un grafo I grafi diretti definiscono in-degree e out-degree. A B A G F B C D E

Grado medio j i A F B C D E

Grafi completi Ordine massimo Un grafo di ordine L=Lmax è un grafo completo Il grado medio è

Sparsità Rapporto tra il numero effettivo di archi e il massimo numero di archi

Alcune reti Estrema sparsità L << Lmax <k> <<N-1. or WWW (ND Sample): N=325,729; L=1.4 106 Lmax=1012 <k>=4.51 Protein (S. Cerevisiae): N= 1,870; L=4,470 Lmax=107 <k>=2.39 Coauthorship (Math): N= 70,975; L=2 105 Lmax=3 1010 <k>=3.9 Movie Actors: N=212,250; L=6 106 Lmax=1.8 1013 <k>=28.78 (Sorgente: Albert, Barabasi, RMP2002) Estrema sparsità

N L <k> (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, 167-256 (2003) ,

Metcalfe’s law Metcalfe's law, frequently quoted during the internet boom of 2000, states that the value of a network is proportional to the square of the number of its nodes, i.e. $N^2$. Formulated around 1980 in terms of communication devices by Robert M. Metcalfe, the inventor of Ethernet\cite{Gilder_Forbes-ASAP_1993}, the idea behind Metcalfe's law is that the more individuals use a network, the more valuable it becomes. Indeed, a fax machine is useless to you if there is no one to send a fax to. The more of your acquaintances have a fax machine, the more valuable it is to you as well. The $N^2$ dependence encodes the fact that if a network has $N=10$ members, there are $L_{max}=45$ different possible connections that these members can make to each other. If the network doubles in size to $N=20$, the number of connections doesn't merely double but roughly quadruples to 190, an effect often called "network effect" or "network externality" in economics. During the Internet boom Metcalfe's law was frequently used to offer a quantitative valuation for internet companies, supporting a "build it and they will come " mentality\cite{Briscoe_Spectrum-IEEE_2006}. It implied that the value of a service is proportional to the square of the number of its consumers or users, while costs would grow only linearly. Hence if the service attracts sufficient number of users, it will inevitably become profitable, as $N^2$ will surely surpass $N$ at some sufficiently large $N$ value. Hence Metcalf's Law offered credibility to growth, while neglecting profitability, fueling the Internet bubble of 2001. Metcalfe's law imagines that networks are complete graphs. It is based on Eq. (\ref{EQ-L-Max}), indicating that if all links of communication network with $N$ nodes are equally valuable, the total value of the network is proportional to $N(N-1)/2$, that is, roughly, $N^2$. There are two fundamental problems with Metcalfe's law: ($i$) While all links are possible, in real networks not all links are present. Indeed, most real networks are, which means that only a very small fraction of the links are present. If we assign a value to each link, then the total value of the network will grow slower than $N^2$, as we will see in the coming chapters. ($ii$) Not all links are of equal value. Some links are used heavily while the vast majority of links are 'weak', i.e. they are rarely utilized. (Sorgente: Barabasi, http://spectrum.ieee.org/computing/networks/metcalfes-law-is-wrong)

Matrice di adiacenza Aij=1 se esiste un arco (i,j) 4 2 3 1

Matrice di adiacenza b e g a c f h d a b c d e f g h a 0 1 0 0 1 0 1 0 b 1 0 1 0 0 0 0 1 c 0 1 0 1 0 1 1 0 d 0 0 1 0 1 0 0 0 e 1 0 0 1 0 0 0 0 f 0 0 1 0 0 0 1 0 g 1 0 1 0 0 0 0 0 h 0 1 0 0 0 0 0 0 The adjacency matrix can take far more complicated forms for a larger network….

4 3 2 1 4 3 2 1

Grafi speciali Grafo vuoto con 5 nodi (Z5) Stella con 5 vertici Ciclico con 5 vertici

Albero Foresta

Indiretto Digrafo 4 4 1 1 2 2 3 3 Actor network, protein-protein interactions WWW, citation networks

Non pesato Pesato 4 4 1 1 2 2 3 3 protein-protein interactions, www Call Graph, metabolic networks

auto-archi multigrafo 4 4 1 1 2 2 3 3 Protein interaction network, www Social networks, collaboration networks

Completo (K4) 4 1 2 3 Actor network, protein-protein interactions

I grafi reali WWW Protein Interactions Collaboration network multigrafo diretto, auto-archi Protein Interactions Indiretto non pesato con auto-archi Collaboration network Indiretto, multigrafo, pesato Chiamate a telefonia Diretto, pesato Collegamenti Facebook Indiretto

Grafo bipartito Nodi suddivisi in due gruppi Grafi completi bipartiti Nessun arco ammesso nello stesso gruppo Grafi completi bipartiti Hollywood actor network Collaboration networks Disease network (diseasome)

Goh, Cusick, Valle, Childs, Vidal & Barabási, PNAS (2007) GENOME PHENOME DISEASOME Goh, Cusick, Valle, Childs, Vidal & Barabási, PNAS (2007)

Sottografo Un sottoinsieme W di V che include tutti gli archi in E relativi a W

Diade Sottografo di due nodi Dyad census: (D0,D1)

Diade Dyad census: (M,A,N) N numero di coppie senza archi A numero di coppie con un solo arco M numero di coppie con più archi Dyad census: (M,A,N)

Triade Sottografo di dimensione 3

Triade Tryad census: il conteggio dei 16 tipi di grafi elencati sopra

Cammini Un cammino è una sequenza di nodi adiacenti (ovvero, collegati da un arco) 1.2 2.1 1.3.4 4.2.1.3 1.2.4 1.3.5.6 1.3.4.5.7

Cammini tra due nodi Nij numero di cammini tra i e j  

Raggiungibilità Se esiste un cammino da A a B, allora B è raggiungibile da A Se ogni vertice è raggiungibile da un altro, allora il grafo è connesso

Componenti connesse Una componente connessa di un grafo indiretto è un sottografo massimale connesso B A C D

Componenti connesse Se ogni nodo di un digrafo è raggiungibile da un altro, allora il grafo è fortemente connesso Se ogni nodo di un digrafo è raggiungibile da un altro senza considerare il verso degli archi, allora il grafo è debolmente connesso Una componente connessa (debolmente/fortemente) è un sottografo massimale (debolmente/fortemente) connesso

Connettività, componenti La matrice di adiacenza di un grafo con molte componenti può essere rappresentata a blocchi

La componente gigante Una componente che racchiude la maggior parte del grafo

Distanza La distanza geodetica (geodesic path) tra due nodi è il cammino di lunghezza minima tra questi due nodi *se i due nodi sono sconnessi, la distanza è infinita Nei digrafi il verso conta La distanza tra A e B può essere diversa da quella tra B e A B A C D B A C D

Diametro, distanza media dmax la distanza massima tra una coppia di nodi nel grafo. Distanza media, <d>, per un grafo connesso: dij è la distanza tra i e j Su un grafo indiretto, dij =dji , quindi

N L <k> (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, 167-256 (2003) ,

Misure su grafi

Cutpoints Un vertice è un cutpoint se la sua rimozione aumenta le componenti di un grafo

Ponti Un arco è un bridge (ponte) se la sua rimozione aumenta le componenti Grafo senza ponti

Connettività La connettività di un grafo G è il minimo numero di nodi che bisogna eliminare per rendere il grafo disconnesso

Connettività (archi) Il minimo numero di archi da eliminare per rendere il grafo disconnesso Edge-connectivity Connectivity

Centralità Il grado di centralità (potenziale di comunicazione) è il grado (normalizzato) di un nodo

Closeness Potenziale di comunicazione indipendente

Betweeness Il numero di cammini che contengono a

Coefficiente di clustering Quanti dei tuoi vicini sono connessi da un arco? Alternativamente

Nodi su una linea

N L <k> (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, 167-256 (2003) ,

Degree distribution Degree distribution P(k): probabilità che un vertice scelto in maniera casuale abbia grado k Nk = # nodi di grado k P(k) = Nk / N k P(k) 0.6 0.5 0.4 0.3 0.2 0.1 1 2 3 4

Degree distribution e reti reali Right-skewed Una coda lunga di valori molto lontani dal valore medio Complicata da misurare Istogrammi su scale esponenziali Power laws

Cumulative degree distribution (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, 167-256 (2003)

Power laws Probabilità di un valore che varia in misura inversamente proporzionale ad una potenza di quel valore

Distribuzioni classiche

Distribuzioni power law

Distribuzioni power law Poche città con una grande popolazione, molte città con una popolazione piccola 40 città della dimensione di New York 2700 città con meno di 110,000. Plottando l’istogramma, su scale logaritmiche, otteniamo una linea retta

Power law Possiamo rappresentare gli istrogrammi con Se p(x) rappresenta la distribuzione tra x e x + dx E l’istogramma è una linea in scala log-log

Power law Piccole occorrenze estremamente comuni Grandi occorrenze molto rare Occorrono in diversi fenomeni city populations Grado dei terremoti, crateri lunari, tempeste solari computer files Frequenze d’uso delle parole nel linguaggio umano Il numero di articoli che un ricercatore scrive Il numero di citazioni di un articolo Il numero di link di una pagina web Le vendite di un libro …

Power law: Social networks Numero di azioni che un utente compie (digg) Numero di amicizie (flixster)

Plottare le power-laws α = 2.5 Istogramma con equal binning

La scala lineare La relazione power-law non apparente Ha senso se si guarda a pochi bin Range limitato Intero range

Log-log plot Le potenze spaziate in maniera uniforme 1 2 3 10 20 30 100 200 20=1, 21=2, 22=4, 23=8, 24=16, 25=32, 26=64, ….

ln (# di occorrenze di x) Log-log plot Metodo più comune Non necessariamente accurato ln (# di occorrenze di x) ln(x)

Plottare le power laws Molte osservazioni quando x < 10 Rumore sulla coda, molta variabilità

Logarithmic binning La size dei bin aumenta in progressione geometrica 0.1, 0,2, 0.4, …. Normalizzazione: il numero di elementi in un intervallo di ampiezza Δx va diviso per Δx stesso per rendere il conteggio unitario Il dato normalizzato diventa indipendente dall’ampiezza

Plottare le power laws Logarithmic binning Ancora rumore

Distribuzione cumulativa Nessuna perdita di informazione P(x) = P(X>x) Il risultato è ancora una power-law con esponente α – 1.

Plottare le power laws Cumulative distribution

Power laws, Pareto distribution, Zipf's law Le distribuzioni cumulative sono anche chiamate rank/frequency distributions. Le cumulative che seguono una powe law sono anche dette Zipf o Pareto “Zipf’s law” e“Pareto distribution” sono sinonimi di “power-law distribution”. Le differenze sono essenzialmente nel plot Zipf x sull’asse orizzontale, P(x) su quello verticale Pareto al contrario

Cumulative, rank/frequency Si ordinano le misurazioni Si plotta il rank sulla misurazione

Stimare una power-law Va individuato il valore xmin da cui la power-law comincia xmin è maggiore di 0 Perché?

Stimare α dai dati Si trova lo slope direttamente dalla linea Nell’esempio precedente, il logarithmic binning produce α = 2.26 ± 0.02 Si estrae l’esponente utilizzando la formula α = 2.500 ± 0.002 nell’esempio precedente

Esempi di power laws

N L <k> (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, 167-256 (2003) ,

Non tutto è una power law

Non tutto è una power law Exponential tails Distribuzione cumulativa ancora esponenziale Semi-logarithmic plot

Maximum degree Il grado oltre il quale non ci sono più nodi Su una power-law, otteniamo Stima approssimativa

Maximum degree Una stima più accurata Un grafo con esattamente m vertici di grado k e nessun vertice di grado maggiore di k ha probabilità Probabilità che il grado più alto sia k

Resilience Studio della connettività Se alcuni vertici sono rimossi, la lunghezza dei cammini aumenta Alcuni nodi divengono disconnessi Livello di resilience correlato alla distanza media Epidemiologia Robustezza ad attacchi

Uno studio World Wide Web Due strategie di removal Un frammento di 326.000 pagine Distribuzione Power-law Due strategie di removal Random Rimozione progressiva dei vertici di grado più alto

Risultato Cosa possiamo concludere?

Risultato Cosa possiamo concludere? Alta tollerabilità ai “fallimenti” random Estrema vulnerabilità ai “fallimenti” degli hub