La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

(Laboratorio di ) Sistemi Informatici Avanzati Giuseppe Manco.

Presentazioni simili


Presentazione sul tema: "(Laboratorio di ) Sistemi Informatici Avanzati Giuseppe Manco."— Transcript della presentazione:

1 (Laboratorio di ) Sistemi Informatici Avanzati Giuseppe Manco

2 GRAFI

3 Teoria dei grafi Grafi Dimensione, ordine Degree, degree distribution Sottografi Cammini, componenti Geodetica Alcuni grafi particolari centralità Grafi diretti Diadi e triadi Cmmini, geodetia, componenti fortemente/debolmente connesse Centralità Alcuni grafi diretti particolari

4 Definizione Un grafo G è una coppia (V,E) di vertici (V) e archi (E)

5 Archi simmetrici URLs su www Chiamate telefoniche metabolic reactions Grafo indirettoDigrafo A B D C L M F G H I Archi diretti coauthorship links Actor network protein interactions A G F B C D E

6 Dimensione, ordine Dimensione – Numero di nodi in V Ordine – Numero L di archi in E Dimensione 7 Ordine 8

7 A G F B C D E A B Grado Il numero di archi in un grafo I grafi diretti definiscono in-degree e out-degree.

8 A F B C D E j i Grado medio

9 Grafi completi Ordine massimo Un grafo di ordine L=L max è un grafo completo Il grado medio è

10 Sparsità Rapporto tra il numero effettivo di archi e il massimo numero di archi

11 L << L max or <

12 N L (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, (2003),

13 (Sorgente: Barabasi, calfes-law-is-wrong) Metcalfes law

14 Matrice di adiacenza A ij =1 se esiste un arco (i,j)

15 Matrice di adiacenza a b c d e f g h a b c d e f g h b e g a c f h d

16

17 Grafi speciali Grafo vuoto con 5 nodi (Z 5 ) Stella con 5 vertici Ciclico con 5 vertici

18 Albero Foresta

19 3 IndirettoDigrafo Actor network, protein-protein interactionsWWW, citation networks

20 Non pesatoPesato protein-protein interactions, wwwCall Graph, metabolic networks

21 auto-archimultigrafo Protein interaction network, wwwSocial networks, collaboration networks

22 Completo (K 4 ) Actor network, protein-protein interactions

23 I grafi reali WWW –multigrafo diretto, auto-archi Protein Interactions –Indiretto non pesato con auto-archi Collaboration network –Indiretto, multigrafo, pesato Chiamate a telefonia –Diretto, pesato Collegamenti Facebook –Indiretto

24 Grafo bipartito Nodi suddivisi in due gruppi – Nessun arco ammesso nello stesso gruppo Grafi completi bipartiti Hollywood actor network Collaboration networks Disease network (diseasome)

25 GENOME PHENOME DISEASOME Goh, Cusick, Valle, Childs, Vidal & Barabási, PNAS (2007)

26 Sottografo Un sottoinsieme W di V che include tutti gli archi in E relativi a W

27 Diade Sottografo di due nodi Dyad census: (D 0,D 1 )

28 Diade N numero di coppie senza archi A numero di coppie con un solo arco M numero di coppie con più archi Dyad census: (M,A,N)

29 Triade Sottografo di dimensione 3

30 Triade Tryad census: il conteggio dei 16 tipi di grafi elencati sopra

31 Cammini Un cammino è una sequenza di nodi adiacenti (ovvero, collegati da un arco)

32 N ij numero di cammini tra i e j Cammini tra due nodi

33 Raggiungibilità Se esiste un cammino da A a B, allora B è raggiungibile da A Se ogni vertice è raggiungibile da un altro, allora il grafo è connesso

34 Componenti connesse Una componente connessa di un grafo indiretto è un sottografo massimale connesso D C A B

35 Componenti connesse Se ogni nodo di un digrafo è raggiungibile da un altro, allora il grafo è fortemente connesso Se ogni nodo di un digrafo è raggiungibile da un altro senza considerare il verso degli archi, allora il grafo è debolmente connesso Una componente connessa (debolmente/fortemente) è un sottografo massimale (debolmente/fortemente) connesso

36 La matrice di adiacenza di un grafo con molte componenti può essere rappresentata a blocchi Connettività, componenti

37 La componente gigante Una componente che racchiude la maggior parte del grafo

38 La distanza geodetica (geodesic path) tra due nodi è il cammino di lunghezza minima tra questi due nodi *se i due nodi sono sconnessi, la distanza è infinita Nei digrafi il verso conta La distanza tra A e B può essere diversa da quella tra B e A D C A B D C A B Distanza

39 d max la distanza massima tra una coppia di nodi nel grafo. Distanza media,, per un grafo connesso: d ij è la distanza tra i e j Su un grafo indiretto, d ij =d ji, quindi Diametro, distanza media

40 N L (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, (2003),

41 MISURE SU GRAFI

42 Cutpoints Un vertice è un cutpoint se la sua rimozione aumenta le componenti di un grafo

43 Ponti Un arco è un bridge (ponte) se la sua rimozione aumenta le componenti – Grafo senza ponti

44 Connettività La connettività di un grafo G è il minimo numero di nodi che bisogna eliminare per rendere il grafo disconnesso

45 Connettività (archi) Il minimo numero di archi da eliminare per rendere il grafo disconnesso Edge-connectivity Connectivity

46 Centralità Il grado di centralità (potenziale di comunicazione) è il grado (normalizzato) di un nodo

47

48 Closeness Potenziale di comunicazione indipendente

49

50 Betweeness Il numero di cammini che contengono a

51

52 Coefficiente di clustering Quanti dei tuoi vicini sono connessi da un arco? Alternativamente

53 Nodi su una linea

54 N L (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, (2003),

55 Degree distribution Degree distribution P(k): probabilità che un vertice scelto in maniera casuale abbia grado k N k = # nodi di grado k P(k) = N k / N k P(k)

56 Degree distribution e reti reali Right-skewed – Una coda lunga di valori molto lontani dal valore medio – Complicata da misurare Istogrammi su scale esponenziali – Power laws

57 Cumulative degree distribution (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, (2003)

58 Power laws Probabilità di un valore che varia in misura inversamente proporzionale ad una potenza di quel valore

59 Distribuzioni classiche

60 Distribuzioni power law

61 Poche città con una grande popolazione, molte città con una popolazione piccola – 40 città della dimensione di New York – 2700 città con meno di 110,000. Plottando listogramma, su scale logaritmiche, otteniamo una linea retta

62

63 Power law Possiamo rappresentare gli istrogrammi con Se p(x) rappresenta la distribuzione tra x e x + dx – E listogramma è una linea in scala log-log

64 Power law Piccole occorrenze estremamente comuni Grandi occorrenze molto rare Occorrono in diversi fenomeni – city populations – Grado dei terremoti, crateri lunari, tempeste solari – computer files – Frequenze duso delle parole nel linguaggio umano – Il numero di articoli che un ricercatore scrive – Il numero di citazioni di un articolo – Il numero di link di una pagina web – Le vendite di un libro – …

65 Power law: Social networks Numero di azioni che un utente compie (digg)Numero di amicizie (flixster)

66 Plottare le power-laws α = 2.5 Istogramma con equal binning

67 La scala lineare La relazione power-law non apparente Ha senso se si guarda a pochi bin Intero range Range limitato

68 Log-log plot Le potenze spaziate in maniera uniforme =1, 2 1 =2, 2 2 =4, 2 3 =8, 2 4 =16, 2 5 =32, 2 6 =64, ….

69 Log-log plot Metodo più comune Non necessariamente accurato ln(x) ln (# di occorrenze di x )

70 Plottare le power laws Molte osservazioni quando x < 10 Rumore sulla coda, molta variabilità

71 Logarithmic binning La size dei bin aumenta in progressione geometrica – 0.1, 0,2, 0.4, …. Normalizzazione: il numero di elementi in un intervallo di ampiezza Δx va diviso per Δx stesso per rendere il conteggio unitario – Il dato normalizzato diventa indipendente dallampiezza

72 Plottare le power laws Logarithmic binning Ancora rumore

73 Distribuzione cumulativa Nessuna perdita di informazione – P(x) = P(X>x) – Il risultato è ancora una power-law con esponente α – 1.

74 Plottare le power laws Cumulative distribution

75 Power laws, Pareto distribution, Zipf's law Le distribuzioni cumulative sono anche chiamate rank/frequency distributions. Le cumulative che seguono una powe law sono anche dette Zipf o Pareto –Zipfs law ePareto distribution sono sinonimi di power- law distribution. Le differenze sono essenzialmente nel plot – Zipf x sullasse orizzontale, P(x) su quello verticale – Pareto al contrario

76 Cumulative, rank/frequency Si ordinano le misurazioni – Si plotta il rank sulla misurazione

77 Stimare una power-law Va individuato il valore x min da cui la power- law comincia x min è maggiore di 0 – Perché?

78 Stimare α dai dati Si trova lo slope direttamente dalla linea – Nellesempio precedente, il logarithmic binning produce α = 2.26 ± 0.02 Si estrae lesponente utilizzando la formula – α = ± nellesempio precedente

79 Esempi di power laws

80 N L (Sorgente: : The structure and function of complex networks, M. E. J. Newman, SIAM Review 45, (2003),

81 Non tutto è una power law

82 Exponential tails – Distribuzione cumulativa ancora esponenziale – Semi-logarithmic plot

83 Maximum degree Il grado oltre il quale non ci sono più nodi Su una power-law, otteniamo – Stima approssimativa

84 Maximum degree Una stima più accurata – Un grafo con esattamente m vertici di grado k e nessun vertice di grado maggiore di k ha probabilità – Probabilità che il grado più alto sia k

85 Resilience Studio della connettività Se alcuni vertici sono rimossi, la lunghezza dei cammini aumenta – Alcuni nodi divengono disconnessi Livello di resilience correlato alla distanza media – Epidemiologia – Robustezza ad attacchi

86 Uno studio World Wide Web – Un frammento di pagine – Distribuzione Power-law Due strategie di removal – Random – Rimozione progressiva dei vertici di grado più alto

87 Risultato Cosa possiamo concludere?

88 Risultato Cosa possiamo concludere? – Alta tollerabilità ai fallimenti random – Estrema vulnerabilità ai fallimenti degli hub


Scaricare ppt "(Laboratorio di ) Sistemi Informatici Avanzati Giuseppe Manco."

Presentazioni simili


Annunci Google