Linee, direzione e densità XII Modulo 4 maggio 2016 Fiorenza Deriu Dipartimento di Scienze Statistiche
La teoria dei grafi L’approccio matematico della teoria dei grafi fornisce un linguaggio formale per la descrizione delle reti e dei loro caratteri La teoria dei grafi offre una traduzione dei dati delle matrici in concetti formali e teoremi che possono essere rapportati ai caratteri essenziali delle reti sociali La teoria dei grafi è alla base di software come Ucinet o Gradap La teoria dei grafi riguarda insiemi di elementi (punti, vertici o nodi) e le relazioni tra di essi (linee, spigoli o archi) una matrice che descrive le relazioni fra un gruppo di persone può essere convertita in un grafo di punti collegati da linee Il sociogramma è un tipo di grafo rete sociale I grafi di reti esprimono modelli qualitativi di connessione tra punti (attori sociali) Linee, direzione e densità
I grafi Ciò che importa in un grafo è il modello di connessioni che rappresenta Non rilevano: - la posizione effettiva di un punto su una pagina - la lunghezza delle linee tracciate tra due punti - la dimensione del carattere usato per indicare i punti I concetti di posizione e lunghezza nella teoria dei grafi assumono un significato diverso da quello a noi familiare Per convenzione, in genere, la lunghezza delle linee tra i punti è sempre uguale, salvo i casi in cui per motivi estetici di rappresentazione alcune linee sono più lunghe di altre NON esiste un modo «corretto» di disegnare un grafo Linee, direzione e densità
Esempio Linee, direzione e densità
Concetti di base della teoria dei grafi I tipi di linee che possono essere usate nella costruzione dei grafi in base allo schema sottostante, sono: Linee orientate e non orientate (dati binari) Linee non orientate con valori numerici Linee orientate con valori numerici Dati relazionali Tipo di valori Non orientati Orientati Binari 1 3 Numerici 2 4 Linee, direzione e densità
Esempio di grafo non orientato e orientato e matrici corrispondenti Grafo orientato NB: grafo orientato è detto «digrafo» Linee, direzione e densità
L’intensità di una relazione Se si vuole evidenziare l’intensità di una relazione, il ricercatore può costruire un grafo «segnato» (valued graph), contrassegnato cioè da un valore riportato su ciascuna linea Linee, direzione e densità
Le misure di intensità La più semplice misura di intensità di una relazione è la molteplicità Numero di contatti distinti che costituiscono una relazione B 2 A Le società A e B hanno due consiglieri di amministrazione in comune – la linea (A,B) ha molteplicità 2 Linee, direzione e densità
Adiacenza, vicinato e grado Due punti collegati da una linea si dicono adiacenti B Gli attori A e B sono in connessione diretta tra loro A B A ha grado 3 I punti a cui un determinato punto è adiacente costituiscono il suo vicinato. Il numero totale dei punti del vicinato rappresenta il grado di un punto. Il grado è il valore numerico che esprime la dimensione del suo vicinato (somma dei valori di riga o colonna della matrice di adiacenza) A C D Linee, direzione e densità
Gradi e linee Perché le linee che collegano due punti sono la metà dei punti medesimi 2/2=1) Totale di coppie di punti in un grafo Linee, direzione e densità
Percorsi, lunghezze e distanze I punti di un grafo possono essere collegati direttamente da una linea oppure indirettamente da una sequenza di linee «sentiero» Un sentiero in cui ogni punto e ogni linea sono diversi si chiama percorso (path) Concetto chiave nella teoria dei grafi La lunghezza di un percorso è data dal numero di linee che lo costituiscono Linee, direzione e densità
Esempio di percorso tra 2 punti e di calcolo della sua lunghezza lunghezza percorso da A a D = 2 (ABD) Linee, direzione e densità
Il concetto di distanza La distanza tra due punti esprime un concetto diverso da quello di lunghezza del percorso tra 2 punti Distanza e lunghezza sono da intendersi diversamente dai loro significati fisici quotidiani La lunghezza di un percorso è data dal numero di linee che lo costituiscono - è il numero di passi necessari per andare da un punto all’altro La distanza fra due punti è la lunghezza del percorso più breve che li collega (distanza geodetica) Esempio: da A a D Lunghezza percorsi Distanza AD (1) 1 ACD (2) ABCD (3) Linee, direzione e densità
Varianti dei grafi orientati Occorre tener conto della direzione della relazione che può essere diversa da A a B rispetto a quella da B a A Viene a mancare la simmetria matriciale Il grado si distingue in: Grado in entrata: numero totale dei punti che hanno linee ad esso dirette (valori in colonna – Totale di colonna) Grado in uscita: numero totale di punti verso cui un punto orienta le sue linee (valori in riga – totale di riga) ! In un grafo orientato occorre tener conto solo dei percorsi fatti da linee che vanno nella stessa direzione (flussi informazioni) Linee, direzione e densità
La densità di una rete Descrive il livello generale dei legami fra i punti in un determinato grafo Un grafo si dice completo quando tutti i punti di sono adiacenti l’uno all’altro, cioè ogni punto è collegato direttamente a ognuno degli altri situazione rarissima Il concetto di densità va quindi a misurare quanto ci si trovi distanti da tale situazione di completezza Tanto più numerose saranno le linee, tanto più il grafo sarà denso D (I, G) la densità dipenda da altri due parametri della struttura della rete: l’inclusività e la somma dei gradi dei suoi punti Linee, direzione e densità
L’inclusività di una rete Numero dei punti inclusi nelle varie parti collegate del grafo è data quindi dal numero totale dei punti meno il numero di punti isolati Per esprimere in termini relativi tale misura (proporzione) si rapportano i punti collegati al numero totale dei punti Esempio: grafo con 20 punti di cui 5 isolati PC = 20-5 = 15 I = 15/20 = 0,75 0,75*100 = 75% Il 75% dei punti della rete sono collegati tra loro Quanto più il grafo è inclusivo tanto più sarà denso Linee, direzione e densità
Il grado di connessione dei nodi Il grado di connessione di punti tra loro collegati può variare: alcuni saranno collegati con più punti rispetto ad altri Quanto più elevati sono i gradi dei punti tanto maggiore sarà la densità della rete Per tener conti anche di questo parametro nel calcolo della densità occorre confrontare il numero effettivo di linee presenti e il numero di linee che si avrebbe in un grafo completo Somma dei gradi di un grafo diviso 2 Linee, direzione e densità
Confronti di densità Linee, direzione e densità
La densità in grafi orientati Linee, direzione e densità
Reti ego-centrate e socio-centriche Reti ego-centrate Si ancorano le reti intorno a determinati attori – L’analisi della densità è interessata alla densità dei legami che circondano determinati attori Si trascura dunque l’attore e ci si concentra solo sui legami tra i contatti della sua rete Reti socio-centriche Si focalizza l’attenzione sul modello delle connessioni nella rete come un «tutto», contributo per Barnes distintivo dell’analisi delle reti sociali L’analisi della densità è quella dell’intera rete e non semplicemente delle reti personali di singoli attori Linee, direzione e densità
La misura ego-centrica della densità 6 nodi due densità diverse Linee, direzione e densità
La densità dei grafi segnati (valued graphs) Non c’è accordo su come calcolare la densità su queste reti Ignorare i valori sulle linee e trattare il grafo come se fosse semplicemente orientato o non orientato notevole perdita di informazione Usare il valore della molteplicità delle linee come peso dei legami (linea con m=3 avrà peso 3 – varrà come tre linee) totale ponderato delle linee effettivamente presenti in un grafo Problema del denominatore numero max delle linee che un grafo può contenere deve basarsi su qualche ipotesi sul valore massimo che la molteplicità può assumere nella rete oggetto di studio la molteplicità più alta rilevata nella rete; il numero max di consiglieri in un cda; il numero massimo di cariche cumulabili, etc… Linee, direzione e densità
Problema della dipendenza della densità dalla dimensione del grafo Rende impossibile confrontare misure di densità di grafi di dimensione diversa La densità varia in ragione del rapporto tra le linee effettivamente presenti e quelle teoricamente possibili Grafi più grandi hanno densità più basse rispetto a grafi più piccoli Ciò è anche dovuto a un altro fattore: il tempo Mayhew e Levinger (1976) sostengono che esistono limiti alla quantità di tempo che certi attori sono disposti a investire nell’intraprendere e mantenere relazioni il tempo è limitato, quindi diminuisce all’aumentare dei contatti (d mai superiore a 0,5) Occorre poi considerare il tipo di relazione: amore, amicizia (la prima ha densità più bassa – posso conoscere tante persone ma amarne solo alcune) Linee, direzione e densità
Stima della densità di una rete sulla base di dati campionari Linee, direzione e densità
Metodo di stima della densità di Granovetter (1976) Metodo da usare quando si è incerti sulla attendibilità della stima iniziale del grado medio Sconsiglia di ricorrere a un unico grande campione e di preferire invece un certo numero di sotto-campioni (es.: pop. 100.000 attori è opportuno selezionare sotto-campioni da 100 (almeno 5) o 200 attori (ne basterebbero 2)) Si calcola la densità in ciascun sotto-campione Poi si procede con il calcolo della media delle densità calcolate stima attendibile della densità della rete globale Linee, direzione e densità
Ora esercitiamoci insieme… Impariamo a calcolare il grado (in-degrees e out-degrees) dei punti di una rete Calcoliamo i k-core Calcoliamo l’indice di inclusività Calcoliamo le distanze Calcoliamo e rappresentiamo reti ego-centriche Linee, direzione e densità
Grazie! …ora proseguiamo con qualche esercizio Linee, direzione e densità