4 maggio 2016 Fiorenza Deriu Linee, direzione e densità XII Modulo Dipartimento di Scienze Statistiche.

Slides:



Advertisements
Presentazioni simili
Premessa: si assume di aver risolto (correttamente
Advertisements

Grandezze ed equazioni fondamentali
Metodi Quantitativi per Economia, Finanza e Management Lezione n°4 Analisi bivariata. Analisi di connessione, correlazione e di dipendenza in media.
STRUTTURA DELL'ATOMO Protoni (p+) Neutroni (n°) Elettroni (e­) Gli atomi contengono diversi tipi di particelle subatomiche.
Intervalli di confidenza
I Poligoni.
Introduzione Cosa sono le reti di Petri?
Concetti Legame covalente Legame ionico
1 Il punto di vista Un sistema è una parte del mondo che una persona o un gruppo di persone, durante un certo intervallo di tempo, sceglie di considerare.
Variabili casuali a più dimensioni
Orbitali atomici e numeri quantici
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Cap. 4 Distribuzioni di frequenza, tabelle e grafici Cioè come si sfruttano i dati grezzi, perché è da qui che inizia l’analisi statistica.
Algoritmo di Ford-Fulkerson
NASCITA E SVILUPPO DELLA NETWORK ANALYSIS
Algoritmi e Strutture Dati (Mod. B)
LEGGE DELLA CIRCUITAZIONE
Sistemi di equazioni lineari
Le cause del moto: la situazione prima di Galilei e di Newton
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Analisi delle corrispondenze
Francesco Cavalera Liceo Scientifico "A.Vallone"
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
METODI E CONTROLLI STATISTICI DI PROCESSO
Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA
Le distribuzioni campionarie
2. Grafi.
Un approccio soft per i primi tre anni della primaria
Prevedere i risultati elettorali su Facebook!!! Non cè solo Mi Piace… Elaborato di: Stefano GUERRETTI.
DIDATTICA DELLA MATEMATICA TFA A059
Cenni teorici. La corrente elettrica dal punto di vista microscopico
Elettromagnetismo 2. Il campo elettrico.
Simone Mosca & Daniele Zucchini 4Bi.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Master Bioinformatica 2002: Grafi
Domande riepilogative per l’esame
Didattica e Fondamenti degli Algoritmi e della Calcolabilità Terza giornata: principali classi di complessità computazionale dei problemi Guido Proietti.
L’analisi del contenuto Doppia funzione dell’analisi del contenuto: -Può essere un tipo di ricerca specifico -Può essere una tecnica di ricerca Come TECNICA.
IL CAMPIONE.
Olimpiadi di Informatica 2010 Giornate preparatorie
Probabilità. Un percorso didattico esperimenti e simulazioni L. Cappello 9 Maggio Didattica probabilità e statistica PAS 2014.
Test basati su due campioni Test Chi - quadro
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
2) PROBABILITA’ La quantificazione della ‘possibilità’ del verificarsi di un evento casuale E è detta probabilità P(E) Definizione classica: P(E) è il.
Intervalli di confidenza
Flusso di Costo Minimo Applicazione di algoritmi: Cammini Minimi Successivi (SSP) Esercizio 1 Sia data la seguente rete di flusso, in cui i valori riportati.
Il quadro logico Dopo avere reperito tutte le informazioni necessarie per realizzare il progetto procedo alla sua stesura Utilizzo il Quadro Logico che.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
6. LIMITI Definizione - Funzioni continue - Calcolo dei limiti
ANALISI E INTERPRETAZIONE DATI
LA SOCIAL NETWORK ANALYSIS
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Trasporto di calore per convezione
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
OTTIMIZZAZIONE DI UN PERCORSO GRAFO CAMMINO MINIMO.
Proprietà macromolecolari Il calcolo delle proprietà macromolecolari implica l’utilizzo della statistica della catena polimerica in termini di distanze.
1 LA STATISTICA DESCRITTIVA Docente prof.sa Laura Mercuri.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Gli strumenti di misura
L’analisidei dati L’analisi dei dati Analisi mutlidimensionali: Analisi delle corrispondenze multiple Cluster Analysis.
Programmazione reticolare Economia e Gestione delle Imprese A. A. 2011/2012.
Algoritmi Avanzati a.a.2013/2014 Prof.ssa Rossella Petreschi Albero ricoprente di costo minimo Lezione n°12.
Il DEFF Il DEFF (Design EFFect) è l’Effetto del Piano di
Linee, direzione e densità XII Modulo
Linee, direzione e densità XII Modulo
Transcript della presentazione:

4 maggio 2016 Fiorenza Deriu Linee, direzione e densità XII Modulo Dipartimento di Scienze Statistiche

La teoria dei grafi L’approccio matematico della teoria dei grafi fornisce un linguaggio formale per la descrizione delle reti e dei loro caratteri La teoria dei grafi offre una traduzione dei dati delle matrici in concetti formali e teoremi che possono essere rapportati ai caratteri essenziali delle reti sociali La teoria dei grafi è alla base di software come Ucinet o Gradap La teoria dei grafi riguarda insiemi di elementi (punti, vertici o nodi) e le relazioni tra di essi (linee, spigoli o archi)  una matrice che descrive le relazioni fra un gruppo di persone può essere convertita in un grafo di punti collegati da linee Il sociogramma è un tipo di grafo  rete sociale I grafi di reti esprimono modelli qualitativi di connessione tra punti (attori sociali) Linee, direzione e densità

I grafi Ciò che importa in un grafo è il modello di connessioni che rappresenta Non rilevano: - la posizione effettiva di un punto su una pagina - la lunghezza delle linee tracciate tra due punti - la dimensione del carattere usato per indicare i punti I concetti di posizione e lunghezza nella teoria dei grafi assumono un significato diverso da quello a noi familiare Per convenzione, in genere, la lunghezza delle linee tra i punti è sempre uguale, salvo i casi in cui per motivi estetici di rappresentazione alcune linee sono più lunghe di altre  NON esiste un modo «corretto» di disegnare un grafo Linee, direzione e densità

Esempio Linee, direzione e densità

Concetti di base della teoria dei grafi I tipi di linee che possono essere usate nella costruzione dei grafi in base allo schema sottostante, sono: a)Linee orientate e non orientate (dati binari) b)Linee non orientate con valori numerici c)Linee orientate con valori numerici Linee, direzione e densità Dati relazionali Tipo di valori Non orientatiOrientati Binari13 Numerici24

Esempio di grafo non orientato e orientato e matrici corrispondenti Grafo non orientato Linee, direzione e densità NB: grafo orientato è detto «digrafo» Grafo orientato

L’intensità di una relazione Se si vuole evidenziare l’intensità di una relazione, il ricercatore può costruire un grafo «segnato» (valued graph), contrassegnato cioè da un valore riportato su ciascuna linea Linee, direzione e densità

Le misure di intensità La più semplice misura di intensità di una relazione è la molteplicità Linee, direzione e densità Numero di contatti distinti che costituiscono una relazione A B 2 Le società A e B hanno due consiglieri di amministrazione in comune – la linea (A,B) ha molteplicità 2

Adiacenza, vicinato e grado Due punti collegati da una linea si dicono adiacenti Linee, direzione e densità A B A B Gli attori A e B sono in connessione diretta tra loro I punti a cui un determinato punto è adiacente costituiscono il suo vicinato. Il numero totale dei punti del vicinato rappresenta il grado di un punto. Il grado è il valore numerico che esprime la dimensione del suo vicinato (somma dei valori di riga o colonna della matrice di adiacenza) C D A ha grado 3

Gradi e linee Linee, direzione e densità Totale di coppie di punti in un grafo Perché le linee che collegano due punti sono la metà dei punti medesimi 2/2=1)

Percorsi, lunghezze e distanze I punti di un grafo possono essere collegati direttamente da una linea oppure indirettamente da una sequenza di linee Linee, direzione e densità «sentiero» Un sentiero in cui ogni punto e ogni linea dono diversi si chiama percorso (path) Concetto chiave nella teoria dei grafi La lunghezza di un percorso è data dal numero di linee che lo costituiscono

Esempio di percorso tra 2 punti e di calcolo della sua lunghezza lunghezza percorso da A a D = 2 (ABD) Linee, direzione e densità

Il concetto di distanza La distanza tra due punti esprime un concetto diverso da quello di lunghezza del percorso tra 2 punti Distanza e lunghezza sono da intendersi diversamente dai loro significati fisici quotidiani Linee, direzione e densità La lunghezza di un percorso è data dal numero di linee che lo costituiscono- è il numero di passi necessari per andare da un punto all’altro La distanza fra due punti è la lunghezza del percorso più breve cheli collega (distanza geodetica) Esempio: da A a D Lunghezza percorsiDistanza AD (1)1 ACD (2) ABCD (3)

Varianti dei grafi orientati Occorre tener conto della direzione della relazione che ouò essere diversa da A a B rispetto a quella da B a A Viene a mancare la simmetria matriciale Linee, direzione e densità Il grado si distingue in: a) Grado in entrata: numero totale dei punti che hanno linee ad esso dirette (valori in colonna – Totale di colonna) b) Grado in uscita: numero totale di punti verso cui un punto orienta le sue linee (valori in riga – totale di riga) In un grafo orientato occorre tener conto solo dei percorsi fatti da linee che vanno nella stessa direzione (flussi informazioni)

La densità di una rete Descrive il livello generale dei legami fra i punti in un determinato grafo Un grafo si dice completo quando tutti i punti di sono adiacenti l’uno all’altro, cioè ogni punto è collegato direttamente a ognuno degli altri  situazione rarissima Il concetto di densità va quindi a misurare quanto ci si trovi distanti da tale situazione di completezza Tanto più numerose saranno le linee, tanto più il grafo sarà denso D (I, G) la densità dipenda da altri due parametri della struttura della rete: l’inclusività e la somma dei gradi dei suoi punti Linee, direzione e densità

L’inclusività di una rete Numero dei punti inclusi nelle varie parti collegate del grafo  è data quindi dal numero totale dei punti meno il numero di punti isolati Per esprimere in termini relativi tale misura (proporzione) si rapportano i punti collegati al numero totale dei punti Esempio: grafo con 20 punti di cui 5 isolati PC = 20-5 = 15 I = 15/20 = 0,75  0,75*100 = 75% Il 75% dei punti della rete sono collegati tra loro Quanto più il grafo è inclusivo tanto più sarà denso Linee, direzione e densità

Il grado di connessione dei nodi Il grado di connessione di punti tra loro collegati può variare: alcuni saranno collegati con più punti rispetto ad altri Quanto più elevati sono i gradi dei punti tanto maggiore sarà la densità della rete Per tener conti anche di questo parametro nel calcolo della densità occorre confrontare il numero effettivo di linee presenti e il numero di linee che si avrebbe in un grafo completo Linee, direzione e densità Somma dei gradi di un grafo diviso 2

Confronti di densità Linee, direzione e densità

La densità in grafi orientati Linee, direzione e densità

Reti ego-centrate e socio-centriche Linee, direzione e densità Reti ego-centrate Si ancorano le reti intorno a determinati attori – L’analisi della densità è interessata alla densità dei legami che circondano determinati attori Si trascura dunque l’attore e ci si concentra solo sui legami tra i contatti della sua rete Reti socio-centriche Si focalizza l’attenzione sul modello delle connessioni nella rete come un «tutto», contributo per Barnes distintivo dell’analisi delle reti sociali L’analisi della densità è quella dell’intera rete e no semplicemente delle reti personali di singoli attori

La misura ego-centrica della densità 6 nodi due densità diverse Linee, direzione e densità

La densità dei grafi segnati (valued graphs) Non c’è accordo su come calcolare la densità su queste reti a)Ignorare i valori sulle linee e trattare il grafo come se fosse semplicemente orientato o non orientato  notevole perdita di informazione b)Usare il valore della molteplicità delle linee come peso dei legami (linea con m=3 avrà peso 3 – varrà come tre linee)  totale ponderato delle linee effettivamente presenti in un grafo c)Problema del denominatore  numero max delle linee che un grafo può contenere deve basarsi su qualche ipotesi sul valore massimo che la molteplicità può assumere nella rete oggetto di studio  la molteplicità più alta rilevata nella rete; il numero max di consiglieri in un cda; il numero massimo di cariche cumulabili, etc… Linee, direzione e densità

Problema della dipendenza della densità dalla dimensione del grafo a)Rende impossibile confrontare misure di densità di grafi di dimensione diversa b)La densità varia in ragione del rapporto tra le linee effettivamente presenti e quelle teoricamente possibili c)Grafi più grandi hanno densità più basse rispetto a grafi più piccoli d)Ciò è anche dovuto a un altro fattore: il tempo e)Mayhew e Levinger (1976) sostengono che esistono limiti alla quantità di tempo che certi attori sono disposti a investire nell’intraprendere e mantenere relazioni  il tempo è limitato, quindi diminuisce all’aumentare dei contatti (d mai superiore a 0,5) f)Occorre poi considerare il tipo di relazione: amore, amicizia (la prima ha densità più bassa – possono conoscere tante persone ma amarne solo alcune) Linee, direzione e densità

Stima della densità di una rete sulla base di dati campionari Linee, direzione e densità

Metodo di stima della densità di Granovetter (1976) Metodo da usare quando si è incerti sulla attendibilità della stima iniziale del grado medio Sconsiglia di ricorrere a un unico grande campione e di preferire invece un certo numero di sotto-campioni (es.: pop attori è opportuno selezionare sotto- campioni da 100 (almeno 5) o 200 attori (ne basterebbero 2)) Si calcola la densità in ciascun sotto-campione Poi si procede con il calcolo della media delle densità calcolate  stima attendibile della densità della rete globale Linee, direzione e densità

Ora esercitiamoci insieme… Impariamo a calcolare il grado (in-degrees e out-degrees) dei punti di una rete Calcoliamo i k-core Calcoliamo l’indice di inclusività Calcoliamo le distanze Calcoliamo e rappresentiamo reti ego-centriche Linee, direzione e densità

Grazie! …ora proseguiamo con qualche esercizio Linee, direzione e densità