6 dicembre 2018 Fiorenza Deriu Il trattamento dei dati relazionali: matrici, livelli di misurazione, questioni legate al campionamento X Modulo 6 dicembre 2018 Fiorenza Deriu Dipartimento di Scienze Statistiche
Matrici di adiacenza o one-mode Le matrici di dati Matrici di incidenza o two-mode casixaffiliazioni Matrici di adiacenza o one-mode casoxcaso Matrici di adiacenza o one-mode affiliazionexaffiliazione eventoxevento Il trattamento di dati relazionali
Matrici two-mode - casi x affiliazioni Simbologia matrice rettangolare ove N = numero righe matrice M = numero colonne matrice X(n,m) es.: X(5,4) X(nxm) es.: X(5x4) Xn,m es.: X5,4 X{…xij…} I valori di una singola cella di intersezione x (i,j) ove i è la riga di riferimento j la colonna di riferimento i ≠ j i varia da 1 a n es: varia da 1 a 5 j varia da 1 a m es: varia da 1 a 4 Partecipazione a una serie di eventi Evento1 Evento2 Evento3 Evento4 Fiorenza 1 Alberto Ginevra Angela Giorgio Il trattamento di dati relazionali
Matrici one-mode - caso x caso Partecipazione all’evento 1 (r=1 Χ1) Simbologia matrice quadrata X,n,n es.: X5,5 X{…xij…} Simbologia relazioni R (Χ1, Χ2, Χ3, …, ΧR ) r = 1,2,…R es.: R=4 R è il livello di stratificazione di un matrice tridimensionale I valori di una singola cella di intersezione x (i,j,r) ove i è la riga di riferimento j la colonna di riferimento r la relazione considerata Fiorenza Alberto Ginevra Angela Giorgio 1 2 Livelli di misurazione Binario/dicotomico 1,0 Nominali sconnesse multicategoriali 1, 2, 3, 4…k (codici associati a categorie semantiche che descrivono tipologie di relazioni) Misure ordinali raggruppate -1 / 0 / +1 corrispondenti a «negativo» / «positivo» / «indifferente» Misure ordinali full-ranking ordinamento di relazioni in base alla loro forza (dal più forte al più debole 1°2°3°…) Il trattamento di dati relazionali
Matrici one-mode - affiliazione x affiliazione Simbologia matrice quadrata Xm,m es.: X4,4 X{…xij…} I valori di una singola cella di intersezione x (i,j,r) ove i è la riga di riferimento j la colonna di riferimento r la relazione considerata Evento1 Evento2 Evento3 Evento4 4 2 3 1 Livelli di misurazione Scala valori numerici discreti/continui - per misurare l’intensità o la frequenza di una relazione non si rileva il dato attraverso le opinioni degli attori, ma utilizzando dati statistici quantitativi come: numero e-mail, telefonate, incontri, riunioni, dati su scambi commerciali, etc… Dicotomizzazione (trasformazione in dati binari) di questo tipo di dati in base a un cutting point Il trattamento di dati relazionali
La direzione delle relazioni Due tipi di dati relazionali Orientati - la matrice orientata è asimmetrica rispetto alla diagonale principale e quindi va analizzata interamente la relazione da i a j è diversa da j a i Non orientati - le matrici di adiacenza sono simmetriche e per questo si analizza solo una metà della matrice Il trattamento di dati relazionali 27/07/2019
Livelli di misurazione di dati relazionali Quadro sintetico Dati relazionali Tipo di valori Non orientati Orientati Binari 1 3 Numerici 2 4 Il trattamento di dati relazionali 27/07/2019
Modello teorico di social network di Freeman (1989) Grafico orientato - sociogramma Matrice degli attributi S = < S, Gd , X, A > Struttura algebrica Sociomatrice Matrice di adiacenza S = < N, L > insieme di nodi e archi Gd = < N, L > sociogramma prodotto da un insieme di nodi e archi X sociomatrice di adiacenza nxn A matrice std attori per attributi Il trattamento di dati relazionali
Campionamento di nodi e relazioni La Network Analysis è centrata sulle relazioni e non sugli attori e i loro attributi Questioni specifiche di campionamento Le unità (attori) non sono indipendenti come invece accade nel campionamento probabilistico Importanza di definire i «confini» della popolazione oggetto di studio In genere negli studi di network analysis si includono tutti gli attori compresi entro i «confini » individuati Tuttavia, questi attori potrebbero comunque appartenere a un più ampio insieme di popolazione estratto con metodi campionari Il trattamento di dati relazionali 27/07/2019
…segue Tre tipi di confini Confini fissati su una popolazione nota a priori come network - es.: tutti i membri di una classe, di una organizzazione, un club, un vicinato, una comunità… si tratta di cluster naturali e/o reti (approccio posizionale) Approccio demografico – ecologico il confine della popolazione è definito sulla base di caratteri di tipo spaziale- territoriale (un quartiere) o sul possesso di alcune caratteristiche (livello di reddito). L’insieme oggetto di studio è un aggregato astratto imposto dal ricercatore Approccio reputazionale Il ricercatore studia un insieme di persone costruito sulla base di interviste a testimoni privilegiati, testimoni chiave, ai quali è chiesto di indicare i membri più potenti di una comunità, i più ricchi, i più colti, etc… Il trattamento di dati relazionali 27/07/2019
…segue Nella network analysis gli individui sono considerati come annidati all’interno di una rete di relazioni con altre persone (in famiglia, in una organizzazione, un’impresa, un’associazione di volontariato) Esempio: lo studio sul vostro gruppo (una classe) in un Dipartimento che fa parte di una Facoltà, di un Ateneo che a sua volta è in rete con altri atenei dello stesso territorio (Roma) Esistono livelli multipli su cui si sviluppano relazioni Nella network analysis in genere si analizzano 2 livelli – two-mode dataset Il trattamento di dati relazionali 27/07/2019
…segue Fissati i confini occorre affrontare la questione del «campionamento» dei legami Tra un insieme di attori possono instaurarsi numerosi e diversi tipi di legami – se ne selezionano alcuni in base a criteri diversi Full-network methods Snowball methods Ego-centric networks (with alter connections) Ego-centric networks (ego only) Il trattamento di dati relazionali 27/07/2019
Ora esercitiamoci insieme… Prendiamo confidenza con la dashboard di Ucinet Impariamo a definire l’area di lavoro Tipi di matrici in excel Importazione delle matrici relazionali in Ucinet Importazione della matrice di attributi in Ucinet Rappresentazione grafica di una rete e dei suoi attributi con Netdraw Il trattamento di dati relazionali 27/07/2019
Grazie! …ora proseguiamo con qualche esercizio Il trattamento di dati relazionali