La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Cap. 10 Indipendenza, connessione e associazione Cioè lanalisi statistica congiunta di una coppia di fenomeni qualitativi 1.

Presentazioni simili


Presentazione sul tema: "Cap. 10 Indipendenza, connessione e associazione Cioè lanalisi statistica congiunta di una coppia di fenomeni qualitativi 1."— Transcript della presentazione:

1 Cap. 10 Indipendenza, connessione e associazione Cioè lanalisi statistica congiunta di una coppia di fenomeni qualitativi 1

2 Quando osserviamo due variabili X,Y sorge naturale chiedersi se queste siano tra loro in relazione X è causa di Y (o viceversa): quando X varia fa variare anche Y X e Y variano contemporaneamente perché un terzo fenomeno li fa variare Le ragioni possono essere molteplici, tra queste: Cosa significa che due fenomeni sono in relazione? Significa che quando varia uno anche laltro varia in conseguenza

3 Causalità Aristotele Una prima trattazione estesa del concetto di causa è stata quella di Aristotele il quale considera che il sapere sia legato alla conoscenza delle causeAristotele (verum scire est scire per causas). Secondo Aristotele, le cause sono di quattro tipi: causa materiale, indica la materia di cui è fatta una cosa (ad esempio il marmo nel caso si tratti di una statua); causa formale, la forma, il modello o l'essenza di una cosa (nel caso citato la forma che rappresenta la statua);essenza causa efficiente, ciò che ha prodotto la cosa (lo scultore); causa finale, il fine che quella cosa deve realizzare con la sua esistenza (la statua cioè deve essere utilizzata come statua, ad esempio per ornare un ambiente). La scuola aristotelica ampliò la trattazione concentrandosi sulla definizione di causa prima che veniva identificata con Dio.

4 La filosofia dell'età moderna approfondì il concetto di causa efficiente facendolo coincidere con quello di legge o connessione causale dove il rapporto causa-effetto è rappresentato da grandezze misurabili matematicamente (Keplero, Galilei, Cartesio).età modernaKepleroGalileiCartesio Da questo punto nasce la fisica classica che da Isaac Newton a Pierre Simon Laplace assume il determinismo e il meccanicismo come ineliminabili dalla trattazione dei fenomeni naturali.Isaac NewtonPierre Simon Laplacedeterminismomeccanicismo La validità della concezione moderna della fisica venne messa in dubbio da David Hume il quale, riprendendo le teorie di Sesto Empirico e degli scettici, contestò che il rapporto causa-effetto fosse caratterizzato dalla necessità ma solamente da una connessione di fatto.David HumeSesto Empiricoscettici Non vi è nessuna necessità che ad una precisa causa debba necessariamente corrispondere un preciso effetto. In realtà … constatando che ad una causa solitamente corrisponde un effetto, ci si aspetta che ad una causa simile corrisponda l'effetto simile previsto, ma ciò non è detto che accada. Quindi il rapporto causa-effetto si traduce in uno stato d'animo soggettivo di attesa per cui al ripetersi di un determinato effetto si ritiene, senza alcuna assoluta certezza, che se ne debba verificare un altro simile. La tesi di Hume, individuando la relazione causale in un' abitudine associativa di carattere psicologico, comportava l'impossibilità di arrivare a leggi universali naturalipsicologico

5 Il concetto di relazione tra variabili in Statistica è (in parte) una formalizzazione del concetto Hume-iano di abitudine associativa La formalizzazione parte dalla definizione del concetto di: Assenza di relazione tra variabili Assenza di relazione statistica tra due variabili Se due fenomeni sono in relazione, quando, al variare delluno varia anche laltro allora: due fenomeni non sono in relazione se al variare delluno laltro non varia ma in che senso non varia? (le variabili statistiche …variano per definizione) Quando le distribuzioni condizionate sono tutte uguali tra loro

6 NOSIINCIDENTI 0.83 0.17 0.50 Tra i Maschi ben l83% ha incidenti Tra le Femmine solo il 50% Distribuzioni di frequenza CONDIZIONATE relative NOSIINCIDENTI 0.83 0.17 0.83 0.17 0.50 GENERE e INCIDENTI non sono in relazione

7 Assenza di relazione statistica tra due variabili le distribuzioni di Y condizionate ad X non variano al variare di X Y e statisticamente indipendente da X quando

8 Indipendenza statistica 8

9 Se le distribuzioni relative di Y condizionate ad X allora sono uguali alla distribuzione marginale sono tutte uguali

10 Se le distribuzioni relative di Y condizionate ad X sono tutte uguali Allora anche le distribuzioni relative di X condizionate ad Y sono tutte uguali

11 Indipendenza statistica tra due variabili X e Y Una qualunque di queste tre condizioni implica le altre Queste condizioni implicano che le distribuzioni condizionate sono uguali alle marginali, e viceversa

12 Indipendenza statistica e frequenze assolute

13 Freq. Teoriche I.S. Freq. osservate Se tra X e Y ci fosse I.S. le frequenze che si dovrebbero osservare sono * differenze Necessaria una sintesi

14 Freq. Teoriche I.S. Freq. osservate Se tra X e Y ci fosse I.S. le frequenze che si dovrebbero osservare sono * Indice di connessione Se e solo se Tutte le freq. osservate coincidono con quelle teoriche

15 Frequenze teoriche di indipendenza NB: Per stabilire lindipendenza statistica si utilizzano solo frequenze (condizionate, marginali relative, congiunte osservate e teoriche): ecco perché questo tipo di analisi è possibile per fenomeni di qualunque natura, sia qualitativi che quantitativi. NB: Se si conclude che sono statisticamente indipendenti, lanalisi statistica bivariata è terminata: che senso avrebbe analizzare una relazione che non esiste? 15

16 Connessione Se X e Y non sono indipendenti, allora esiste una qualche relazione che li lega. Si indica con il termine connessione una generica relazione statisticamente rilevabile in una coppia di fenomeni osservati La connessione è tanto più debole (forte) quanto più la tabella osservata si avvicina (allontana) a quella teorica di independenza. Per misurare lintensità della connessione possiamo allora guardare alle differenze tra frequenze osservate e frequenze teoriche di indipendenza: 16

17 Indice di connessione: formula alternativa Non vi è I.S. tra GENERE e INCIDENTI

18 Tanto o poco?

19 Indice di connessione normalizzato Indipendenza Statistica (I.S.) 1 0 Quanto può essere grande? Perfetta connessione La dimostrazione nel libro non è corretta

20 X \ Y Tot.

21 Casi di perfetta connessione tra X e Y (biunivoca o bilaterale) Tutti i fumatori sono anche bevitori Tutti i non fumatori sono anche astemi XY Tabagismo genera Alcolismo XY Alcolismo porta al Tabagismo X Y Z ANSIA ? Questo indice ci dice che esiste una connessione Ma non fornisce una spiegazione delle ragioni della relazione (ad esempio CAUSA-EFFETTO) (esula dalla statistica) Segnala la presenza di una relazione da spiegare

22 Casi di perfetta connessione tra X e Y (biunivoca o bilaterale) Tutti i fumatori sono anche bevitori Tutti i non fumatori sono anche astemi Questo indice ci dice che esiste una connessione Ma non fornisce una spiegazione delle ragioni della relazione (ad esempio CAUSA-EFFETTO) (esula dalla statistica) Segnala la presenza di una relazione da spiegare Tutti i fumatori sono astemi Tutti i non fumatori sono bevitori Anche in questo caso

23 Casi di perfetta connessione tra X e Y (unilaterale) 100 60 40 60 3010 Ad ogni modalità di Y corrisponde una sola modalità di X 00 0 603010 per una sola 1006040 Ad ogni modalità di X corrisponde una sola modalità di Y 40 25 35 0 0 0 25 40 35 per una sola

24 24

25 Indice di connessione normalizzato Indipendenza Statistica (I.S.) Perfetta connessione 0 1 0.1 0.9 Molto debole Molto forte Non vi è necessità di studiare ulteriormente la relazione tra X e Y Vi è necessità di studiare ulteriormente la relazione tra X e Y

26 Associazione tra coppie di modalità X \ Y Tot. Si parla di associazione tra coppie di modalità, quando in una tabella 2 x 2, fissate le frequenze marginali, le frequenze congiunte tendono a concentrarsi su una delle due diagonali Associazione positiva Associazione negativa Repulsione

27 Associazione tra coppie di modalità Y X Consuma alcool AstemioTotale Fumatore 9862160 Non Fumatore 080 Totale 98142240 Y X Consuma alcool AstemioTotale Fumatore 18142160 Non Fumatore 800 Totale 98142240 Tutti i fumatori sono anche bevitori Tutti i non fumatori sono anche astemi Tutti i fumatori sono astemi Tutti i non fumatori sono bevitori Tutti i bevitori sono fumatori Tutti i non fumatori sono bevitori

28 Associazione tra coppie di modalità Y X Consuma alcool AstemioTotale Fumatore 9862160 Non Fumatore 080 Totale 98142240 Y X Consuma alcool AstemioTotale Fumatore 18142160 Non Fumatore 800 Totale 98142240 Tutti i fumatori sono anche bevitori Tutti i non fumatori sono anche astemi Tutti i fumatori sono astemi Tutti i non fumatori sono bevitori Tutti i bevitori sono fumatori Tutti i non fumatori sono bevitori

29 Associazione tra coppie di modalità Yule = 0.79 Yule = -0.41 0+1 Massima associazione Massima repulsione Forte repulsione -0.75 Forte associazione +0.75 +0.25-0.25 Scarsa o nessuna associazione Discreta associazione Discreta repulsione Forte associazione Discreta repulsione 72

30 Connessione ed associazione NO!!!!

31 Connessione ed associazione Mecatti: pag. 190 Quindi le distribuzioni di Y condizionate ad X sono uguali

32 Connessione ed associazione Y X Consuma alcool AstemioTotale Fumatore 9862160 Non Fumatore 080 Totale 98142240 Tutti i fumatori sono anche bevitori Tutti i non fumatori sono anche astemi Tutti i bevitori sono fumatori Non implica

33 Odds

34 SUCCESSOINSUCCESSO CoronaropatiaNo Coronaropatia Grecia DefaultGrecia No Default MASCHIO FEMMINA Fumatore Non Fumatore Broker USA Broker EU Fenomeno di interesse Fenomeno condizionante Odds marginale Odds condizionati Quanto è probabile (frequente) Y = y1 rispetto a Y = y2

35 Odds e OR Yule = 0.79 Forte associazione 72

36 Odds e odds ratio odds : Richiedono lidentificazione di un evento di interesse (outcome dicotomico) Sono sempre positivi Nellesempio fumo/alcool: Informano sul rischio di successo (che levento si verifichi) relativamente al rischio di insuccesso, nella sotto-popolazione considerata (rischio relativo) Nellesempio fumo/alcool: Il rischio relativo di essere consumatore di alcool per un fumatore è 8.6 volte quello di un non fumatore 36

37 Odds e odds ratio odds : Attenzione: lodds ratio non è un rapporto tra probabilità (che levento si verifichi) nelle due sotto-popolazioni E un rapporto tra rischi, che sono a loro volta il rapporto tra la probabilità che levento si verifichi e la probabilità che levento non si verifichi in ciascuna sotto-popolazione Lodds ratio è anche interpretabile come misura di associazione: (dimostrare per esercizio) 37

38 Sintesi Due variabili X e Y sono tra loro statisticamente indipendenti se le distribuzioni di Y condizionate ad X non variano al variare di X. Vale il viceversa e vale anche che le frequenze relative congiunte sono il prodotto delle frequenze relative marginali. Si possono definire allora delle frequenze teoriche in caso di indipendenza: tanto più le frequenze effettive si discostano da quelle teoriche, maggiore è il grado di connessione tra X e Y che si misura attraverso lindice di connessione assoluto e normalizzato al suo massimo Lindice di connessione assume il valore massimo nel caso di perfetta connessione bilaterale o unilaterale: le distribuzioni condizionate tendono a concentrarsi su una modalità. Ad ogni x (y) corrisponde una e una sola y (x) (e viceversa nel caso bilaterale): in questo caso lindice normalizzato vale 1. Se vale 0 significa che siamo in situazione di I.S. Se non vi è I.S. vale la pena approfondire lo studio della relazione tra X e Y: attraverso lindice di Yule si misura quanto la modalità x1 di una variabile dicotomica tenda ad associarsi o respingersi rispetto alla modalità y1 di una variabile Y pure dicotomica. Data una variabile dicotomica Y, lOdds misura quanto è probabile osservare y1 rispetto ad y2: il confronto di Odds condizionati mostra quanto gli Odds sono differenti nelle diverse modalità di condizionamento (X)


Scaricare ppt "Cap. 10 Indipendenza, connessione e associazione Cioè lanalisi statistica congiunta di una coppia di fenomeni qualitativi 1."

Presentazioni simili


Annunci Google