La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica.

Presentazioni simili


Presentazione sul tema: "Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica."— Transcript della presentazione:

1 Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica il tipo (positivo se la variazione è concorde, negativo quando, all’aumentare di una variabile l’altra decresce), il valore assoluto ne specifica invece il grado. Il valore della correlazione varia tra -1 e +1. Il coefficiente r non è in grado di rilevare un’eventuale correlazione di tipo non lineare.

2 Esempi di r Perfetta correlazione positiva
x y 1.000 Perfetta correlazione positiva r = x y 0.562 0.625 0.500 Debole correlazione positiva

3 Esempi di r Associazione lineare non significativa
x y -0.079 0.026 0.078 Associazione lineare non significativa r = x y -0.544 -0.931 -1.000 Vari gradi di correlazione negativa

4 ESERCIZIO 52 La concentrazione plasmatica di sodio (mmol/L) e la pressione arteriosa sistolica (mmHg) sono state misurate contemporaneamente in un campione di 12 pazienti. I dati sono riportati nella seguente tabella. Rappresentare i dati mediante un diagramma di dispersione e calcolare il coefficiente di correlazione.

5 La correlazione lineare suggerita dal diagramma a dispersione è molto forte. All’aumentare della concentrazione di sodio aumenta in modo lineare la pressione sanguigna.

6 ESERCIZIO 53 Si consideri la distribuzione chi-quadrato con due gradi di libertà. a) Quale proporzione dell'area sotto la curva giace a destra di 9.21? b) Quale valore di delimita il 10% superiore della distribuzione? a) b)

7 Test chi quadrato Quando le variabili sono qualitative e i dati da confrontare indipendenti si utilizza il Test c2 Per l'applicazione di questo test è opportuno costruire una tavola di contingenza che contenga il numero di casi osservati (O) in ogni combinazione delle modalità delle due variabili analizzate, e di casi attesi (A), cioè il numero di casi che ci si potrebbe aspettare se non fosse presente la differenza studiata.

8 Esempio Si studia l’effetto di un farmaco antiinfiammatorio nella cura dell’artrite reumatoide. A 62 pazienti viene somministrato il farmaco e a 11 un placebo. La frequenza di rigidità articolare rilevata nei due gruppi è riportata nella tabella sottostante: farmaco placebo Totale Rigidità 14 5 19 Non rigidità 48 6 54 62 11 73

9 Risultato (Excel) Calcolo attesi: la probabilità di rigidità articolare in tutto il campione indipendentemente dal trattamento è 19 su 73. Se non ci fosse effetto del trattamento mi aspetterei la stessa proporzione di casi di rigidità nei due gruppi, cioè: (19/73)*62=16,14 e (19/73)*11=2.86 Il p-value non è significativo e non supporta quindi l’efficacia di tale farmaco.

10 Ipertese 8 15 23 Non ipertese 32 45 77 Tot 40 60 100 Orali Altro
ESERCIZIO 54 Un gruppo di cardiologi conduce uno studio per accertare l'associazione che esiste tra metodo contraccettivo e ipertensione. Di 40 donne che usano contraccettivi orali e 60 donne che usano altri metodi, rispettivamente 8 e 15 sono ipertese. Testare l'ipotesi che tra il tipo di contraccettivo e ipertensione esista associazione ad un livello di significatività dell'1%. Ipertese 8 15 23 Non ipertese 32 45 77 Tot 40 60 100 Orali Altro frequenze osservate Ipertese 9.2 13.8 23 Non ipertese 30.8 46.2 77 Tot 40 60 100 Orali Altro frequenze attese

11

12 maschi femmine Tot 20-44 36 (39.7) 52 (48.3) 88 45-64 109 (102.1)
ESERCIZIO 55 Saggiate ad un livello di significatività del 5% se il sesso e l'età sono significativamente associati. 20-44 anni 45-64 anni 65 anni maschi femmine 36 52 109 117 126 160 Tabella osservati e attesi maschi femmine Tot 20-44 36 (39.7) 52 (48.3) 88 45-64 109 (102.1) 117 (123.9) 226 65 126 (129.2) 160 (156.8) 286 271 329 600

13

14 ESERCIZIO 56 Un farmaco per il trattamento del raffreddore è stato somministrato a metà di un gruppo di malati selezionati casualmente. All'altra metà dei pazienti con raffreddore è stato somministrato un placebo. I risultati ottenuti sono riportati nella seguente tabella: Farmaco 16 30 104 Nocivo Nessun effetto Utile Placebo 20 42 88 Verificare se l'opinione del paziente è indipendente dal trattamento ricevuto ammettendo un errore del I° tipo del 5%. Farmaco 16 (18) 30 (36) 104 (96) 150 Placebo 20(18) 42 (36) 88 (96) Tot 36 72 192 300 Nocivo Nessun effetto Utile

15 =0.05 Poichè (3.778<5.99) non ci sono motivi per affermare che vi sia una relazione tra opinione dei pazienti e tipo di trattamento. Il test non è significativo ad un livello del 5%.

16 ESERCIZIO 57 La distribuzione percentuale, in accordo allo stato civile, della popolazione USA al di sopra dei 18 anni nel 1968 è la seguente: celibe/nubile=21.6, coniugato/a=62.9, vedovo/a=7.7, divorziato/a=7.8. Un campione casuale di 400 persone, di età superiore ai 18 anni (selezionato nel 1990) ha mostrato che 102 di queste sono celibi/nubili, 220 coniugate, 35 vedove e 43 divorziate. Saggiate, ad un livello di significatività del 5%, se in questo periodo è cambiata la distribuzione percentuale dello stato civile della popolazione USA di età superiore ai 18 anni. Single Cng Ved. Div. Tot Osservati %Attese Attesi 102 21.6 86.4 220 62.9 251.6 35 7.7 30.8 43 7.8 31.2 400 =0.05

17 Poichè (11.822>7.815) si può affermare che dal 1968 vi è stato un mutamento nella struttura dello stato civile in USA. ESERCIZIO 58 Una ditta ha 500 dipendenti. Di questi 300 sono uomini e 280 sono coniugati/e. Dei 300 uomini, 190 sono coniugati. Se un soggetto di questa ditta è selezionato a caso, qual è la probabilità che sia: a) una donna b) un uomo sapendo che è coniugato c) Si può ritenere che tra i dipendenti vi sia associazione tra sesso e stato civile (=0.05). Uomini 110 190 300 Donne 90 200 Tot 220 280 500 OSSERVATI Single Cng.

18 =0.05 a) b) c) Uomini 132 168 300 Donne 88 112 200 Tot 220 280 500
ATTESI Single Cng. Poichè (16.37>3.84) ci sono motivi per affermare che vi sia una relazione tra sesso e stato civile tra i dipendenti della fabbrica considerata.

19 ESERCIZIO 59 500 maschi sono classificati secondo l'età in anni compiuti e il numero dei fratelli. I risultati ottenuti sono riportati nella seguente tabella: 68 32 36 89 1 9 57 24 60 1-5 6-10 11-13 14-18 2 59 25 20 21 a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)? b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione. c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione. d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello? e) gli eventi "essere in età prescolare" ed "avere un solo fratello" sono mutualmente esclusivi? Dimostrarlo con il calcolo delle probabilità. f) verificare se esiste un’associazione tra età e numero di fratelli.

20 a) Il coefficiente di variazione
a) con quale misura di dispersione è possibile confrontare la variabilità delle due variabili prese in considerazione, cioè l’età ed il numero di fratelli (non fare i calcoli)? a) Il coefficiente di variazione b) calcolare per la variabile età una opportuna misura di posizione e una di dispersione. b) c) calcolare per la variabile N° di fratelli una opportuna misura di posizione e una di dispersione. c) Moda=0 Range=2-0=2 d) quale è la probabilità che un soggetto estratto a caso abbia uno o più di un fratello? d)

21 e) P( età prescolare  avere un solo fratello) = 9/500  0
non sono eventi mutualmente esclusivi î í ì ne associazio : H za indipenden 1 a =0.05 X 2 36 39 7 109 102 126 129 52 48 3 117 123 9 160 156 8 3448 4663 0793 2834 3843 0653 6234 = - ( ) + . Poichè 05 , 6 c < (1.62<12.59) non ci sono motivi per affermare che vi sia una relazione tra età numero di fratelli


Scaricare ppt "Correlazione Il coefficiente di correlazione r è un indice campionario del grado e del tipo di associazione lineare. Il segno di tale coefficiente indica."

Presentazioni simili


Annunci Google