La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III TERZA LEZIONE.

Presentazioni simili


Presentazione sul tema: "STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III TERZA LEZIONE."— Transcript della presentazione:

1 STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III TERZA LEZIONE

2 Di solito le variabili rilevate sui soggetti sono più di una Si supponga di rilevare due variabili X e Y (es. peso e altezza di un neonato, livello di colesterolo e di acido urico, circonferenza cranica e settimane di gestazione, stadio tumorale e livello di dolore, ecc) In molti casi è importante determinare se vi sono relazioni di dipendenza tra le due variabili e il tipo e lintensità di tali relazioni

3 RELAZIONI TRA VARIABILI QUANTITATIVE

4 Siano X e Y due variabili quantitative rilevate su n soggetti (x 1,y 1 ) sono i valori rilevati sul soggetto 1 (x 2,y 2 ) sono i valori rilevati sul soggetto 2 ……. (x n,y n ) sono i valori rilevati sul soggetto n ogni coppia di valori rappresenta un punto nel piano cartesiano (X,Y) il protocollo sperimentale (x 1,y 1 ), (x 2,y 2 ),…, (x n,y n ) è una nuvola di punti nel piano

5 La morfologia della nuvola (scatter, diagramma di dispersione) fornisce informazioni sul tipo di legame esistente tra le variabili associazione lineare positivaassociazione lineare negativa

6 assenza di associazione associazione non lineare (curvilinea)

7 Come misurare il tipo di associazione lineare tra due variabili ?? COVARIANZA Media dei prodotti degli scarti dalla media

8 media delle X media delle Y I quadrante scarti concordanti (+,+) II quadrante scarti discordanti (+,-) IV quadrante scarti discordanti (-,+) III quadrante scarti concordanti (-,-) I-III quadrantescarti concordanti prodotti positivi II-IV quadrantescarti discordanti prodotti negativi

9 dipendenza lineare positiva prevalgono i punti I-II quadrante prevalgono i prodotti positivi covarianza positiva

10 dipendenza lineare negativa prevalgono i punti II-IV quadrante prevalgono i prodotti negativi covarianza negativa

11 nessuna dipendenza lineare nessuna direzione individuabile i prodotti negativi e positivi si compensano covarianza approssimativamente nulla

12 la covarianza dipende criticamente dalle unità di misura di X e Y la covarianza individua il tipo di legame lineare esistente tra le variabili ma non la forza di tale associazione

13 COEFFICIENTE DI CORRELAZIONE LINEARE Rapporto tra la covarianza e il prodotto degli sqm non dipende dalle unità di misura varia tra -1 e 1 è nullo in caso di assenza di legame lineare è -1 o 1 in caso di legame lineare perfetto (negativo o positivo)

14

15 In uno studio sono state esaminate le radiografie fatte ai reni di bambini normali, per misurare le distanze della parete interna del rene dalla spina dorsale, una distanza facilmente visualizzabile nelle radiografie e utile nella diagnosi di malattia renale. Nella tabella sono riportate le misure ottenute per la parte superiore del rene destro insieme con letà del bambino. Verifica la relazione lineare tra la distanza e letà. Età del bambino in anni (X) Distanza in mm (Y)

16 xyscarti xscarti yscarti 2 xscarti 2 yprodotti

17 media X65/10 = 6.5 anni media Y 235/10 = 23.5 mm varianza X82.5/10 = 8.25 anni 2 sqm X2.87 anni varianza Y122.5/10 = mm 2 sqm Y3.5 mm covarianza XY90.5/10 = 9.05 anni x mm coeff. corr. 9.05/(2.87 x 3.5) = 0.90 forte dipendenza lineare positiva

18 REGRESSIONE LINEARE Se tra X e Y esiste un forte legame lineare (r xy elevato) si può tentare di spiegare il valore di Y come funzione lineare di X secondo la relazione Y=a+bX Dato un valore osservato x i il valore previsto di Y come funzione lineare di X sarà allora ŷ i =a+bx i il quale sarà diverso dal valore osservato y i

19 La differenza tra il valore osservato e quello previsto dalla relazione lineare e i = ŷ i -y i è detto errore di previsione La regressione è tanto più precisa quanto minori sono gli errori che si commettono I parametri a e b della retta di regressione saranno determinati in modo da rendere minima la somma dei quadrati degli errori

20 errore di previsione

21 METODO DEI MINIMI QUADRATI Quale retta utilizzare tra tutte le possibili rette che possono passare tra i punti ?? Blu ?? Verde ??? Rossa ????? Quella che rende minima la somma dei quadrati degli errori (quella che sbaglia di meno)

22 RETTA DI REGRESSIONE PARAMETRI DELLA RETTA intercetta coefficiente angolare

23 PRECISIONE DELLA REGRESSIONE Quando la previsione di Y come funzione lineare di X da luogo a risultati precisi ? R 2 quadrato del coefficiente di correlazione varia tra 0 e 1 ed esprime la percentuale di variabilità delle Y spiegata dalla relazione lineare con X R 2 = 0 la regressione non spiega niente R 2 = 1 la regressione spiega tutto Es: se tra due variabili X e Y cè un coefficiente di correlazione di 0.80 la regressione spiegherebbe il 64% della variabilità delle Y, il rimanente 36% dipende da altre cause

24 Es. Dato che il coefficiente di correlazione tra le distanze della parete interna del rene dalla spina dorsale e letà dei bambini risulta molto alto (0.90), in una regressione lineare tra le due variabili, letà spiega l81% della variabilità di tali distanze. I parametri della retta di regressione risultano b = 9.05/8.25 = a = 23.5 – x 6.5 =16.37 Y = X a età 0 la distanza è mm e cresce di mm allanno Qual è la distanze prevista per un bambino di 45 mesi (3.75 anni) y = x 3.75 = mm

25 Quando X è il tempo (T) le coppie di punti (t 1,y 1 ), (t 2,y 2 ),…, (t n,y n ) mostrano levoluzione della variabile Y nel tempo Una correlazione positiva di Y con T dimostra che Y tende a crescere linearmente con il tempo Una correlazione negativa di Y con T dimostra che Y tende a decrescere linearmente con il tempo Unassenza di correlazione di Y con T dimostra unassenza di trend lineare di Y Se la relazione lineare tra Y e T è forte si possono prevedere i valori futuri di Y tramite la retta di regressione

26 Es. Serie temporale delle percentuali di fumatori maschi in Italia (Fonte: ISTAT, 2003, LItalia in cifre) anno%

27 tyscarti tscarti yscarti 2 tscarti 2 yprodotti

28 media T35/5 = 7 anni media Y 176.2/5 = pp varianza T40/5 = 8 anni 2 sqm T2.83 anni varianza Y138.10/5 = pp 2 sqm Y5.26 pp covarianza TY-58.20/5 = anni x pp coeff. corr /(2.83 x 5.26) = 0.78 forte dipendenza lineare negativa

29 Dato che il coefficiente di correlazione tra gli anni e la % fumatori maschi risulta alto (0.79), in una regressione lineare tra le due variabili, il trend temporale spiega il 62% della variabilità di tali percentuali. I parametri della retta di regressione risultano b = /8 = a = – (-1.455) x 7 = Y = T Allanno 0 (1990) la % fumatori maschi è stimata del 45.4% e decresce di punti percentuali allanno Qualè la % prevista per il 2012 (t=22) y = x 22 = % (!!!) Attenzione a estrapolare troppo !!!

30 Regressione non lineare Non tutte le dipendenze sono di tipo lineare, ma molte si possono riportare a dipendenze lineari Y non cresce linearmente con X ma con il ln X Si può analizzare la dipendenza lineare di Y con ln X


Scaricare ppt "STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III TERZA LEZIONE."

Presentazioni simili


Annunci Google