La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato.

Presentazioni simili


Presentazione sul tema: "Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato."— Transcript della presentazione:

1 Il residuo nella predizione 1

2 D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato – Predetto Graficamente, è la distanza tra il punto indicante la misurazione realmente effettuata e il suo corrispondente appartenente alla retta di regressione. 2

3 Variabile dipendente, spiegata, valore osservato inclinazione variabile indipendente intercetta errore Stima di y, valore predetto

4 abilitàvoto voto_pre dettoresiduo predizi one 855,15-0,15-1,30 955,78-0,78-0,82 965,780,22-0, ,40,6-0, ,03-0,030, ,660,340, ,290,711, ,91-0,911,53 somma media10,756,875 00

5 P REDIZIONE CON PUNTI ZETA ẑ yi = zeta predetto z xi = zeta predittore r xy = coefficiente di correlazione 5

6 Predizione usando i punti standardizzati

7 soggetti Test R Test T Test R zeta test T zeta p ,33 0,45 p ,49 1,58 p ,86 -0,72 p ,94 -1,31 p ,09 -0,68 p ,49 1,71 p ,16 -0,72 p ,31 -0,90 p ,94 0,00 p ,00 0,59 somma ,00 dev stan12,79 22,17 1,00 varianza163,60 491,60 1,00 media ,00 PREDIZIONE DEL PUNTEGGIO OTTENUTO AL TEST T TRAMITE IL PUNTEGGIO AL TEST R CON I PUNTI Z. PRIMO PASSAGGIO: TRASFORMAZION E DEI PUNTEGGI IN PUNTI Z. 7

8 Sogg.Test R zetaTest T zeta prediz di T p11,330,451,13 p21,491,581,26 p3-0,86-0,72-0,73 p4-0,94-1,31-0,79 p5-1,09-0,68-0,93 p61,491,711,26 p7-0,16-0,72-0,13 p8-0,31-0,90-0,26 p9-0,940,00-0,79 p100,000,590,00 somma0,00 0,000 dev stan1,00 0,847 varianza1,00 0,718 media0,00 0,000 8 PREDIZIONE DEL PUNTEGGIO OTTENUTO AL TEST T TRAMITE IL PUNTEGGIO AL TEST R CON I PUNTI Z. SECONDO PASSAGGIO: CALCOLO DELLA PREDIZIONE DI T CON LA FORMULA:

9 9 VARIANZA SPIEGATA E RESIDUA SOGGETTO TEST R ZETA TEST T ZETA PRODOTTI ZETA PREDIZIONE DI T RESIDUO P1 1,330,450,61,13-0,68 P2 1,491,582,341,260,32 P3 -0,86-0,720,62-0,730,01 P4 -0,94-1,311,23-0,79-0,51 P5 -1,09-0,680,74-0,930,25 P6 1,491,712,551,260,46 P7 -0,16-0,720,11-0,13-0,59 P8 -0,31-0,90,28-0,26-0,64 P9 -0,9400-0,790,79 P10 00,5900 SOMMA 008,47300 DEVIAZIONE STD 110,8770,8470,531 VARIANZA 110,7690,7180,282 MEDIA 000,84700 Correlazione Varianza spiegata Varianza residua Somma = 1

10 10 VARIANZA SPIEGATA E RESIDUA SOGGETTO TEST R ZETA TEST T ZETA PRODOTTI ZETA PREDIZIONE DI T RESIDUO P1 1,330,450,61,13-0,68 P2 1,491,582,341,260,32 P3 -0,86-0,720,62-0,730,01 P4 -0,94-1,311,23-0,79-0,51 P5 -1,09-0,680,74-0,930,25 P6 1,491,712,551,260,46 P7 -0,16-0,720,11-0,13-0,59 P8 -0,31-0,90,28-0,26-0,64 P9 -0,9400-0,790,79 P10 00,5900 SOMMA 008,47300 DEVIAZIONE STD 110,8770,8470,531 VARIANZA 110,7690,7180,282 MEDIA 000,84700 La varianza spiegata è la varianza dei predetti, cioè la varianza spiegata dalla regressione.

11 11 VARIANZA SPIEGATA E RESIDUA SOGGETTO TEST R ZETA TEST T ZETA PRODOTTI ZETA PREDIZIONE DI T RESIDUO P1 1,330,450,61,13-0,68 P2 1,491,582,341,260,32 P3 -0,86-0,720,62-0,730,01 P4 -0,94-1,311,23-0,79-0,51 P5 -1,09-0,680,74-0,930,25 P6 1,491,712,551,260,46 P7 -0,16-0,720,11-0,13-0,59 P8 -0,31-0,90,28-0,26-0,64 P9 -0,9400-0,790,79 P10 00,5900 SOMMA 008,47300 DEVIAZIONE STD 110,8770,8470,531 VARIANZA 110,7690,718 0,282 MEDIA 000,84700 La varianza residua (o varianza dei residui) indica quella parte di varianza non spiegata dalla regressione, (attribuibile all’errore).

12 12 VARIANZA SPIEGATA E RESIDUA SOGGETTO TEST R ZETA TEST T ZETA PRODOTTI ZETA PREDIZIONE DI T RESIDUO P1 1,330,450,61,13-0,68 P2 1,491,582,341,260,32 P3 -0,86-0,720,62-0,730,01 P4 -0,94-1,311,23-0,79-0,51 P5 -1,09-0,680,74-0,930,25 P6 1,491,712,551,260,46 P7 -0,16-0,720,11-0,13-0,59 P8 -0,31-0,90,28-0,26-0,64 P9 -0,9400-0,790,79 P10 00,5900 SOMMA 008,47300 DEVIAZIONE STD 110,8770,8470,531 VARIANZA 110,769 0,7180,282 MEDIA 000,84700 La somma della varianza spiegata e della varianza residua è pari alla varianza totale del punteggio predetto.

13 13 VARIANZA SPIEGATA E RESIDUA SOGGETTO TEST R ZETA TEST T ZETA PRODOTTI ZETA PREDIZIONE DI T RESIDUO P1 1,330,450,61,13-0,68 P2 1,491,582,341,260,32 P3 -0,86-0,720,62-0,730,01 P4 -0,94-1,311,23-0,79-0,51 P5 -1,09-0,680,74-0,930,25 P6 1,491,712,551,260,46 P7 -0,16-0,720,11-0,13-0,59 P8 -0,31-0,90,28-0,26-0,64 P9 -0,9400-0,790,79 P10 00,5900 SOMMA 008,47300 DEVIAZIONE STD 110,8770,8470,531 VARIANZA 110,769 0,7180,282 MEDIA 000,84700 Correlazione

14 Notiamo che… La varianza spiegata è la varianza dei predetti, cioè la varianza spiegata dalla regressione. La varianza residua (o varianza dei residui) indica quella parte di varianza non spiegata dalla regressione, (attribuibile all’errore). La somma della varianza spiegata e della varianza residua è pari alla varianza totale del punteggio predetto. 14

15 P ROPRIETÀ DELLA REGRESSIONE I residui hanno media M = 0 La varianza dei predetti è uguale al coefficiente di determinazione: r 2 La deviazione standard dei predetti è uguale al coefficiente di correlazione (in quanto radice quadrata della varianza) La varianza dei residui è pari al quadrato del coefficiente di alienazione: (1-r 2 ) Il coefficiente di alienazione può essere definito anche come la radice di questo valore: √(1-r 2 ). In questo caso rappresenterà la deviazione standard dei residui (e non la loro varianza) La correlazione fra i residui e i predetti è nulla 15

16 Si può costruire o calcolare l’equazione di regressione usando i punti grezzi, senza passare per i punti standardizzati: Ottengo questa formula applicando la formula per passare dai punti zeta al punteggio grezzo: x = z · s + m dove: s = dev. std. m = media 16 Per passare dai punti zeta ai punti grezzi

17 17 P REDIZIONE CON MISURE SINTETICHE DI X E Y

18 ESEMPIO DI PREDIZIONE CON PUNTI GREZZI 18 SOGGETTITEST RTEST T PRODOTTI R · T R2R2 T2T2 STIMERESIDUI P ,97-14,97 P ,917,09 P ,840,16 P ,37-11,37 P ,445,56 P ,9110,09 P ,06-13,06 P ,12-14,12 P ,3717,63 P ,0013,00 SOMMA DEVIAZIONE STD 12,7922,1718,7911,77 VARIANZA 163,60491,60352,96138,64 MEDIA 20,0040,00 0,00 COEFF ANGOLARE (m) 1,469 INTERCETTA (a) 10,632 CORRELAZIONE 0,847

19 R IASSUMENDO DALLA TABELLA Il soggetto p1 ha avuto punteggio 37 nel test R e 50 nel test T. Il test R è usato per predire il test T. Per predire il punteggio di p1 si utilizza l’equazione di regressione: T = R · m + a se m = e a = T= 37 · = La differenza fra il punteggio osservato e quello predetto è il residuo : 50-64,97 = -14,97 La varianza dei predetti (varianza spiegata) più la varianza dell’errore (varianza residua) è uguale alla varianza della variabile da predire. 19

20 Regressione con SPSS...

21 Parte seconda Esame dei residui

22 I RESIDUI Sono indipendenti dal predittore Costituiscono l’errore di predizione (o di stima) dell’equazione di regressione Hanno  media uguale a 0  d.s. = s y · √(1-r 2 xy ) (detta anche errore standard della stima)  Si ipotizza che abbiano una distribuzione normale. Se sono distribuiti normalmente, possiamo applicare le tavole della curva normale, e stabilire che, per esempio: tra +- 1,64 errori standardizzati si trova il 90% degli errori di predizione 22

23 Perché si esaminano i residui? L’esame dei residui permette di: testare le capacità del test di predizione, per poterlo poi usare in situazioni reali, dove non si conosce il punteggio da predire. Valutare distribuzioni anomale, sbilanciate in una direzione o nell’altra, in alcune zone della distribuzione dei punteggi osservati piuttosto che in altre. L’esame dei residui è veramente proficuo nella regressione multipla 23

24 90% ± 1,64 ds 95,45% ± 2 ds 68.26% ± 1 ds 95% ± 1,96 ds 24

25 D ISTRIBUZIONE IPOTETICA DEI RESIDUI Il 90 % degli errori di predizione è compreso fra -19,3 e +19,3 Il 68 % degli errori di predizione è compreso fra -11,77 e + 11,77 (Il resto è più grande in valori assoluti) 25

26 3090 Rappresentazione grafica della predizione di due punteggi qualsiasi, p. es., 30 e 90, con le frequenze di possibili errori Asse dei punteggi 26 Le curve rappresentano la probabilità di trovare un punteggio predetto corrispondente ad un certo valore diverso dal punteggio osservato, oppure la probabilità che il punteggio reale sia un certo valore (diverso dal punteggio predetto). Per esempio, per quanto riguarda 30, è più probabile trovare punteggi predetti intorno a 30 che valori che si distanziano notevolmente dal valore osservato, ed è più probabile che, se il punteggio predetto è 30, il valore reale sia circa 30.

27 Stima e precisione della stima Il punteggio predetto 30 è vicino a quello osservato, o reale, che non è conosciuto, ma è stimabile: c’è il 90% di probabilità che il valore esatto o osservato si situi entro l’intervallo e , ossia fra e Il punteggio predetto 90 è vicino a quello osservato, o reale, che non è conosciuto, ma è stimabile: c’è il 90% di probabilità che il valore esatto o osservato si situi entro l’intervallo e , ossia fra e

28 R IASSUMENDO La regressione statistica permette di stimare (o predire) il punteggio di un test (o di un’altra misurazione). Nella predizione del singolo caso non è mai possibile sapere se la predizione è esatta o molto sballata. Si può quantificare la predizione totale, fatta su tutti i casi (presenti e futuri): la quota di varianza spiegata (r 2 ) è un utile indice per definire la precisione della predizione. 28

29 M ECCANISMO DELLA PREDIZIONE O DELLA STIMA Per ogni individuo, l’equazione della regressione predice un valore di Y, indicato con Ŷ, simile ma non uguale al valore osservato Y La differenza fra Y e Ŷ è chiamata residuo, o errore Y sta vicino a Ŷ, con alta probabilità è molto vicino, con bassa probabilità è molto lontano dal valore vero Questa relazione è definibile con la curva gaussiana, con m = 0 e σ = err. stand. della stima Perciò, se non si può calcolare il punteggio reale, si può affermare che esso deve trovarsi con il 90 % (o altri livelli) di probabilità entro un certo intervallo calcolabile. 29


Scaricare ppt "Il residuo nella predizione 1. D EFINIZIONE DI RESIDUO Il residuo è la differenza fra il punteggio predetto e il punteggio osservato Residuo= Osservato."

Presentazioni simili


Annunci Google