La regressione II Cristina Zogmaister
La relazione lineare tra due variabili: Diagrammi di dispersione Direzione e intensità della relazione: Coefficiente di correlazione Previsione: analisi di regressione Informazioni importanti: Significatività del modello Percentuale di varianza spiegata Valore e significatività della costante e del coefficiente di regressione
L’output
Alcuni problemi importanti nella regressione: Gamma di osservazioni ristretta Presenza di outliers Normalità di una distribuzione: Asimmetria e curtosi Metodi grafici: Istogrammi di frequenza con sovraimposizione della normale Grafici di probabilità P-P
Regressione lineare multipla E’ consigliabile richiedere i coefficienti di correlazione bivariati Regressione lineare sequenziale (i predittori vengono immessi in differenti stadi) Il cambiamento di R2 Multicollinearità
Multicollinearità i predittori sono troppo correlati tra di loro causa problemi logici (ridondanza) causa problemi statistici (aumenta la dimensione dei termini d’errore, indebolendo l’analisi) Nel caso due predittori siano altamente correlati (es. r > .70) omettere una delle variabili creare un punteggio composito SPSS calcola la tolleranza (1 – SMC) SMC: correlazione multipla di una variabile con tutte le altre, elevata al quadrato Se la SMC è elevata, la variabile è altamente correlata con le altre dell’insieme: situazione di multicollinearità
Statistiche di collinearità: Tolleranza: Varia tra 0 e 1. Valori più elevati indicano minore multicollinearità. VIF =Variance Inflaction Factor (Fattore di inflazione della varianza – è il reciproco della tolleranza) VIF = 1 se i predittori sono ortogonali. VIF maggiori di 1 indicano presenza di relazione tra i predittori. La radice quadrata di VIF indica quanto più largo è l’errore standard rispetto al caso in cui i fattori non fossero correlati.
Correlazione troppo elevata con gli altri predittori In questo caso abbiamo un problema di multicollinearità. Sarebbe meglio analizzare la relazione tra i due predittori (IQ, short term memory span) e il criterio (reading ability) tenendo fissa l’età dei bambini.
Se teniamo sotto controllo l’effetto dell’età, c’è un legame tra IQ e abilità di lettura: Questo effetto non emergeva quando non tenevamo sotto controllo statistico l’età (c’era troppa variabilità dovuta all’età nell’abilità di lettura)
Predittori dicotomici File child_data.sav Genere sessuale 0 = maschio 1 = femmina Il modello Criterio: abilità di lettura Predittore: genere genere Abilità lettura
Inseriamo il predittore dicotomico come abbiamo fatto per quelli continui: Importante: la distribuzione non deve essere troppo sbilanciata nei confronti di una delle due categorie (Frequenza massima < 90%)
Per le femmine è uguale a 6.155 + .490 Il punteggio previsto nel criterio per i maschi (categoria 0) è uguale a 6.155, Per le femmine è uguale a 6.155 + .490
Il predittore dicotomico nella regressione multipla Nella regressione multipla, è utile chiedere sempre descrittive e test di collinearità
Il genere sessuale ha un effetto significativo sull’abilità di lettura?
La mediazione nella regressione multipla
Mediatore: Variabile che spiega la relazione tra predittore e criterio Modello causale: PREDITTORE CRITERIO MEDIATORE Nel modello, esistono due vie attraverso cui il predittore influenza il criterio: La via diretta (c), ossia l’impatto diretto del predittore sul criterio La via indiretta (a) X (b), ossia quella parte del legame tra predittore e criterio che è veicolata dalla variabile mediatrice c b a
Mediazione Tempera=tura Consumo acqua Sete
File mediazione.semplice Esempio ipotetico: Numero di decilitri di acqua consumati nell’arco di due ore, con una temperatura ambientale costante La quantità di acqua consumata è influenzata dalla temperatura ambientale? L’effetto della temperatura sul consumo di acqua è mediato dalla sete?
1° passo: vediamo se la temperatura influenza il consumo di acqua:
La temperatura ambientale è un predittore significativo del consumo di acqua, F(1, 48) = 8.519, p = .005. Al crescere di un grado della temperatura, il consumo stimato di acqua aumenta di 0.389 dl.
2° passo: Verifichiamo se la temperatura influenza la sete
3° passo: Verifichiamo se il mediatore ha un effetto sul criterio, parzializzando il predittore
Possiamo affermare che l’effetto della temperatura sul consumo di acqua è mediato dalla sete: (B) (B) Infatti sia l’effetto del predittore sul mediatore (A), sia l’effetto del mediatore sul criterio sono significativi (B).
Mediazione parziale o totale? Mediazione totale: l’effetto del predittore, parzializzando l’effetto del mediatore, risulta non significativo Mediazione parziale: l’effetto del predittore, parzializzando l’effetto del mediatore, è ridotto ma ancora significativo Lezione: 15
Come testare la mediazione (Baron e Kenny, 1986) Attraverso la stima di una serie di modelli di regressione: Verificare l’effetto significativo del predittore sul criterio Verificare l’effetto significativo del predittore sul mediatore Verificare l’effetto significativo del mediatore sul criterio (parzializzando il predittore) Se (1) – (2) – (3) sono soddisfatti Mediazione totale: il predittore non è significativo in presenza del mediatore; Mediazione parziale: il predittore ha un effetto significativo sul criterio in presenza del mediatore Affinché vi sia mediazione, l’effetto del predittore sul criterio nella terza equazione deve essere inferiore che nella seconda. La mediazione è perfetta se nella terza equazione l’effetto del predittore è nullo. NOTA IMPORTANTE: A causa della multicollinearità tra mediatore e predittore nel terzo modello, non dobbiamo soffermarci solo sui test dei coefficienti ma considerare anche il valore assoluto dei coefficienti di regressione
Da soli: Rosenthal.sav Esempio basato sull’effetto delle aspettative degli insegnanti sul successo scolastico degli studenti Due mediatori ipotizzati: Clima sociale (atteggiamento positivo verso lo studente) Input (quantità e difficoltà del materiale insegnato allo studente) Si ipotizza che in presenza di alte aspettative l’insegnante manifesti un atteggiamento più positivo e insegni allo studente più cose e questi due mediatori portino al maggiore successo. Testate l’ipotesi che il clima sociale media l’effetto delle aspettative sulla prestazione
Ipotesi da testare statisticamente: Aspettative Successo scolastico Atteggiamento
1) Il predittore influenza il criterio
2) Il predittore influenza il mediatore social climate
3) Il mediatore influenza il criterio (parzializzando il predittore)
4) L’effetto del predittore diminuisce sensibilmente per effetto della presenza del mediatore Mediazione parziale o totale?
Aspettative Successo scolastico Beta = .552 *** (beta = .274, n.s.) Beta = .653 *** Atteggiamento Beta = .425 * Effetto totale = Effetto diretto + Effetto Mediato . 552 = .274 + .653 * .425 Nota: *** = p < .001; * = p < .05
Da soli - Ipotesi da testare statisticamente: Aspettative Successo scolastico Input Fate la decomposizione dell’effetto totale in effetto diretto ed effetto mediato (anche se l’ipotesi di mediazione non risultasse confermata)
Analisi Il predittore influenza il criterio? (Sì) Il predittore influenza il mediatore? Il mediatore influenza il criterio? Confronto tra l’effetto del predittore sul criterio in presenza / assenza del mediatore (no – STOP) (tendenza)
Aspettative Successo scolastico Beta = .552 *** (beta = .492 ***) Beta = .239 n.s. Input Beta = .251 ° Effetto totale = Effetto diretto + Effetto Mediato . 552 = .492 + .239 * .251 Nota: *** = p < .001; ° = p < .10
Esempio di report L’aspettativa degli insegnanti era significativamente legata alla prestazione degli studenti, F(1,38) = 16.654, beta = .552, p < .001, R2 = . 305, R2 corretto = .286. Un aumento di un’unità nella scala di aspettativa degli insegnanti era associato a un aumento di .701 punti nella valutazione di fine semestre. Sono state condotte due analisi di mediazione, per testare rispettivamente l’ipotesi che questo effetto fosse mediato da (a) l’atteggiamento degli insegnati verso gli allievi (variabile social climate) e (b) le informazioni che venivano impartite attraverso l’insegnamento (variabile input). E’ emerso un effetto di mediazione statisticamente significativo per la variabile social climate, ma non per la variabile input. Le aspettative degli insegnanti erano associate positivamente all’atteggiamento verso gli studenti, che a sua volta era positivamente associato al voto di fine semestre. Come emerge dal grafico della mediazione presentato in fig. 1, l’effetto di mediazione era totale. Non sono invece emersi effetti significativi delle aspettative degli insegnanti sull’input, F (1,38) = 2.310, p = .137, R2 = .057, R2 corretto = .032, pertanto l’ipotesi di mediazione da parte dell’input è stata disconfermata.
Miglioramento sintomi Predittore dicotomico Terapia 0 = tradizionale 1 = + esercizio Miglioramento sintomi Autoefficacia
Effetto della terapia sui sintomi: Inseriamo il predittore dicotomico come un normale predittore Ci sono differenze tra il risultato del trattamento tradizionale e del trattamento “+ esercizio”? Quale dei due trattamenti è più efficace?
Effetto del trattamento sull’autoefficacia:
Effetto dell’autoefficacia sul miglioramento dei sintomi:
Mediazione parziale o totale?
Miglioramento sintomi Terapia 0 = tradizionale 1 = + esercizio Miglioramento sintomi Beta = .500 *** (beta = .188 *) Beta = .501 *** Autoefficacia Beta = .623 *** Effetto totale = Effetto diretto + Effetto Mediato . 500 = .188 + .501 * .623 Nota: *** = p < .001; * = p < .05
Da soli: pubblicità.sav – ipotesi da testare statisticamente Consumi Atteggiamenti
Test effetto di mediazione atteggiamento esplicito: Pubblicità Consumi Beta = .290 *** (beta = .277 ***) Beta = .602 *** Atteggiamenti espliciti Beta = .021, n.s. Controllo: .290 = .277 + .602 * .021
Test effetto di mediazione atteggiamento implicito: Pubblicità Consumi Beta = .290 *** (beta = -.042 n.s.) Beta = .502 *** Atteggiamenti impliciti Beta = .663, *** Controllo: .290 = -.042 + .502 * .663