La regressione II Cristina Zogmaister.

Slides:



Advertisements
Presentazioni simili
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
L’Analisi Fattoriale (PCA) con SPSS
Lez. 3 - Gli Indici di VARIABILITA’
Analisi preliminari dei dati
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
Descrizione dei dati Metodi di descrizione dei dati
Analisi di covarianza L'analisi di covarianza è un'analisi a metà strada tra l'analisi di varianza e l'analisi di regressione. Nell'analisi di covarianza.
C – Indici di Asimmetria e Curtosi
Progetto Pilota 2 Lettura e interpretazione dei risultati
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Regressione logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
La regressione logistica binomiale
Analisi della varianza (a una via)
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Modello di regressione lineare semplice
Analisi delle corrispondenze
Secondo assignment ISTRUZIONI 1)Svolgere le analisi necessarie per rispondere alle seguenti domande 2)Rispondere a ciascuna domanda in maniera puntuale,
STATISTICA PER LE DECISIONI DI MARKETING
Regressione Logistica
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3 Le distribuzioni di frequenza e le misure di sintesi univariate.
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
DATA MINING PER IL MARKETING
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso IL MODELLO DI REGRESSIONE LINEARE MULTIPLA Esempio (d)istruttivo.
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
Anova a due fattori Esempio di piano fattoriale: il caso della progettazione robusta di batterie Tipo di Materiale Temperatura (°F)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9 Regressione lineare multipla: la stima del modello e la sua valutazione, metodi automatici.
Introduzione alla regressione multipla
Consideriamo due misurazioni, per esempio benessere e soddisfazione personale. Le due variabili sono simili. Chi ha punteggi sopra la media in una variabile,
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Strumenti statistici in Excell
Il residuo nella predizione
Metodi Quantitativi per Economia, Finanza e Management Lezione n°10 Regressione lineare multipla: la valutazione del modello, metodi automatici di selezione.
Analisi Multivariata dei Dati
1 “Metodi per la Ricerca Sociale e Organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università degli Studi di Milano-Bicocca.
3 June Biostatistica Biostatitistica= Statistica per scienze Biostatitistica= Statistica per scienze biologiche e sanitarie. biologiche e sanitarie.
Analisi discriminante lineare - contesto
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°8.
Altri concetti sulla regressione. Multicollinearità Varianza comune fra le VI: se è molto elevata produce stime instabili. Ci sono degli indici per indicare.
ANALISI E INTERPRETAZIONE DATI
STATISTICHE DESCRITTIVE
TRATTAMENTO STATISTICO DEI DATI ANALITICI
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Analisi delle osservazioni
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Regressione: approccio matriciale Esempio: Su 25 unità sono stati rilevati i seguenti caratteri Y: libbre di vapore utilizzate in un mese X 1: temperatura.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

La regressione II Cristina Zogmaister

La relazione lineare tra due variabili: Diagrammi di dispersione Direzione e intensità della relazione: Coefficiente di correlazione Previsione: analisi di regressione Informazioni importanti: Significatività del modello Percentuale di varianza spiegata Valore e significatività della costante e del coefficiente di regressione

L’output

Alcuni problemi importanti nella regressione: Gamma di osservazioni ristretta Presenza di outliers Normalità di una distribuzione: Asimmetria e curtosi Metodi grafici: Istogrammi di frequenza con sovraimposizione della normale Grafici di probabilità P-P

Regressione lineare multipla E’ consigliabile richiedere i coefficienti di correlazione bivariati Regressione lineare sequenziale (i predittori vengono immessi in differenti stadi) Il cambiamento di R2 Multicollinearità

Multicollinearità i predittori sono troppo correlati tra di loro causa problemi logici (ridondanza) causa problemi statistici (aumenta la dimensione dei termini d’errore, indebolendo l’analisi) Nel caso due predittori siano altamente correlati (es. r > .70) omettere una delle variabili creare un punteggio composito SPSS calcola la tolleranza (1 – SMC) SMC: correlazione multipla di una variabile con tutte le altre, elevata al quadrato Se la SMC è elevata, la variabile è altamente correlata con le altre dell’insieme: situazione di multicollinearità

Statistiche di collinearità: Tolleranza: Varia tra 0 e 1. Valori più elevati indicano minore multicollinearità. VIF =Variance Inflaction Factor (Fattore di inflazione della varianza – è il reciproco della tolleranza) VIF = 1 se i predittori sono ortogonali. VIF maggiori di 1 indicano presenza di relazione tra i predittori. La radice quadrata di VIF indica quanto più largo è l’errore standard rispetto al caso in cui i fattori non fossero correlati.

Correlazione troppo elevata con gli altri predittori In questo caso abbiamo un problema di multicollinearità. Sarebbe meglio analizzare la relazione tra i due predittori (IQ, short term memory span) e il criterio (reading ability) tenendo fissa l’età dei bambini.

Se teniamo sotto controllo l’effetto dell’età, c’è un legame tra IQ e abilità di lettura: Questo effetto non emergeva quando non tenevamo sotto controllo statistico l’età (c’era troppa variabilità dovuta all’età nell’abilità di lettura)

Predittori dicotomici File child_data.sav Genere sessuale 0 = maschio 1 = femmina Il modello Criterio: abilità di lettura Predittore: genere genere Abilità lettura

Inseriamo il predittore dicotomico come abbiamo fatto per quelli continui: Importante: la distribuzione non deve essere troppo sbilanciata nei confronti di una delle due categorie (Frequenza massima < 90%)

Per le femmine è uguale a 6.155 + .490 Il punteggio previsto nel criterio per i maschi (categoria 0) è uguale a 6.155, Per le femmine è uguale a 6.155 + .490

Il predittore dicotomico nella regressione multipla Nella regressione multipla, è utile chiedere sempre descrittive e test di collinearità

Il genere sessuale ha un effetto significativo sull’abilità di lettura?

La mediazione nella regressione multipla

Mediatore: Variabile che spiega la relazione tra predittore e criterio Modello causale: PREDITTORE CRITERIO MEDIATORE Nel modello, esistono due vie attraverso cui il predittore influenza il criterio: La via diretta (c), ossia l’impatto diretto del predittore sul criterio La via indiretta (a) X (b), ossia quella parte del legame tra predittore e criterio che è veicolata dalla variabile mediatrice c b a

Mediazione Tempera=tura Consumo acqua Sete

File mediazione.semplice Esempio ipotetico: Numero di decilitri di acqua consumati nell’arco di due ore, con una temperatura ambientale costante La quantità di acqua consumata è influenzata dalla temperatura ambientale? L’effetto della temperatura sul consumo di acqua è mediato dalla sete?

1° passo: vediamo se la temperatura influenza il consumo di acqua:

La temperatura ambientale è un predittore significativo del consumo di acqua, F(1, 48) = 8.519, p = .005. Al crescere di un grado della temperatura, il consumo stimato di acqua aumenta di 0.389 dl.

2° passo: Verifichiamo se la temperatura influenza la sete

3° passo: Verifichiamo se il mediatore ha un effetto sul criterio, parzializzando il predittore

Possiamo affermare che l’effetto della temperatura sul consumo di acqua è mediato dalla sete: (B) (B) Infatti sia l’effetto del predittore sul mediatore (A), sia l’effetto del mediatore sul criterio sono significativi (B).

Mediazione parziale o totale? Mediazione totale: l’effetto del predittore, parzializzando l’effetto del mediatore, risulta non significativo Mediazione parziale: l’effetto del predittore, parzializzando l’effetto del mediatore, è ridotto ma ancora significativo Lezione: 15

Come testare la mediazione (Baron e Kenny, 1986) Attraverso la stima di una serie di modelli di regressione: Verificare l’effetto significativo del predittore sul criterio Verificare l’effetto significativo del predittore sul mediatore Verificare l’effetto significativo del mediatore sul criterio (parzializzando il predittore) Se (1) – (2) – (3) sono soddisfatti Mediazione totale: il predittore non è significativo in presenza del mediatore; Mediazione parziale: il predittore ha un effetto significativo sul criterio in presenza del mediatore Affinché vi sia mediazione, l’effetto del predittore sul criterio nella terza equazione deve essere inferiore che nella seconda. La mediazione è perfetta se nella terza equazione l’effetto del predittore è nullo. NOTA IMPORTANTE: A causa della multicollinearità tra mediatore e predittore nel terzo modello, non dobbiamo soffermarci solo sui test dei coefficienti ma considerare anche il valore assoluto dei coefficienti di regressione

Da soli: Rosenthal.sav Esempio basato sull’effetto delle aspettative degli insegnanti sul successo scolastico degli studenti Due mediatori ipotizzati: Clima sociale (atteggiamento positivo verso lo studente) Input (quantità e difficoltà del materiale insegnato allo studente) Si ipotizza che in presenza di alte aspettative l’insegnante manifesti un atteggiamento più positivo e insegni allo studente più cose e questi due mediatori portino al maggiore successo. Testate l’ipotesi che il clima sociale media l’effetto delle aspettative sulla prestazione

Ipotesi da testare statisticamente: Aspettative Successo scolastico Atteggiamento

1) Il predittore influenza il criterio

2) Il predittore influenza il mediatore social climate

3) Il mediatore influenza il criterio (parzializzando il predittore)

4) L’effetto del predittore diminuisce sensibilmente per effetto della presenza del mediatore Mediazione parziale o totale?

Aspettative Successo scolastico Beta = .552 *** (beta = .274, n.s.) Beta = .653 *** Atteggiamento Beta = .425 * Effetto totale = Effetto diretto + Effetto Mediato . 552 = .274 + .653 * .425 Nota: *** = p < .001; * = p < .05

Da soli - Ipotesi da testare statisticamente: Aspettative Successo scolastico Input Fate la decomposizione dell’effetto totale in effetto diretto ed effetto mediato (anche se l’ipotesi di mediazione non risultasse confermata)

Analisi Il predittore influenza il criterio? (Sì) Il predittore influenza il mediatore? Il mediatore influenza il criterio? Confronto tra l’effetto del predittore sul criterio in presenza / assenza del mediatore (no – STOP) (tendenza)

Aspettative Successo scolastico Beta = .552 *** (beta = .492 ***) Beta = .239 n.s. Input Beta = .251 ° Effetto totale = Effetto diretto + Effetto Mediato . 552 = .492 + .239 * .251 Nota: *** = p < .001; ° = p < .10

Esempio di report L’aspettativa degli insegnanti era significativamente legata alla prestazione degli studenti, F(1,38) = 16.654, beta = .552, p < .001, R2 = . 305, R2 corretto = .286. Un aumento di un’unità nella scala di aspettativa degli insegnanti era associato a un aumento di .701 punti nella valutazione di fine semestre. Sono state condotte due analisi di mediazione, per testare rispettivamente l’ipotesi che questo effetto fosse mediato da (a) l’atteggiamento degli insegnati verso gli allievi (variabile social climate) e (b) le informazioni che venivano impartite attraverso l’insegnamento (variabile input). E’ emerso un effetto di mediazione statisticamente significativo per la variabile social climate, ma non per la variabile input. Le aspettative degli insegnanti erano associate positivamente all’atteggiamento verso gli studenti, che a sua volta era positivamente associato al voto di fine semestre. Come emerge dal grafico della mediazione presentato in fig. 1, l’effetto di mediazione era totale. Non sono invece emersi effetti significativi delle aspettative degli insegnanti sull’input, F (1,38) = 2.310, p = .137, R2 = .057, R2 corretto = .032, pertanto l’ipotesi di mediazione da parte dell’input è stata disconfermata.

Miglioramento sintomi Predittore dicotomico Terapia 0 = tradizionale 1 = + esercizio Miglioramento sintomi Autoefficacia

Effetto della terapia sui sintomi: Inseriamo il predittore dicotomico come un normale predittore Ci sono differenze tra il risultato del trattamento tradizionale e del trattamento “+ esercizio”? Quale dei due trattamenti è più efficace?

Effetto del trattamento sull’autoefficacia:

Effetto dell’autoefficacia sul miglioramento dei sintomi:

Mediazione parziale o totale?

Miglioramento sintomi Terapia 0 = tradizionale 1 = + esercizio Miglioramento sintomi Beta = .500 *** (beta = .188 *) Beta = .501 *** Autoefficacia Beta = .623 *** Effetto totale = Effetto diretto + Effetto Mediato . 500 = .188 + .501 * .623 Nota: *** = p < .001; * = p < .05

Da soli: pubblicità.sav – ipotesi da testare statisticamente Consumi Atteggiamenti

Test effetto di mediazione atteggiamento esplicito: Pubblicità Consumi Beta = .290 *** (beta = .277 ***) Beta = .602 *** Atteggiamenti espliciti Beta = .021, n.s. Controllo: .290 = .277 + .602 * .021

Test effetto di mediazione atteggiamento implicito: Pubblicità Consumi Beta = .290 *** (beta = -.042 n.s.) Beta = .502 *** Atteggiamenti impliciti Beta = .663, *** Controllo: .290 = -.042 + .502 * .663