La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Come organizzare i dati per un'analisi statistica al computer? I dati devono essere riportati su una matrice casi (righe) × variabili (colonne). Esempio:

Presentazioni simili


Presentazione sul tema: "Come organizzare i dati per un'analisi statistica al computer? I dati devono essere riportati su una matrice casi (righe) × variabili (colonne). Esempio:"— Transcript della presentazione:

1 Come organizzare i dati per un'analisi statistica al computer? I dati devono essere riportati su una matrice casi (righe) × variabili (colonne). Esempio: Var. dipendenti I casi sono i soggetti

2 Analisi di regressione multipla Uno psicologo vuole sapere se i risultati ottenuto al test Y, che misura il livello di ansia della persona può essere previsto anche dai risultati di un altro test il test A. somme: medie: tabella dei punteggi ottenuti al test Y e al test A: Lo psicologo calcola l'equazione del modello di regressione e poi effettua il test statistico per verificare se il modello è valido

3 somme: medie: Calcoliamo la covarianza tra i punteggi di Y e A e le varianze dei punteggi di Y e A covarianza: varianza di Y: varianza di A: n = 10 soggetti correlazione tra Y e A:

4 test della significatività della correlazione: t crit ( = 0.05)per 8 gdl : t crit = 2,306 il t calcolato è inferiore al t critico, per cui la correlazione non è significativa Ipotesi statistiche: H 0 : = 0 H 1 : 0

5 Calcolo dell'equazione del modello di regressione: pendenza della retta: intercetta della retta: equazione del modello di regressione: varianza spiegata: il modello spiega solo il 19.9% di varianza della Y

6 test della significatività del modello Si calcolano prima le medie dei quadrati del modello di regressione e dell'errore: MQ regr MQ err k: numero di variabili indipendenti

7 Calcolo di F: L'F critico ( = 0.05) per 1 e 8 gdl è: F crit = L'F calcolato è inferiore all'F critico, per cui il modello non è significativo, ossia non fornisce valide previsioni della variabile Y. A questo punto lo psicologo si chiede: e se aggiungessimo un altro test, il test B per vedere se riusciamo, in base ai punteggi del test A e B a prevedere i punteggi al test Y? In questo caso si deve eseguire un'analisi di regressione multipla. Ipotesi statistiche: H 0 : il modello non da valide previsioni H 1 : il modello da valide previsioni

8 Analisi di regressione multipla La regressione multipla si applica quando una data variabile indipendente Y è prevista da più di una variabile indipendente X. Nel caso che Y sia prevista da due variabili indipendente X 1 e X 2, l'equazione di regressione sarà: errore casuale (errore di misura) intercetta prima variabile indipendente coefficienti angolari (pendenze) variabile dipendente (p. osservato) seconda variabile indipendente Nell'analisi di regressione multipla occorre calcolare più di un coefficiente angolare per determinare l'equazione del modello di regressione.

9 Determinazione dell'equazione del modello di regressione con 2 var. indipendenti nella tabella seguente vengono riportati i punteggi al test Y, al test A e al test B: somme: medie: n = 10 soggetti varianza di y: varianza di a: varianza di b: covarianza tra Y e A: covarianza tra Y e B: covarianza tra A e B: k = 2 var. indip.

10 correl. tra Y e A: correl. tra Y e B: correl. tra A e B: Calcolo dei coefficienti angolari della retta di regressione multipla: NOTA BENE: ' indica il coefficiente beta standardizzato, ossia è il coefficiente dell'equazione del modello per punteggi standardizzati.

11 Calcolo dell'intercetta 0 : Equazione del modello di regressione multipla: Calcolo dei parametri a e b :

12 Metodo alternativo Prima di calcolare i coefficienti, occorre costruire la tabella della somme dei quadrati e delle covarianze: bisogna calcolare tre covarianze e tre somme dei quadrati

13 Calcolo dei coefficienti angolari 1 e 2 :

14 Il modello riesce a prevedere i punteggi al test Y? Occorre fare un'analisi statistica. Occorre calcolare: 1. Occorre calcolare R 2, ossia il valore che indica la varianza spiegata dal modello. 2. Infine, si calcola F a partire da R 2.

15 Calcolo di R 2 Il modello di regressione spiega l'86.3% della varianza dei punteggi al test Y. Calcolo di F L'F critico ( = 0.05) per 2 e 7 gdl è: F crit = L'F calcolato è superiore all'F crit. per cui il modello di regressione è in grado di prevedere la variazione dei punteggi della var. dipendente Y oppure Ipotesi statistica: H 0 : Il modello non da valide previsioni di Y H 1 : Il modello da valide previsioni di Y

16 Verifica della bontà dei singoli predittori Oltre alla bontà complessiva del modello, è possibile verificare la bontà dei singoli predittori, ossia quanto le singoli variabili indipendenti contribuiscono alla validità complessiva del modello. La bontà dei singoli predittori viene determinata tramite il calcolo dei t di Student. errore di stima 2 ipotesi statistiche: prima ipotesiH 0 : a = 0 seconda ipotesi: H 0 : b = 0 H 1 : a 0 H 1 : b 0

17 Il t critico ( = 0.05) per 7 gdl è: t crit = Tra i t calcolati solo il t della variabile B risulta superiore al t critico e quindi significativo, nel senso che la pendenza della retta è significativa. Per cui i punteggi al test B risultano essere validi predittori dei punteggi al test Y. Concludendo l'analisi: la combinazione dei test A e B consente la previsione dei punteggi al test Y, ma tra i due test, è il test B a costituire un valido predittore al test Y. Quale dei due t è significativo?


Scaricare ppt "Come organizzare i dati per un'analisi statistica al computer? I dati devono essere riportati su una matrice casi (righe) × variabili (colonne). Esempio:"

Presentazioni simili


Annunci Google