Analisi dei dati per i disegni ad un fattore
t di Student La statistica t di Student é definita come t = (Y-s2/N)-1/2 dove Y é la variabile, il parametro valor medio della popolazione, s é la deviazione standard stimata ed N il numero delle osservazioni.
t di Student Essa rappresenta lo scarto dalla media misurato in unità dell’errore standard della distribuzione campionaria. Può essere utilizzato per costruire intervalli di confidenza attorno alla stima puntuale della media campionaria,
<Y> ± (t /2) s2/N)-1/2 t di Student Il parametro con livello di confidenza (1-si trova all’interno dell’intervallo: <Y> ± (t /2) s2/N)-1/2
t di Student La statistica t di Student consente di realizzare un test di inferenza statistica per il confronto tra due medie campionarie. In questo caso H0 prevede che la differenza tra le due medie campionarie sia nulla.
t di Student La statistica t di Student per il confronto tra medie campionarie ha quindi al numeratore la differenza delle medie campionarie e al denominatore l’errore standard della distribuzione della differenza delle medie campionarie.
t di Student Se i due campioni sono composti da N1 ed N2 valori rispettivamente, la statistica risulterà avere (N1+N2-2) gradi di libertà o gdl, perché sia lo scarto tra le medie che il corrispondente errore standard sono stimati a partire dai dati.
Inferenza statistica Si rifiuta H0 in base ai dati Si accetta H0 in base ai dati H0 è vera Errore di I tipo False Alarm ( Decisione corretta Hit H0 è falsa Correct Rejection Errore di II tipo Omission (
La statistica del 2 La statistica del é costituita da somme di punti Z al quadrato. Il numero dei gdl è pari al numero di punti Z sommati.
La statistica del 2 La distribuzione del con pochi gdl è asimmetrica e ha come valore atteso lo zero; all’aumentare dei gdl il valore atteso tende ad essere pari al valore dei gdl, mentre la varianza tende ad essere pari a 2
La statistica F di Fisher La statistica F di Fisher é costituita dal rapporto tra due F= (
La statistica F di Fisher La distribuzione F è asimmetrica, non negativa e ha una forma che dipende dai gdl. Tra la statistica F e la t intercorre un’ovvia relazione: F11= (t1
L’analisi della varianza L’ANOVA è una tecnica statistica che sottopone a verifica l’ipotesi nulla secondo la quale le medie campionarie di J gruppi sono estratte dalla medesima popolazione, e quindi sono pari al parametro della popolazione : H0 : 1 = 2 = 3 = ..... = J =
L’analisi della varianza Nell’ANOVA ad una via i gruppi sono individuati a partire dai livelli di un unico fattore o trattamento. Si chiamano effetti del trattamento () gli scarti tra la media di un gruppo e la media generale: J = (J -
L’analisi della varianza L’ANOVA fornisce un modello dei dati, nel senso che permette di esprimere il valore delle osservazioni in termini dei parametri del modello più un termine di errore; per il modello tra i soggetti abbiamo: Yij = + eij
L’analisi della varianza Il punto di partenza dell’analisi è la scomposizione della devianza totale: SQTOTALE = i,j(Yij-<Y>)2 = = i,j ( (Yij- <YJ>) + (<YJ>-<Y>) )2 = = i,j (Yij- <YJ>)2 + nj j (<YJ>-<Y>)2 = =SQINTRAGRUPPO + SQINTERGRUPPO dove nj è la numerosità del gruppo j-esimo.
L’analisi della varianza Per valutare l’entità e la significatività statistica degli effetti (nel loro insieme), l’ANOVA confronta la media dei quadrati intgruppo QMINTERGRUPPO = SQINTERGRUPPO/(J-1) con la media dei quadrati intragruppo QMINTRAGRUPPO = SQINTraGRUPPO/(N - J)
L’analisi della varianza Sotto l’ipotesi nulla, queste due quantità riflettono due stime equivalenti della varianza dell’errore. Quindi se la variabilità interna ai gruppi e quella tra i gruppi così stimate sono equivalenti allora l’ipotesi nulla sarà verificata.
L’analisi della varianza Per realizzare il confronto si utilizza la statistica F di Fisher, che per un confronto ad N soggetti e J gruppi ha la forma: FJ-1,N-J = QM INTERGRUPPO / QMINTRAGRUPPO
L’analisi della varianza Ricordiamo che l’ANOVA assume l’omoschedasticità, ovvero l’uguaglianza delle varianze tra i gruppi. L’ipotesi di uguaglianza delle varianze è verificata con il test di Levène. Se il test di Levène è significativo sarebbe necessario rinunciare all’ANOVA e ricorrere ad un confronto non parametrico, ad esempio usando il test di Wilcoxon.
L’analisi della varianza Ciò é specialmente vero nel caso di gruppi non bilanciati, cioè di gruppi con numerosità molto diverse tra loro.
L’analisi della varianza Tuttavia, dato che gli effetti della eteroschedasticità consistono in un aumento della probabilità di commettere errori di primo tipo, in caso di moderata eteroschedasticità (fino ad un rapporto 3:1 tra la varianza massima e la minima) si può procedere con l’ANOVA considerando però un valore più restrittivo.
L’analisi della varianza L’ANOVA assume inoltre la normalità e l’indipendenza degli errori. Se queste assunzioni non sono rispettate la possibilità di commettere errori di I tipo aumenta e la sensibilità del test diminuisce.
L’analisi della varianza Il modello ANOVA consente di stimare l’entità degli effetti attraverso il quoziente 2, che fornisce la quota di varianza spiegata dalla variabile indipendente; 2 é definito in termini di somma dei quadrati: 2=SQINTERGRUPPO/ SQTOTALE
L’analisi della varianza Dato che SQTOTALE= SQINTERGRUPPO+ SQINTraGRUPPO, si ha che 2 varia tra zero ed uno. Quando si analizzano fenomeni complessi è possibile che la quota di varianza spiegata da una singola variabile indipendente sia anche molto piccola.