La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

1 Introduzione alla statistica per la ricerca Lezione IV Stefano Guidi Siena, 30Ottobre 2010.

Presentazioni simili


Presentazione sul tema: "1 Introduzione alla statistica per la ricerca Lezione IV Stefano Guidi Siena, 30Ottobre 2010."— Transcript della presentazione:

1 1 Introduzione alla statistica per la ricerca Lezione IV Stefano Guidi Siena, 30Ottobre 2010

2 Statistica Inferenziale Processo di verifica di ipotesi: Assumo che H 0 sia vera Calcolo la probabilità (p) di osservare i risultati ottenuti per caso Se p < 5% rigetto H 0 e concludo H 1 vera Test significativo al 5% (α=5%) Se H 0 fosse vera i risultati che ho trovato sarebbero troppo improbabili->H 0 falsa 2

3 3 Confrontare medie (usi del t-test) Confrontare la media di un campione ad un valore di riferime nto T test ad un campione (H 0 : μ=μ 0 vs H a :μμ 0 ) Es: I bambini di 4 anni comprendono il passivo o danno una risposta a caso? (H 0 : μ=0.5 vs H a :μ0.5) Confrontare le medie di due campioni T test a due campioni indipendenti (H 0 : μ 1 =μ 2 vs H a :μ 1 μ 0 ) Es: La comprensione del passivo dei maschi è diversa da quella delle femmine? (H 0 : μ m =μ f vs H a :μ m μ f )

4 BrightStats Web-application (gratuita) per analisi statistiche (registrazione obbligatoria) 3 tipi di finestre: Data: I dati Variables: elenco delle variabili presenti e delle loro caratteristiche (tipo di scala) Output: grafici e risultati delle analisi 4

5 BrightStats (Interfaccia) 5 Barra menù Icone accesso rapido Area dati/variabili/output Navigazione finestre

6 Menu File (gestione file dati) Caricare i dati (da file esterni): 1.Comando: File/Upload Database Scegliere e caricare un file.xls(x) o.txt (occhio al formato) 2.Comando: File/Import from Database Scegliere il file precedentemente uploadato Salvare i dati in locale: Comando: File/Save from Local Specificare il nome del file Caricare i dati (da locale): Comando: File/Load to local Specificare il nome del file 6

7 7 T test in BrightStats Formato dati: una colonna per i valori della variabile dipendente (scala numerica), una riga per (ogni) soggetto Esplorare prima i dati Comando: Analyze/Descriptives Scegliere variabili di interesse e selezionare le statistiche richieste (media, mediana, deviazione standard, min, max…) Comando: Graphs/Histograms Specificare estremi ed intervallo

8 8 T test in BrightStats Effettuare il test Comando: Analyze/Compare Means/One Sample T test Specificare il valore contro cui testare la media del gruppo Output Valore di t; P value: probabilità di osservare il risultato per caso con H 0 vera (Test significativo se p 0.05) df: gradi di libertà del test (riportare insieme a t e p!)

9 Confrontare 2 medie La paura dei ragni (aracnofobia) è causata solo dai ragni veri o anche dalle immagini dei ragni? 24 aracnofobici 2 gruppi (formati a caso) 12 vedono ragni veri 12 vedono immagini di ragni Il gruppo è la variabile indipendente Test per ansia (variabile dipendente) 9

10 10 T test in BrightStats Formato dati: una colonna per i valori della variabile dipendente (scala numerica), una riga per (ogni) soggetto [ex: Anxiety) Una colonna per indicare il gruppo di appartenza (scala numerica, labels per i nomi gruppi) [ex: Group] Esplorare i dati: Comando: Graphs>Lines Scegliere il tipo di grafico (Single lines + Summaries for groups) Specificare cosa rappresenta la linea (other Summary) Specificare quale è la variabile di interesse (Variable) Specificare il tipo di indice da calcolare (Function. Ex: Mean) Specificare quale è lasse delle categoria (Category Axis)

11 11 T test in BrightStats Effettuare il test Comando: Analyze>Compare Mean>Indipendent Samples T test Specificare quale è la variabile dipendente (test variables) Specificare quale è la variabile indipendente (grouping variable) Specificare quali livelli della variabile indipendente definiscono i gruppi (group 1 e group 2) Output Test della varianza (se significativo, varianze diverse) Esito del T-test (per varianze uguali e diverse) Cosa riportare Media del gruppo o dei gruppi e della differenza, e relativi standar error t(df) = valore t; p = p value

12 Campioni appaiati A volte i campioni che io voglio confrontare riguardano le stesse persone, che io osservo in condizioni diverse (misure ripetute) Ex: Paura prima-dopo terapia Violate le assunzioni del t-test Usare il related samples t-test 12

13 Esempio 1 Terapia Cognitivo-Comportamentale ed anoressia. Soggetti: 29 ragazze con diagnosi di anoressia Misura (variabile indipendente) Peso (lb) prima della terapia 12 settimane dopo la terapia 13

14 Campioni appaiati in BrightStats Formato dati: Almeno due colonne per la variabile dipendente Ex: prima e dopo terapia Una riga per soggetto T-test a campioni appaiati (paired) Comando: Analyze/Compare Means/2 Related Samples Specificare le coppie di variabili 14

15 Campioni appaiati Vantaggi rispetto al test a campioni indipendenti: Più potenza statistica con minor numero di soggetti Maggiore sensibilità per rigettare H 0 anche con differenze piccole Considero la variazione individuale Contro: Non sempre applicabile Effetti di carry over (ordine dei trattamenti) 15

16 16 Oltre il t test T test confronta 2 gruppi alla volta Spesso vogliamo confrontare più di 2 gruppi (livelli della variabile indipendente) Ex: Valutare le differenze tra lefficacia di 10 possibili loghi per un nuovo brand Ex: Verificare lefficacia di due diversi dosaggi di un farmaco, (rispetto ad un controllo - placebo) Altre volte vogliamo confrontare leffetto di più di una variabile indipendente Ex: efficacia di uno spot in base al contenuto di immagini di donne discinte (nessuno, basso, alto) per uomini e donne (seconda variabile indipendente)

17 17 Oltre il t test Posso fare tanti t test, 1 per ogni possibile coppia di loghi, ma Tanti test: 10 loghi -> 45 coppie! Richiede molti calcoli I risultati sono meno comprensibili I test non sono indipendenti Aumentano le probabilità di avere un test significativo per caso (familywise error rate) 1 test significativo su 20 è uno sbaglio! Soluzione: Analisi della Varianza (ANOVA)

18 18 Analisi della Varianza (ANOVA) Ronald Fisher Permette di confrontare le differenze tra le medie di 2 o più gruppi/trattamenti H 0 :μ i =μ j per ogni i e j H a :μ i μ j per almeno una coppia i,j Stessa logica di fondo nel test Calcolo di una statistica F che misura il grado in cui H 0 è violata F misura la probabilità di osservare per caso i risultati ottenuti, assumendo che H 0 sia vera F grande indica differenze difficilmente attribuibili al caso

19 19 Esempio 1 Sono interessato agli effetti di un farmaco sul grado di allerta in un compito di natura attentiva 18 soggetti, 3 gruppi Variabile indipendente (dosaggio) Basso dosaggio farmaco Alto dosaggio farmaco Controllo (placebo) Test del grado di allerta Numero di errori nel compito (variabile dipendente)

20 20 ANOVA in BrightStats (I) Formato dati Una riga per ogni soggetto Una colonna per nome/numero del soggetto (consigliato) Una colonna per (ogni) variabile indipendente Variabile di tipo string (measure = scale) per ANOVA 1-way, OPPURE Variabile scala numerica (più generale, consigliato) Per trasformare una variabile string in una numerica usare: Transform/Automatic Recode Una colonna per i valori della variabile dipendente (scala numerica)

21 21 ANOVA in BrightStats (II) Esplorare i dati (descrittive, grafico medie) Condurre il test (opzione 1 - limitata) Comando: Analyze/Compare Means/One Way ANOVA Specificare la(e) variabile(i) dipendente (Test Variables) Specificare la variabile indipendente (Grouping Variable) Condurre il test (opzione 2 - migliore) * Comando: Analyze/ANOVA/ANOVA Specificare la variabile dipendente (Dependent Variable) Specificare la(e) variabile(i) indipendente (Fixed Factors) * solo se indipendente(i) numerica

22 Output ANOVA Output BrightStas Tabella medie Test varianze (opz.) Tabella anova Riportare: Valore di F; P value: (Test significativo se p 0.05) df: gradi di libertà (Between Groups e Within Groups) 22 Esempio F(2,15)=8,789; P<.01

23 23 F è un test generalista F test significativo Fornisce evidenza contro H 0 H 0 è specifica H a è generica: molti pattern possibili Non mi dice come H 0 è violata Non distingue diversi possibili pattern compatibili con H a Test Omnibus (generalista) Non fornisce informazioni sulla natura degli effetti dei trattamenti

24 24 Quali medie differiscono? 2 strumenti diversi per individuare quali gruppi differiscano Confronti analitici/contrasti pianificati/ad hoc Confronti sistematici/post hoc (in BrightStats) Entrambi i sistemi permettono di controllare il rischio di errori di tipo I (cioè rifiutare lipotesi nulla quando questa è vera), Gli errori di tipo I aumentano con il numero di test indipendenti condotti sui dati di un esperimento Ecco perché non è consigliabile applicare semplicemente un t- test a tutte le coppie di medie

25 Post hoc (confronti a coppie) Confronti tra le medie di tutte le possibili coppie di gruppi: Alto vs basso Alto vs controllo Basso vs controllo Selezionarli dalle opzioni della finestra di dialogo del test: Tukey HSD (pochi gruppi) Scheffe (molti gruppi) Duncan (sconsigliato) 25

26 26 Esempio 2 (1-way) Sono interessato agli effetti di 2 farmaci per i disordini da iperattività nei bambini 15 bambini affetti di età uguale 5 placebo 5 farmaco A 5 farmaco B Test di comprensione su testo Numero di errori (variabile dipendente)

27 Esempio 3 (1-Way) Consumo di caffeina e controllo motorio Finger tapping test: Battere con un dito su un tasto in un intervallo di tempo (10s) Numero di battutte nellintervallo (variabile dipendente) Variabile indipendente Dose di caffeina assunta (4 livelli) Livelli: 0, 100, 200 o 300 ml 27

28 28 ANOVA 1-way e Fattoriale In una ANOVA 1-way i gruppi sono definiti dai livelli di una sola variabile indipendente: Num. dei gruppi = num. dei livelli del fattore indipendente Una ANOVA fattoriale analizza simultaneamente leffetto di più di un fattore sulla variabile dipendente Num. gruppi = (num. livelli del I fattore) x (num. livelli del II fattore) x (…) Es:Fattore Età (3 anni, 6 anni, adulti) Fattore Lingua Madre (Italiano, Inglese) 3 x 2 = 6 gruppi

29 29 Esempio ANOVA fattoriale (2-way) Variabile dipendente: Valore della bellezza del partner 2 Fattori: Genere (2 livelli) Alcool assunto (3 livelli: no alcool, 2, 4 pinte) 2 x 3 = 6 possibili combinazioni Interazione tra i fattori

30 30 Interazione di Fattori In una ANOVA fattoriale possiamo analizzare non solo gli effetti dei singoli fattori (sulla variabile dipendente), ma anche gli effetti di interazione tra i fattori Interazione: leffetto di uno dei fattori sulla variabile dipendente cambia ai diversi livelli di un altro fattore Effetto semplice: leffetto di uno dei fattori ad uno specifico livello di un altro fattore Effetto principale: effetto di un fattore indipendentemente dai livelli degli altri fattori

31 Esempio 3: La mariuana ti rallenta? Fattori: Precedente uso di mariuana (3 livelli) Nessuno Lieve Moderato Condizione (2 livelli): Fuma una sigaretta che sembra e odora come una canna Fuma una canna Variabile dipendente: tempo di reazione (ms) 31

32 32 Esempio Fattoriale 2 Uno psicologo vuole sapere se Gli effetti fisiologici dellalcol influenzano laggressività, e se Le aspettative (psicologiche) sul consumo di alcol influenzano laggressività Fattori: Consumo di alcol: si vs no Aspettativa di assumere alcol: si vs no Variabile dipendente Intensità scossa somministrata

33 33 Tipi di Fattori e di ANOVA Si distinguono 2 tipi di fattori in una ANOVA: Fattori Between Subjects Soggetti diversi assegnati ai diversi livelli del fattore (Gruppo di età) Analogia con t test per campioni indipendenti Fattori Within Subjects (ANOVA a misure ripetute) Ogni soggetto testato a tutti i livelli del fattore Analogia con t test per campioni appaiati In unANOVA mista sono combinati fattori between subjects e within subjects

34 Esempio 1-Way Within Differenze tra tutor nella severità nel correggere i compiti Fattore (variabile indipendente): tutor incaricato di correggere i compiti 4 livelli (diversi tutor) Variabile dipendente (misura): Voto assegnato dal tutor 10 compiti 34

35 35 ANOVA Misure Ripetute in BrightStats Formato dati Numero di colonne (numeriche) = Numero di livelli fattore Within [EX: tutor = 4] Una riga per ogni soggetto Le celle contengono la variabile dipendente Effettuare il test * Comando: Analyze/Compare Means/Rep. One Way ANOVA Specificare le variabili con le misure (una per ogni livello del fattore) nel campo Test Variables Specificare i post-hoc e altre opzioni * Valido solo in caso di solo fattore (1-Way) Within

36 Output BrightStats Tabella medie Tabella ANOVA Eventuali post-hoc Eventuali correzioni sfericità 36

37 Esempio 2-Way mista Scrivere sms peggiora la grammatica? Fattori Gruppo (between - 2 livelli): Incoraggiati a scrivere sms Proibito scrivere sms Tempo (Within - 2 livelli): Allinizio dello studio Sei mesi dopo Variabile dipendente (misura): Punteggio in test di grammatica 50 bambini (25 per gruppo) 37

38 ANOVA Mista in BrightStats * Comando: Analyze/ANOVA Repeated Measurements Scegliere il formato dei dati (SPSS style per il formato wide) Definire i fattore Within ed il numero di livelli (add per aggiungere, poi continue) Specificare quali colonne della tabella (Variables) corrispondono ai livelli dei fattori within Specificare il/i fattore/i Between (Grouping Factors) Specificare opzioni e post-doc * Valido solo in caso di solo fattore Within, per 2 o più fattori Within usare EzAnova o altri (SPSS, R) 38

39 Esempio 2-Way mista Grande fratello e personalità borderline? Fattori Gruppo (between - 2 livelli): Concorrenti GF Controlli Tempo (Within - 2 livelli): Prima di entrare nella casa Dopo luscita dalla casa Variabile dipendente (misura): Percentuale di personalità borderline 16 partecipanti (8 x gruppo) 39

40 Esempio 2-way Within (Luci, birra, ecc…) Quali fattori mediano leffetto dellalcool sui giudizi di attrattività? Fattori: Consumo di alcool (4 livelli): 0, 2, 4, o 6 pinte di birra Tipo di luce: Soffusa Forte Variabile dipendente: Bellezza del partner scelto 40

41 41 Formato Dati x ANOVA Within Subject Numero di colonne (per variabile dipendente) = Numero di livelli fattore Within 1 x Numero di livelli fattore Within 2 2 (tipo di luce) x 4 (consumo alcol) = 8 colonne Una riga per ogni soggetto Altre eventuali colonne Es: Soggetto sperimentale, Eventuali Fattori Between ecc.

42 Esempio 2-way Within (Stroop Effect) Tipi di parole: Nomi di colori Nomi di oggetti Condizioni presentazione: Normale (b/n) Congruente Incongruente Misura Tempo di lettura (ms) 42

43 43 Esempio 2-way Mista Matteini: Preverbal possessor construction in production 1 fattore Between (gruppo): Conoscenza lingua (madre lingua, beginner, intermediate, advanced) 1 fattore Within: Struttura Frase: Agg + Nome vs Nome Proporzione di frasi corrette per i due tipi di frasi

44 44 ANOVA: Applicabilità e assunzioni Applicabilità: 1 Variabile dipendente di tipo continuo 1 o più variabili indipendenti categoriali (fattori) Ogni fattore indipendente può assumere 2 o più livelli ( t-test) Assunzioni principali: Variabile dipendente con distribuzione normale Varianze omogenee tra i gruppi Effetto dei fattori di tipo additivo Trasformazioni dei dati: Quando le precedenti condizioni non completamente soddisfatte, si possono applicare trasformazioni numeriche dei dati per cercare di ripristinare le assunzioni Es: trasformazione arcosen su proporzioni Es: trasformazione logaritmica su tempi di reazione


Scaricare ppt "1 Introduzione alla statistica per la ricerca Lezione IV Stefano Guidi Siena, 30Ottobre 2010."

Presentazioni simili


Annunci Google