Teorema del limite centrale …dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma delle.

Slides:

Advertisements

Presentazioni simili

ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.

Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.

I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.

ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica

METODI STATISTICI PER LO STUDIO DELL’ASSOCIAZIONE TRA DATI QUALITATIVI

Intervalli di confidenza

Proprietà degli stimatori

Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.

Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.

Analisi dei dati per i disegni ad un fattore

Gli errori nell’analisi statistica

Metodi Quantitativi per Economia, Finanza e Management Lezione n°6

Metodi Quantitativi per Economia, Finanza e Management Lezione n°7.

Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Test statistici: il test Chi-Quadro, il test F e il test t.

Inferenza statistica per un singolo campione

Valutazione delle ipotesi

INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA: test sui parametri e scelta del modello (parte 3) Per effettuare test di qualsiasi natura è necessaria.

INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)

Analisi della varianza (a una via)

1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.

Introduzione alla statistica per la ricerca Lezione I

Appunti di inferenza per farmacisti

Corso di biomatematica lezione 9: test di Student

Corso di biomatematica lezione 10: test di Student e test F

Corso di biomatematica lezione 7-2: Test di significatività

Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.

STATISTICA a.a PARAMETRO t DI STUDENT

STATISTICA a.a LA STATISTICA INFERENZIALE

di cosa si occupa la statistica inferenziale?

Analisi bivariata Passiamo allo studio delle relazioni tra variabili

Complementi al Corso di Ecologia - Approfondimenti di statistica

Lezione 8 Numerosità del campione

Lezione 8 Numerosità del campione

Num / 36 Lezione 9 Numerosità del campione.

Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.

Analisi della varianza

Il test di ipotesi Cuore della statistica inferenziale!

Verifica delle ipotesi su due campioni di osservazioni

Le distribuzioni campionarie

Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,

Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.

Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.

La verifica d’ipotesi Docente Dott. Nappo Daniela

ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica

Domande riepilogative per l’esame

Lezione B.10 Regressione e inferenza: il modello lineare

Corso di Laurea in Scienze e tecniche psicologiche

“Teoria e metodi della ricerca sociale e organizzativa”

La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.

9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,

Test basati su due campioni Test Chi - quadro

“Teoria e metodi della ricerca sociale e organizzativa”

Intervalli di confidenza

La distribuzione campionaria della media

UNIVERSITA’ DEGLI STUDI DI PERUGIA

Accenni di analisi monovariata e bivariata

Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale

Disegni ad un fattore tra i soggetti. Disegni ad un solo fattore between Quando i livelli del trattamento possono influenzarsi reciprocamente è necessario.

TRATTAMENTO STATISTICO DEI DATI ANALITICI

ANALISI DELLA VARIANZA (ANOVA)

Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.

Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.

1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribuzione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.

INTRODUZIONE ALL’ANALISI DELLA VARIANZA

INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.

1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.

Transcript della presentazione:

Teorema del limite centrale …dimostra che la distribuzione campionaria delle medie si approssima alla distribuzione normale qualunque sia la forma delle distribuzione delle popolazione (quando si considera un campione di ampiezza > 30). E di importanza fondamentale in quanto non si lavora mai con una distribuzione della popolazione, ma soltanto dei campioni rappresentativi. Questo teorema è alla base di tutta la statistica inferenziale. Sapendo che la distribuzione campionaria delle medie assume forma normale, è allora possibile sfruttare le sue proprietà per la stima dei parametri (o per la verifica delle ipotesi)

Verifica delle ipotesi Ipotesi sperimentale Verifica delle ipotesi = analizzare le differenze tra i risultati osservati (cioè i valori reali) e quelli attesi (basati sulla distribuzione della popolazione). Difficilmente si ottiene una perfetta sovrapposizione in quanto i dati della popolazione sono teorici. Per questo motivo si ragiona in termini di distanza (tra i due valori)

Lipotesi nulla e lipotesi alternativa H 0 = lipotesi nulla è lipotesi sottoposta a verifica H 1 = lipotesi alternativa è vista come lipotesi antagonista allipotesi nulla e rappresenta la conclusione raggiunta quando lipotesi nulla è rifiutata. Obiettivo: rifiutare lipotesi nulla

Lipotesi nulla e lipotesi alternativa Es. verificare se il trattamento (farmaco XyZ) migliora la capacità di concentrazione. Si deve partire con lipotesi contraria, cioè che non ci sia differenza (o meglio che la differenza, se rilevata, sia attribuibile al caso). Questa è H 0, lipotesi nulla. Lipotesi alternativa include tutto ciò che non è definito nellipotesi nulla; in altre parole assume che il farmaco produca un effetto sulla capacità di concentrazione, migliorandola o peggiorandola. Questa è H 1, lipotesi alternativa

Lipotesi nulla e lipotesi alternativa Se la statistica mostra che il risultato osservato sul campione casuale (cioè estratto dalla popolazione in modo random) differisce da quello atteso dallipotesi formulata, allora dovremmo rifiutare lipotesi nulla e accettare quella alternativa. In altre parole, potremmo affermare che il farmaco ha un reale effetto sulla capacità di concentrazione.

Verifica delle ipotesi In base allipotesi che si vuol dimostrare si possono avere ipotesi unidirezionali H 1 : p > ma anche H 1 : p < ipotesi bidirezionali H 1 : p Un esempio di ipotesi unidirezionale ( o a una coda) si ha quando si ipotizza un cambiamento della variabile dipendente in una direzione SOLA; o aumenta (es. la prestazione) o diminuisce. Un esempio di ipotesi bidirezionale (o a due code) si ha quando si ipotizza un cambiamento QUALSIASI della variabile dipendente.

Regione critica H0H = Regione di accettazione = Regione di rifiuto

Regione critica per H 1 bidirezionale H0H = Regione di accettazione = Regione di rifiuto /2

Regione critica per H 1 bidirezionale è anche indicata come Livello di significatività (solitamente viene scelto un valore di alfa pari a.05, cioè si è disposti a rifiutare lipotesi nulla con una probabilità di errore del 5 %). Il livello di significatività può essere rappresentato come la regola decisionale che ci permette di accettare o rifiutare lipotesi nulla.

Verifica delle ipotesi; errori Ad ogni ipotesi statistica è associata una probabilità di errore. La decisione di accettare o rifiutare lipotesi nulla non è mai completamente certa dal momento che si basa su una probabilità. Errore di I tipo: si incontra quando si decide che vi sono delle differenze tra i due campioni, mentre in realtà non ve ne sono. Le differenze trovate sono dovute esclusivamente al caso Errori di II tipo: si incontra quando si decide di accettare lipotesi nulla quando in realtà è falsa. In altre parole si decide che non ci sono differenze tra i due gruppi quando in realtà il trattamento ha avuto un effetto sulla concentrazione.

Verifica delle ipotesi; errori Tipi di errore Decisione Rifiutare H 0 Mantenere H 0 H 0 verap(err. I tipo) = 1 - H 0 falsa 1 - (potenza)p (err. II tipo) = [decisione corretta]

Potenza di un test 1 - = potenzap (err. II tipo) = …la potenza di un test indica lefficienza nel poter evitare di prendere decisioni errate. Diventa molto importante durante la preparazione di un esperimento in quanto viene utilizzato il calcolo dei soggetti necessari per un esperimento (partendo dalla grandezza delleffetto)

Ancora sulla verifica delle ipotesi… Es. verificare se il peso delle scatole prodotte nella fabbrica XZY rientra negli standard definiti (368gr ipotizzati; = 15gr) n = 25 scatole 1) Ipotesi? H 0 : = 368 H 1 : 368 bidirezionale

… 2) Scegliere un livello di significatività ( ): solitamente un livello che assicuri una margine di errore è =.05 3) (scegliere lampiezza campionaria in base alla potenza del test) 4) Individuare il test più appropriatotest z

… 5) Calcolare i valori critici che separano la regione di rifiuto da quella di accettazione

… 6) Calcolare le medie campionarie X = ) Standardizzare la media calcolata Z = [(x - )]/[ /rq(n)] = = [( )]/[15/rq(25)] = 4.5/3 = 1.5

… 8) Stabilire se la media cade nella regione di rifiuto o di accettazioneconfrontiamo i valori di z X = = 368 z = 1.5z critico =

Conclusioni 9) Siccome la statistica (punti z) cade nella regione di accettazione, lipotesi nulla NON può essere rifiutata In conclusione possiamo concludere che i campioni estratti non hanno evidenziato nessuna differenza significativa con la media standard di 368

Un po di metodologia… il disegno sperimentale variabile dipendente e indipendente condizione di controllo vs sperimentale disegno entro i soggetti e tra i soggetti

Il disegno sperimentale Condizioni sperimentali e condizioni di controllo Si possono usare più gruppi di controllo? Più gruppi sperimentali? Es. effetto di un farmaco sul livello di concentrazione La condizione di controllo serve come verifica e confronto con il gruppo sperimentale per vedere se il trattamento ha avuto un effetto

Variabile dipendente e indipendente Cosè una variabile? Tutto ciò che potenzialmente potrebbe cambiare al variare di una qualsiasi condizione (es. temperatura, attivazione, fame, ecc.) Dipendente o indipendente…da chi? Dal trattamento Livelli della variabile indipendente: es. disegno 2 x 2 x 4 x 2

Between vs. Within …Ovvero variabile tra i soggetti ed entro i soggetti Per definizione si ha un disegno tra i soggetti quando ogni soggetto riceve un solo livello della variabile indipendente. Ad esempio…

Disegno Between subjects Es. Gruppo 1: test di richiamo libero Gruppo 2: test di richiamo con suggerimento Disegni BS con una variabile indipendente a più livelli 2 livelli: richiamo libero vs. richiamo con suggerimento Variabile dipendente: punteggi nel test

Disegno Between subjects Es. Testare leffetto dellorientamento e della lunghezza sulla velocità di riconoscimento. Quindi: 2 (orientamenti) X 2 (lunghezze) Per avere un disegno between subjects dovremmo quindi avere 4 gruppi di persone. In questo modo ogni gruppo affronta un livello della variabile diverso Viene utilizzato soprattutto quando lesperimento diventa troppo lungo

Disegno misto (o mixed design) Es. 2 (orientamenti) X 5 (lunghezze). In questo caso dovremmo avere 10 gruppi di persone. Ma i problemi legati al reclutamento dei soggetti è un altro fattore da tenere sempre in considerazione. Quindi potrei testare leffetto delle variabili indipendenti un po between e un po within. Ad esempio potremmo avere lorientamento come variabile between e la lunghezza come variabile within. In questo caso si parla di disegno MISTO.

Disegno Within subjects Per definizione si ha un disegno entro i soggetti quando ogni soggetto viene testato per TUTTI i livelli della variabile indipendente. Disegno 2 (orientamenti) X 2 (lunghezza) Un solo gruppo di persone che quindi affrontano tutto lesperimento nella sua interezza Poiché tutti i soggetti affrontano tutte le condizioni sperimentali, gli stessi soggetti servono come controllo a loro stessi (coerenza interna) I disegni within subjects vengono anche chiamati Repeated Measures o disegni per misure ripetute

Vantaggi e svantaggi del disegno Within subjects Mantiene la variabilità dei soggetti costante (mentre nel disegno between non è possibile visto che vengono utilizzati soggetti diversi) Aumenta la potenza riducendo la variabilità dovuto al caso. Riduce il numero di soggetti necessari per lindagine sperimentale. Gli svantaggi sono : Effetto dellordine (bilanciamento) Fatica

Scelta del Disegno Esigenze sperimentali: qual è lipotesi che devo verificare? Lunghezza esperimento: quanti soggetti devo testare? Quanto risulta lungo lesperimento? Molto spesso questo parametro diventa più importante del precedente (anche se è una scelta sperimentale errata)

Come si sceglie il test più appropriato? Esperienza Comprendere la logica dietro ad un test Utilizzo delle tabelle decisionali Conoscenza elementi di statistica base

Domande da porsi Qual è lipotesi di ricerca? I dati sono a livello di scala continua o discreta, ordinale o ad intervalli? Quante variabili abbiamo inserito nellesperimento? Quanti gruppi di persone abbiamo testato? I gruppi sono indipendenti? I dati raccolti hanno forma normale?

Parametrico o non-parametrico? In generale si sceglie un test parametrico quando si è sicuri che i dati siano distribuiti normalmente. Se non lo sono allora si sceglie un test non - parametrico In generale vengono utilizzati test non parametrici quando i dati grezzi sono punteggi. Ad esempio per classifiche (musicali), punteggi, scale (percezione del dolore), numero di stelline (cinema o ristoranti).

Parametrico o non-parametrico? Ma come decidere se i dati sono distribuiti normalmente? Se vengono raccolti dati per un campione sufficientemente grande (più di 100) si possono rappresentare graficamente i dati in un grafico e valutare visivamente se sono distribuiti normalmente (forma a campana). In alternativa esistono dei test per valutare la normalità delle distribuzioni (più accurata) Se non si hanno campioni con numerosità elevata una soluzione alternativa consiste nel consultare dati di ricerche precedenti

Test parametrici I test parametrici sono i più usati in assoluto in psicologia cognitiva, della percezione, in studi con tempi di reazione, etc. Vantaggi riuscire a cogliere in maniera più efficiente le differenze tra le condizioni sperimentali di quanto non sia possibile fare con i non- parametrici (maggiore potenza statistica).

Test parametrici Condizioni da rispettare: Misurazioni su scala ad intervalli (o superiore) Alto numero di misurazioni Normalità delle distribuzioni di riferimento Omogeneità delle varianze

Test non-parametrici I test non parametrici sono più usati in psicologia sociale, della memoria, etc. Hanno il vantaggio di essere più semplici da un punto di vista procedurale, di analisi, e di interpretazione, e di non dover rispettare le condizioni imposte dai test parametrici.

Test non-parametrici Condizioni: Misurazioni su scala sia nominale che ordinale Lavora anche con campioni di numerosità ridotta Hanno lo svantaggio di avere una minore potenza statistica

La tavola decisionale Terminologia: variabile (indipendente) condizioni = livelli della variabile soggetti diversi = between soggetti uguali = within Le tavole mostrano i test per i casi in cui una sola variabile dipendente venga testata.

Test NON parametrici

Test non-parametrici: il 2 La statistica 2 (chi quadro) lavora con le frequenze di un evento e quindi analizza la loro distribuzione. Es. lancio moneta 100 volte Teoricamente mi aspetto 50 testa/50 croce Difficilmente le frequenze osservate coincidono con quelle attese Il 2 permette di misurare la discrepanza tra frequenze osservate e frequenze teoriche

2 Molto spesso il test lavora con distribuzioni dicotomiche (come nellesempio delle monete) ma si possono avere dei casi con categorie multiple. Nel caso di 2 categorie viene anche chiamato test binomiale. Es. categorie multiple. Studio sulle preferenze per i giochi. movimentostatici Indiv.Collett.Indiv.Collett osservate teoriche

2 Importante: le categorie devono essere mutualmente esclusive e ben definite. Ad esempio, nel test con le monete non ha senso inserire una terza categoria testa/croce e se un evento cade nella categoria testa non può appartenere anche alla categoria croce. Importante: il test del 2 tratta con categorie o frequenze, e MAI con punteggi. Importante: il numero di soggetti in ogni categoria è legato alle caratteristiche della categoria stessa, quindi non è possibile cambiarlo. Occorre avere un alto numero di soggetti in modo da oviare a questo inconveniente.

2 La formula per calcolare il 2 è la seguente: 2 = [(f o – f a ) 2 /f a ] f o = frequenze osservate f a = frequenze attese Occorre confrontare il valore ottenuto con il valore critico ricavato dalla tavola. Per trovare tale valore occorre tenere conto dei gradi di libertà (gdl o gl)

I gradi di libertà Per definizione i gradi di libertà di una statistica corrispondono alle componenti richieste dal suo calcolo, che possono variare liberamente. In pratica corrispondono al numero di osservazioni di un campione, meno il numero relativo a dei vincoli algebrici lineari, costituiti in genere dalle statistiche relative al campione che devono essere calcolate prima della statistica in questione. La formula generica è n – 1 Es. con 5 osservazioni gdl = 4 Perché se fissiamo per esempio che la media di queste 5 osservazioni è 3, i primi 4 valori sono liberi di cambiare, mentre lultimo è vincolato dal fatto di aver fissato la media a 3.

I gradi di libertà Una distribuzione con infiniti gradi di libertà coincide con la distribuzione normale. Una distribuzione con un ridotto numero di gradi di libertà è caratterizzata da un numero più elevato di osservazioni nelle code, cioè ha una maggiore dispersione… …di conseguenza, minori sono i gdl, e maggiore è la probabilità che un valore cada nella regione di rifiuto, e quindi maggiore probabilità di commettere un errore di tipo I.

I gradi di libertà per il 2 I gl nella statistica del 2 vengono identificati con la lettera v v = k – 1 K è il numero dei livelli della variabile

Calcolo del 2 per una variabile a più livelli Il 2 permette di misurare la discrepanza tra frequenze osservate e frequenze teoriche. Le frequenze osservate (0 k ) sono quelle ottenute dallosservazione del campione. Quelle attese (e k ) vanno calcolate seguendo la logica della distribuzione delle probabilità EventoE 1 E 2 E 3 …E k Freq. Osservateo 1 o 2 o 3 …o k Freq. Attesee 1 e 2 e 3 …e k

Calcolo del 2 per una variabile a più livelli Una variabile = modalità di studio 3 livelli = regolare, irregolare e misto Eventoreg.irreg.mistotot Freq. Osservate Freq. Attese Calcolo del 2 con la formula 2 = [(f o – f a ) 2 /f a ] 2 = (6 – 11) 2 /11 + (14 – 11) 2 /11 + (13 – 11) 2 /11 = = 1.628

Calcolo del 2 per una variabile a più livelli 2 = Gradi di libertà: v = k – 1 [Quando si hanno due o più variabili il calcolo dei gradi di libertà cambia] v = 3 – 1 = 2 gl Stabilire un livello di significatività: =.05 Si guarda sulle tabelle il valore critico in base ad e a gl Si procede con la verifica delle ipotesi: 2 > 2 criticoNO!