Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale mirta.vernice@unimib.it.

Slides:

Advertisements

Presentazioni simili

ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.

Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.

Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.

Le distribuzioni di probabilità continue

ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica

Distribuzione Normale o Curva di Gauss

STATISTICA DESCRITTIVA

LA DISTRIBUZIONE NORMALE

Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.

Variabili Le variabili sono proprietà di eventi reali che possono modificarsi nel tempo o in diversi luoghi e che possono essere misurate. Tipologia delle.

Descrizione dei dati Metodi di descrizione dei dati

Gli errori nell’analisi statistica

Progetto Pilota 2 Lettura e interpretazione dei risultati

Inferenza statistica per un singolo campione

Valutazione delle ipotesi

Analisi della varianza (a una via)

Le analisi per singolo item

1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.

Introduzione alla statistica per la ricerca Lezione I

Distribuzioni di probabilità

Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste

Appunti di inferenza per farmacisti

Corso di biomatematica lezione 10: test di Student e test F

Corso di biomatematica lezione 6: la funzione c2

STATISTICA a.a PARAMETRO t DI STUDENT

STATISTICA a.a LA STATISTICA INFERENZIALE

Analisi bivariata Passiamo allo studio delle relazioni tra variabili

Verifica delle ipotesi su due campioni di osservazioni

METODI E CONTROLLI STATISTICI DI PROCESSO

TRATTAMENTO, ANALISI E INTERPRETAZIONE DEI DATI

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Le distribuzioni campionarie

Teorie e Tecniche di Psicometria

PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.

Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,

Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,

Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.

La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.

Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.

La verifica d’ipotesi Docente Dott. Nappo Daniela

Domande riepilogative per l’esame

Accenni di analisi monovariata e bivariata

Corso di Analisi Statistica per le Imprese

Il residuo nella predizione

Martina Serafini Martina Prandi

“Teoria e metodi della ricerca sociale e organizzativa”

9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,

Le distribuzioni campionarie

Test basati su due campioni Test Chi - quadro

Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:

“Teoria e metodi della ricerca sociale e organizzativa”

Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva

Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.

La distribuzione campionaria della media

UNIVERSITA’ DEGLI STUDI DI PERUGIA

Accenni di analisi monovariata e bivariata

ANALISI E INTERPRETAZIONE DATI

TRATTAMENTO STATISTICO DEI DATI ANALITICI

1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.

Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)

In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.

1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribuzione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.

1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.

La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.

1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.

Transcript della presentazione:

Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale mirta.vernice@unimib.it

Distribuzione di frequenza Distribuzione degli errori nel dettato in 2^

Un salto logico… Da quanto è frequente un certo numero di errori in seconda a… Quanto è probabile che un bambino di seconda commetta 2 (o 10 o 7) errori?

La probabilità La probabilità di un evento varia da 0 (non c’è alcuna possibilità che si verifichi) a 1 (occorrerà sicuramente). Si esprime in termini decimali (es. probabilità del .05; .10 ) Ma la si può interpretare in termini di percentuale.

Per ogni distribuzione di frequenza possiamo calcolare la probabilità che si verifichi un certo evento (es. numero di errori). Ma è complicato!

Distribuzioni teoriche di probabilità Esistono alcune distribuzioni di frequenza che permettono, mediante l’uso di formule, di individuare subito qual è la probabilità di occorrenza di un particolare punteggio. Distribuzione normale, binomiale, chi quadro…

Come è possibile? Esempio distribuzione normale standard

Distribuzione Normale standard Distribuzione con media 0 e Deviazione Standard 1, ottenuta dalla trasformazione della variabile casuale X in unità di deviazione standard (variabile z).

Proprietà della Normale Media, mediana e moda hanno il medesimo valore La curva è simmetrica rispetto alla media La curva è asintotica all’asse delle X L’area al di sotto della curva normale è uguale a 1.

Area sottesa alla curva L’area sottesa alla Normale fra -1.96 DS e +1.96 DS è pari al 95% dell’area totale L’area sottesa alla Normale fra -3ds e +3ds è pari 99.8% dell’area totale

Che cosa dobbiamo fare? Dobbiamo SOLO trasformare i nostri dati in una distribuzione teorica di probabilità!

Standardizzazione (o normalizzazione) Trasformare i dati grezzi in una distribuzione di dati con media e deviazione standard note.

Che cosa otteniamo? Distribuzione con M = 0 e DS= 1; Il 95% dei valori si colloca tra z = -1.96 e z=+1.96

Tavole di z Come le leggiamo?

Facciamo un esempio Bambino di seconda elementare; Tempo di lettura lista aa della prova di lettura di parole (Batteria Sartori, Job, Tressoldi). Tavole di z Norme tempi di lettura Batteria Sartori Job Tressoldi.

Variabile dipendente: tempo di lettura lista aa 68 sec

Come procediamo? Vedi foglio con dati normativi. Attenzione: cosa sono i dati normativi? Individuiamo M e DS per aa, nella riga 2^ elementare

Stabiliamo Hp speriementale La velocità di lettura del bambino si discosta da quella della popolazione. (NP: Hp alternativa assume sempre che ci sia un effetto, una differenza). Il bambino NON è estratto da una popolazione con media = 35 e DS = 15.

Stabiliamo una Hp nulla La velocità di lettura del bambino è = a quella della popolazione. Si può anche dire… il bambino è estratto da una popolazione (a sviluppo tipico) con media = 35 e DS = 15.

Calcoliamo il Punto z Z = (68-35)/15 = 2,2 A che valore di probabilità è associato? Prendere le tavole. 0,98 (valore estremo) = 1- 0,98 = 0,2

98% 2% Z = 2,2

Diremo che: C’è 2% di probabilità che questo bambino sia estratto da una popolazione a sviluppo tipico con M = 35 e DS = 15.

P <.05? Hp sperimentale è valida. La velocità di lettura del bambino si discosta da quella della popolazione.

Standardizzazione: a quali dati si applica? Variabili casuali continue QI, velocità di lettura, ecc.

E quando ho una variabile categorica? Es. lancio di una moneta Immaginiamo di lanciare una moneta 10 volte. Qual è ogni volta probabilità di ottenere Testa o Croce? .5 Se ottengo 8 volte testa mi insospettisco….

Binomiale La distribuzione binomiale indica la probabilità che si verifichino diversi eventi casuali fra loro indipendenti, ognuno dei quali può assumere solo uno fra due (o più) valori diversi: giusto o sbagliato (es. testa o croce).

Nella pratica quotidiana? Test di comprensione sintattica delle relative: 10 item 2 possibili risposte (p = 0,5 di indovinare la giusta)

Definiamo le Hp Hp0= il partecipante sta rispondendo a caso (below chance); Hp1 = il partecipante non sta rispondendo a caso (above chance).

Es. bambino risponde correttamente a 8 su 10 item; r (successi) = 8

Distribuzione BINOMIALE r Probabilità 0 0,00098 1 0,00977 2 0,04395 3 0,11719 4 0,20508 5 0,24609 6 0,20508 7 0,11719 8 0,04395 9 0,00977 10 0,00098 N = 10 P = 0,5 r = 8 Per ogni evento r (successo) la binomiale indica quanto è probabile, assumendo che sia dovuto a fluttuazioni casuali.

Come procediamo? Sommiamo i valori estremi di probabilità (includendo anche la probabilità associata all’evento r = 8): P (0,1,9,10,8) = 0,00098 + 0,00977 + 0,00977 + 0,00098 + 0,04395 = 0,0644 p ≥ 0,05

r = 8 non rientra tra i valori estremi di successi (0,1,9,10) tali per cui p ≤ 0,05 Non posso rigettare Hp0. Il bambino è below chance.

Vedi foglio di calcolo excel

Distribuzione campionaria della media e uso nel test delle Hp

Usare la distribuzione campionaria per testare ipotesi? La media campionaria é distribuita in modo Normale; Se prendiamo x campioni, e costruiamo la distribuzione di frequenza delle medie campionarie, questa avrà una distribuzione normale.

Distribuzione campionaria  = 10 M = 8 M = 10 M = 9 M = 11 M = 12 Popolazione = 10

Distribuzione campionaria Frequenza con cui si distribuiscono le medie dei campioni estratti da una stessa popolazione.

Come si distribuiscono? Frequenza Medie dei campioni

Come procediamo? Applichiamo la distribuzione teorica di probabilità normale per testare se: Assumendo che nella popolazione Hp nulla sia valida;

Quindi cos’è il p? Probabilità che il nostro campione sia estratto da una popolazione in cui Hp nulla è valida. Possiamo anche dire: p = Probabilità che la differenza tra condizioni che abbiamo ottenuto sia dovuto a fattori CASUALI.

La distribuzione del Chi quadro

Quando si applica? (a) i dati non sono normalmente distribuiti; (b) le varianze possono essere non omogenee; (c) i dati sono misurati su una scala ordinale.

Il Chi-Quadrato (2) Si usa con dati nominali, quando tutto quello che si ha a disposizione è la frequenza con cui è occorso un certo evento.

Come funziona? Confronta una distribuzione di frequenza osservata con una distribuzione di frequenza attesa. La distribuzione attesa è quella che noi avremmo se H0 valida.

La formula del 2 Necessario calcolare le frequenze attese (E – expected).

Come inseriamo i nostri dati? Compito 1 Compito 2 RISOLTO ERRORE

La tabella rappresenta le frequenze osservate (O - observed)

E la media e la DS? Non possiamo calcolarle. Abbiamo una frequenza. Che potremo riportare come % x% dei partecipanti ha svolto correttamente il compito 1, mentre solo il x% ha svolto correttamente il compito 2.

Come lo calcoleremo? In R