Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale mirta.vernice@unimib.it.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Distribuzione Normale o Curva di Gauss
STATISTICA DESCRITTIVA
LA DISTRIBUZIONE NORMALE
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Variabili Le variabili sono proprietà di eventi reali che possono modificarsi nel tempo o in diversi luoghi e che possono essere misurate. Tipologia delle.
Descrizione dei dati Metodi di descrizione dei dati
Gli errori nell’analisi statistica
Progetto Pilota 2 Lettura e interpretazione dei risultati
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
Analisi della varianza (a una via)
Le analisi per singolo item
1 Introduzione alla statistica per la ricerca Lezione III Dr. Stefano Guidi Siena, 18 Ottobre 2012.
Introduzione alla statistica per la ricerca Lezione I
Distribuzioni di probabilità
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 6: la funzione c2
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
TRATTAMENTO, ANALISI E INTERPRETAZIONE DEI DATI
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
Teorie e Tecniche di Psicometria
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Domande riepilogative per l’esame
Accenni di analisi monovariata e bivariata
Corso di Analisi Statistica per le Imprese
Il residuo nella predizione
Martina Serafini Martina Prandi
“Teoria e metodi della ricerca sociale e organizzativa”
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Le distribuzioni campionarie
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Metodologia della ricerca e analisi dei dati in (psico)linguistica 23 Giugno 2015 Statistica descrittiva
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Accenni di analisi monovariata e bivariata
ANALISI E INTERPRETAZIONE DATI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.
Transcript della presentazione:

Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale mirta.vernice@unimib.it

Distribuzione di frequenza Distribuzione degli errori nel dettato in 2^

Un salto logico… Da quanto è frequente un certo numero di errori in seconda a… Quanto è probabile che un bambino di seconda commetta 2 (o 10 o 7) errori?

La probabilità La probabilità di un evento varia da 0 (non c’è alcuna possibilità che si verifichi) a 1 (occorrerà sicuramente). Si esprime in termini decimali (es. probabilità del .05; .10 ) Ma la si può interpretare in termini di percentuale.

Per ogni distribuzione di frequenza possiamo calcolare la probabilità che si verifichi un certo evento (es. numero di errori). Ma è complicato!

Distribuzioni teoriche di probabilità Esistono alcune distribuzioni di frequenza che permettono, mediante l’uso di formule, di individuare subito qual è la probabilità di occorrenza di un particolare punteggio. Distribuzione normale, binomiale, chi quadro…

Come è possibile? Esempio distribuzione normale standard

Distribuzione Normale standard Distribuzione con media 0 e Deviazione Standard 1, ottenuta dalla trasformazione della variabile casuale X in unità di deviazione standard (variabile z).

Proprietà della Normale Media, mediana e moda hanno il medesimo valore La curva è simmetrica rispetto alla media La curva è asintotica all’asse delle X L’area al di sotto della curva normale è uguale a 1.

Area sottesa alla curva L’area sottesa alla Normale fra -1.96 DS e +1.96 DS è pari al 95% dell’area totale L’area sottesa alla Normale fra -3ds e +3ds è pari 99.8% dell’area totale

Che cosa dobbiamo fare? Dobbiamo SOLO trasformare i nostri dati in una distribuzione teorica di probabilità!

Standardizzazione (o normalizzazione) Trasformare i dati grezzi in una distribuzione di dati con media e deviazione standard note.

Che cosa otteniamo? Distribuzione con M = 0 e DS= 1; Il 95% dei valori si colloca tra z = -1.96 e z=+1.96

Tavole di z Come le leggiamo?

Facciamo un esempio Bambino di seconda elementare; Tempo di lettura lista aa della prova di lettura di parole (Batteria Sartori, Job, Tressoldi). Tavole di z Norme tempi di lettura Batteria Sartori Job Tressoldi.

Variabile dipendente: tempo di lettura lista aa 68 sec

Come procediamo? Vedi foglio con dati normativi. Attenzione: cosa sono i dati normativi? Individuiamo M e DS per aa, nella riga 2^ elementare

Stabiliamo Hp speriementale La velocità di lettura del bambino si discosta da quella della popolazione. (NP: Hp alternativa assume sempre che ci sia un effetto, una differenza). Il bambino NON è estratto da una popolazione con media = 35 e DS = 15.

Stabiliamo una Hp nulla La velocità di lettura del bambino è = a quella della popolazione. Si può anche dire… il bambino è estratto da una popolazione (a sviluppo tipico) con media = 35 e DS = 15.

Calcoliamo il Punto z Z = (68-35)/15 = 2,2 A che valore di probabilità è associato? Prendere le tavole. 0,98 (valore estremo) = 1- 0,98 = 0,2

98% 2% Z = 2,2

Diremo che: C’è 2% di probabilità che questo bambino sia estratto da una popolazione a sviluppo tipico con M = 35 e DS = 15.

P <.05? Hp sperimentale è valida. La velocità di lettura del bambino si discosta da quella della popolazione.

Standardizzazione: a quali dati si applica? Variabili casuali continue QI, velocità di lettura, ecc.

E quando ho una variabile categorica? Es. lancio di una moneta Immaginiamo di lanciare una moneta 10 volte. Qual è ogni volta probabilità di ottenere Testa o Croce? .5 Se ottengo 8 volte testa mi insospettisco….

Binomiale La distribuzione binomiale indica la probabilità che si verifichino diversi eventi casuali fra loro indipendenti, ognuno dei quali può assumere solo uno fra due (o più) valori diversi: giusto o sbagliato (es. testa o croce).

Nella pratica quotidiana? Test di comprensione sintattica delle relative: 10 item 2 possibili risposte (p = 0,5 di indovinare la giusta)

Definiamo le Hp Hp0= il partecipante sta rispondendo a caso (below chance); Hp1 = il partecipante non sta rispondendo a caso (above chance).

Es. bambino risponde correttamente a 8 su 10 item; r (successi) = 8

Distribuzione BINOMIALE r Probabilità 0 0,00098 1 0,00977 2 0,04395 3 0,11719 4 0,20508 5 0,24609 6 0,20508 7 0,11719 8 0,04395 9 0,00977 10 0,00098 N = 10 P = 0,5 r = 8 Per ogni evento r (successo) la binomiale indica quanto è probabile, assumendo che sia dovuto a fluttuazioni casuali.

Come procediamo? Sommiamo i valori estremi di probabilità (includendo anche la probabilità associata all’evento r = 8): P (0,1,9,10,8) = 0,00098 + 0,00977 + 0,00977 + 0,00098 + 0,04395 = 0,0644 p ≥ 0,05

r = 8 non rientra tra i valori estremi di successi (0,1,9,10) tali per cui p ≤ 0,05 Non posso rigettare Hp0. Il bambino è below chance.

Vedi foglio di calcolo excel

Distribuzione campionaria della media e uso nel test delle Hp

Usare la distribuzione campionaria per testare ipotesi? La media campionaria é distribuita in modo Normale; Se prendiamo x campioni, e costruiamo la distribuzione di frequenza delle medie campionarie, questa avrà una distribuzione normale.

Distribuzione campionaria  = 10 M = 8 M = 10 M = 9 M = 11 M = 12 Popolazione = 10

Distribuzione campionaria Frequenza con cui si distribuiscono le medie dei campioni estratti da una stessa popolazione.

Come si distribuiscono? Frequenza Medie dei campioni

Come procediamo? Applichiamo la distribuzione teorica di probabilità normale per testare se: Assumendo che nella popolazione Hp nulla sia valida;

Quindi cos’è il p? Probabilità che il nostro campione sia estratto da una popolazione in cui Hp nulla è valida. Possiamo anche dire: p = Probabilità che la differenza tra condizioni che abbiamo ottenuto sia dovuto a fattori CASUALI.

La distribuzione del Chi quadro

Quando si applica? (a) i dati non sono normalmente distribuiti; (b) le varianze possono essere non omogenee; (c) i dati sono misurati su una scala ordinale.

Il Chi-Quadrato (2) Si usa con dati nominali, quando tutto quello che si ha a disposizione è la frequenza con cui è occorso un certo evento.

Come funziona? Confronta una distribuzione di frequenza osservata con una distribuzione di frequenza attesa. La distribuzione attesa è quella che noi avremmo se H0 valida.

La formula del 2 Necessario calcolare le frequenze attese (E – expected).

Come inseriamo i nostri dati? Compito 1 Compito 2 RISOLTO ERRORE

La tabella rappresenta le frequenze osservate (O - observed)

E la media e la DS? Non possiamo calcolarle. Abbiamo una frequenza. Che potremo riportare come % x% dei partecipanti ha svolto correttamente il compito 1, mentre solo il x% ha svolto correttamente il compito 2.

Come lo calcoleremo? In R