Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste 2014-2015 1.Implementazione.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Come organizzare i dati per un'analisi statistica al computer?
Intervalli di confidenza
Proprietà degli stimatori
Tecniche di analisi dei dati e impostazione dellattività sperimentale Relazioni tra variabili: Correlazione e Regressione.
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
2.VARIABILI CONTINUE A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Analisi dei dati per i disegni ad un fattore
Progetto Pilota 2 Lettura e interpretazione dei risultati
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Corso di Calcolo delle Probabilità e Statistica II Parte – STATISTICA
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Introduzione alla statistica per la ricerca Lezione I
Distribuzioni di probabilità
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 7-2: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a LA STATISTICA INFERENZIALE
Analisi della varianza
Verifica delle ipotesi su due campioni di osservazioni
Statistica Descrittiva
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
STATISTICA INFERENZIALE
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Calcolo delle probabilità a cura di Maurizio Brizzi
“Teoria e metodi della ricerca sociale e organizzativa”
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
“Teoria e metodi della ricerca sociale e organizzativa”
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
ANALISI E INTERPRETAZIONE DATI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Rosoluzione.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Inferenza.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Campionamento.
INTRODUZIONE ALL’ANALISI DELLA VARIANZA
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Scienze tecniche e psicologiche
Introduzione all’inferenza
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Varianza.
Transcript della presentazione:

Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Implementazione del TLC in Excel con una variabile aleatoria uniforme 2.Implementazione del TLC in Excel con una variabile aleatoria Bernoulliana 3.Implementazione del TLC in Excel con una variabile aleatoria con DP di qualunque forma; 4.Campionamento Monte Carlo In Excel 5.Applicazioni del TLC: 6.Test di ipotesi sulla media (varianza nota) 7.Test di ipotesi sulla media (varianza incognita) 8.La distribuzione t-student

Teorema del Limite Centrale per grandi campioni la distribuzione campionaria della media campionaria è approssimativamente una distribuzione normale questo permette di inferire la probabilità associata alla media di un campione di dati indipendentemente dalle proprietà e forma della popolazione Teorema_del_Limite_Centrale.xls

1. TLC con variabile aleatoria uniforme 1.La relazione è soddisfatta 2.La relazione è soddisfatta 3.La varianza campionaria decresce all’aumentare di n 4.Testiamo la normalità per i 3 all’aumentare di n e visualizziamo Teorema_del_Limite_Centrale.xls

NPP usando il comando SMALL 1.Costruiamo i normal probability plot usando la stessa tecnica usata nel documento Normal_Probability_Plot_Paganoni.xls Normal_Probability_Plot_Paganoni.xls 2.Utilizzeremo la funzione SMALL per ordinare in maniera ascendente il set dinamico di dati di X

NPP usando il comando SMALL In ogni cella di AF scriviamo: SMALL( $W$20:$W$519 ;$A20) ritorna l’A20-esimo valore più piccolo specificato nell’array $W$20:$W$519.

output dinamico Pessimo adattamento alla normale Ottimo adattamento alla normale ancora meglio

parametri del fit L’intercetta corrisponde a X La slope o pendenza all’ errore standard

2. TLC con proporzioni (variabile aleatoria Bernoulliana) Simuliamo l’esempio 4.8 a pag 94 del vostro libro di testo (Repubblicani)1 (Democratici) Generalizzando il TLC al caso delle proporzioni possiamo prevedere quale sarà la forma della distribuzione campionaria Varianza di una variabile aleatoria di Bernoulli

2. TLC con proporzioni (variabile aleatoria Bernoulliana) vediamo se è proprio così

2. TLC con proporzioni (variabile aleatoria Bernoulliana) generiamo 20 variabili aleatorie (n) ciascuno di 500 osservazioni ciascuna con legge di Bernulli di parametro p applicando IF(RAND()<=$B$1;1;0) ad ogni cella

2. TLC con proporzioni (variabile aleatoria Bernoulliana)  Il resto del foglio è uguale al precedente  nota che si genera una seriazione della variabile bernoulliana in 13 classi nel range [0, 1]  Gli zeri vengono conteggiati nel primo intervallo, gli uni nell’ultimo

2. TLC con proporzioni risultato  Simili ai risultati precedenti  Media campionaria = media della popolazione  E varianza campionaria = p(1-p)/n

output dinamico pessimo adattamento alla normale nessuna stima dei parametri adattamento parziale alla normale con cattiva stima dei parametri ottimo adattamento alla normale con ottima stima dei parametri

3. TLC con distribuzioni di qualunque forma Figura 4.4, pag. 98 vostro testo verificato ma con le altre forme?

3. TLC con distribuzioni di qualunque forma Abbiamo bisogno di:  Metodo di Campionamento Monte Carlo per generare numeri random con una distribuzione di probabilità qualsiasi (specificata da voi)  In Excell è molto semplice ed è possibile nidificando le due funzioni  VLOOKUP(RAND(); array)

V-Shaped Discrete Probability Distribution Results (p. 48)

 La probabilità che la funzione VLOOKUP(RAND; …) consegni il valore nella cella i-esima dalla colonna D è uguale all’ampiezza dell’ intervallo i-esimo e [i+1]-esimo della colonna di riferimento in C:  se Ci- Ci+1= 1 e Di= 1 allora P(VLOOKUP(RAND; …)= 1)=1;  se Ci- Ci+1= 0.5 e Di= 1 allora P(VLOOKUP(RAND; …)= 1)=0.5;  se Ci- Ci+1= 0.2 e Di= 1 allora P(VLOOKUP(RAND; …)= 1)=0.2;  Tale probabilità corrisponde alla frequenza relativa

implementazione: step 1 Iniziamo disegnando la funzione desiderata y=f(x) riscaliamo y creando una variabile y’ che abbia le stesse proprietà di y ma la cui somma dia 1 y’=f(x) avrà le stesse proprietà di una distribuzione di probabilità

implementazione: step 1 Iniziamo disegnando la funzione desiderata y=f(x) y’(x)=p(X) B3/$B$17 SUM($C$2:C2)

implementazione: step 1 Iniziamo disegnando la funzione desiderata y=f(x) y’(x)=p(X) SUM($C$2:C2)

implementazione: step 1 Iniziamo disegnando la funzione desiderata y=f(x) y’(x)=p(X) Array di input per la funzione VLOOKUP(RAND;$D$3:$E$16)

implementazione: step 1 Iniziamo disegnando la funzione desiderata y=f(x) y’(x)=p(X) statistiche per il calcolo della media e varianza da una distribuzione di frequenze

Campionamento Monte Carlo: step 2

Maggiore è il numero di valori generati più è precisio il campionamento N= 28

Campionamento Monte Carlo: step 2 N= 28 Maggiore è il numero di valori generati più è precisio il campionamento N= 10000

distribuzione della media campionaria: step 3  Si procede nello stesso modo illustrato per i fogli precedenti  Il risultato è effettivamente robusto: si generalizza anche a questa distribuzione

output

applicazione 1 del TLC (media e varianza note) Il tempo medio per andare da A a B è  = 5 s con una varianza di 25 s. Si raccolgono 100 osservazioni. Una media del campione pari a 5.4 fa parte della popolazione o no? dal TLC z0.05 z-score disegno la normale 2.disegno lo z-score 3.1-P(Z>0.8) =1-NORMSDIST(0.8) 4.Maggiore del valore critico

Il tempo medio per andare da A a B è  = 5 s con una varianza di 25 s. Si raccolgono 100 osservazioni. Una media del campione pari a 5.4 fa parte della popolazione o no? dal TLC z0.05 z-score non rifiutiamo H0 : m    5 contro l’ipotesi alternativa monodirezionale con un margine di errore  0.05 applicazione 1 del TLC (media e varianza note)

ricettario Ricettario_Z.xls

creare un foglio di lavoro con riferimenti personalizzati Foglio: RIFERIMENTI_PERSONALIZZATI  E’ possibile scrivere la formula all’interno di una cella senza usare il riferimento colonna riga ma usando riferimenti che abbiano un significato statistico  basta assegnare alle celle il nome desiderato (B1 → nobs; B2 → devst) usando Insert → Name → Define  adesso il nome della cella B1 è nobs non più B1

problema dell’applicazione 1 In generale mentre la media della popolazione è nota (o almeno ipotizzabile) la varianza non lo è. Come procedere in questi casi?

applicazione 2  ipotizzata;  ignota SoggettoD0D  due misure di performance per due livelli di dosaggio del farmaco (campioni dipendenti)  2 ipotesi sull’efficacia del trattamento:  H0: nessun effetto:  diff = 0  H1: nessun effetto:  diff > 0  la media della popolazione è nota (corrisponde alla nostra ipotesi) ma la varianza no

t di student distribuzione campionaria della media con varianza incognita se l’errore standard è stimato con la deviazione standard campionaria invece che con la deviazione standard della popolazione si ottiene la distribuzione standard T

t di student in Excel  TDIST o DISTRIB.T(ABS(x);gradi_libertà;coda)  gdl= n-1 T_student_e_normale.xls

t di student in Excel T_student_e_normale.xls  simmetrica rispetto alla media 0  leptokurtica (con code più lunghe della normale)  la varianza dipende da n  maggiore è n più si approssima alla normale Metà negativa TDIST(ABS(X);gdl;1) Metà positiva 1-TDIST(ABS(X);gdl;1)

La distribuzione t presenta un'ampiezza leggermente diversa per ciascun differente valore dei gdl e si applicano, quindi, differenti t-scores per ciascun valore dei gdl. tavole t TINV(0.05;10)= 2.3 Il valore t riporta i t-score di una probabilità di sottesa dalla coda destra o di 0.05 su entrambe le code nota che P(t 0.025, 10 gdl ) > P(z ) =1. 96