Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it.

Slides:



Advertisements
Presentazioni simili
ESERCITAZIONE 2 Come leggere la tavola della normale e la tavola t di Student. Alcune domande teoriche.
Advertisements

Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
I TEST DI SIGNIFICATIVITA' IL TEST DI STUDENT
L’Analisi della Varianza ANOVA (ANalysis Of VAriance)
ITIS “G.Galilei” – Crema Lab. Calcolo e Statistica
Intervalli di confidenza
Confronto tra 2 campioni Nella pratica è utilissimo confrontare se 2 campioni provengono da popolazioni con la stessa media: Confronti tra produzioni di.
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Analisi dei dati per i disegni ad un fattore
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
INTERVALLO DI CONFIDENZA PER UNA PROPORZIONE (1)
Esercitazione su test d’ipotesi
DIFFERENZA TRA LE MEDIE
Analisi della varianza (a una via)
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 7-2: Test di significatività
Test di ipotesi X variabile casuale con funzione di densità (probabilità) f(x; q) q Q parametro incognito. Test Statistico: regola che sulla base di un.
STATISTICA a.a PARAMETRO t DI STUDENT
di cosa si occupa la statistica inferenziale?
Complementi al Corso di Ecologia - Approfondimenti di statistica
Lezione 8 Numerosità del campione
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 7 i Test statistici
Lezione 7 i Test statistici
Analisi della varianza
Il test di ipotesi Cuore della statistica inferenziale!
Verifica delle ipotesi su due campioni di osservazioni
METODI E CONTROLLI STATISTICI DI PROCESSO
Statistica Descrittiva
Esercitazioni sul calcolo dei valori critici
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
Unità 7 Test parametrici ☐ Test t di Student ☐ Analisi della varianza ad una via ☐ Confronti multipli.
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
Obbiettivo L’obiettivo non è più utilizzare il campione per costruire un valore o un intervallo di valori ragionevolmente sostituibili all’ignoto parametro.
La verifica d’ipotesi Docente Dott. Nappo Daniela
ATTIVITÀ PIANO LAUREE SCIENTIFICHE Laboratorio di Statistica
Domande riepilogative per l’esame
Lezione B.10 Regressione e inferenza: il modello lineare
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Corso di Laurea in Scienze e tecniche psicologiche
La statistica F Permette di confrontare due varianze, per stabilire se sono o no uguali. Simile al valore t di Student o al chi quadrato, l’F di Fisher.
ANALISI STATISTICA DI DATI CAMPIONARI
9) VERIFICA DI IPOTESI L’ipotesi statistica è una supposizione riguardante caratteristiche ignote ignote di una v.c. X. Es.: campionamento con ripetizione,
Test basati su due campioni Test Chi - quadro
Verifica di ipotesi statistiche
LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
“Teoria e metodi della ricerca sociale e organizzativa”
Analisi della varianza Resistenza di una fibra sintetica: essa è legata alla percentuale di cotone che potrà però variare tra il 10 e il 40% perché il.
Esercizio Regressione DATI Per un campione casuale di 82 clienti di un'insegna della GDO, sono disponibili le seguenti variabili, riferite ad un mese di.
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Esercitazioni di Statistica con Matlab Dott
Accademia europea dei pazienti sull'innovazione terapeutica Lo scopo e i fondamenti della statistica negli studi clinici.
Test dell’ ANOVA L EZIONI III PARTE F ONDAMENTI E METODI PER L ’ ANALISI EMPIRICA NELLE SCIENZE SOCIALI A. A
La covarianza.
L’ecologia è oggi sempre più una disciplina che enfatizza lo studio olistico del sistema. Anche se il concetto che l’intero possa essere più della somma.
V - 1 Prof. Giorgio Tassinari Corso di Laurea Magistrale in Economia e Professioni Statistica per l’analisi dei dati Prima parte: il campionamento nella.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Psicometria modulo 1 Scienze tecniche e psicologiche Prof. Carlo Fantoni Dipartimento di Scienze della Vita Università di Trieste Test di ipotesi.
1 Corso di Laurea in Scienze e Tecniche psicologiche Esame di Psicometria Il T-Test A cura di Matteo Forgiarini.
Transcript della presentazione:

Dalmine, 26 Maggio 2004 Esercitazioni di Statistica con Matlab Dott. Orietta Nicolis fttp:\ingegneria.unibg.it

ztest ztest2 ttest ttest2 TEST D’IPOTESI Formulazione delle ipotesi; Determinazione statistica test; Decisione (ad un livello di significatività) In matalb, ztest ztest2 ttest ttest2

Test d’ipotesi per la media [h, sig, ci, zval]=ztest(x,m,sigma,alpha,tail) Input: x =vettore delle osservazioni del campione m=ipotesi nulla sulla media sigma=dev. std. nota della popolazione alpha =livello di significatività tail = specifica l’ipotesi alternativa Output: h = se h=1 rifiuto H0, se h=0, accetto H0. zval = valore della statistica test. ci =intervallo di confidenza per la media sig = la prob. che il valore di z possa essere più grande, sotto l’ipotesi nulla (p-value).

Esempio Si genera un campione di 50 numeri casuali da una distribuzione normale con media 2 e deviazione standard 1. Naturalmente la media campionaria e quella teorica sono diverse tra loro. Si vuole verificare che tale differenza non è significativa.

Soluzione x=normrnd(2, 1, 50,1); mc=mean(x) [h, sig, ci, zval]=ztest(x, 2,1)

Test d’ipotesi per la media Se la varianza è nota Se la varianza non è nota

Probabilità dell’errore di I e II specie e potenza Potenza del test

Esempio Un campione indipendente di 30 unità rilevate su un carattere X, normalmente distribuito, ha dato il seguente risultato.       a) Verificare se la media m della popolazione può essere 140, con α fissato al livello del 5%, contro un’ipotesi alternativa che sia minore. b) Posto σ = 3,3 costruire e rappresentare graficamente la funzione di potenza per i seguenti valori di m: 140; 139; 138; 137, 136. Xi 138 143 135 144 Totale fi 15 7 5 3 30

…in matlab x=[zeros(15,1)+138; zeros(7,1)+143; zeros(5,1)+135; zeros(3,1)+144]; [h sig, ci, tval]=ttest(x,140,0.05,-1) % zona di rifiuto t1=tinv(0.05, 29) x1=140+t1*std(x)/sqrt(length(x)) % approssimando alla distribuzione normale… normspec([-Inf x1], 140, std(x)/sqrt(30))

ma=sqrt(n).*(m1-m0)./sigma; zs=norminv(alpha); pots=normcdf(zs,ma,1); %determino la nuova soglia critica con sigma noto sc=norminv(0.05, 140, 3.3/sqrt(30)) normspec([-Inf sc], 140, 3.3/sqrt(30)) % potenza del test m0=140; n=30; sigma=3.3; alpha=0.05; m1=(136:140)'; ma=sqrt(n).*(m1-m0)./sigma; zs=norminv(alpha); pots=normcdf(zs,ma,1); plot(m1, pots); TITLE('funzione di potenza');

H0: =7 contro l'ipotesi alternativa H1: >7 ; Esempio Un carattere X si distribuisce secondo una variabile casuale normale di media ignota e varianza paria 36. Da tale popolazione si estrae un campione indipendente di numerosità n = 25. Fissato α= 0.05, determinare: a) la zona di rifiuto del test per la verifica dell'ipotesi H0: =7 contro l'ipotesi alternativa H1: >7 ; b) dopo aver descritto la funzione di potenza del test impiegato nella verifica d'ipotesi, fornire il valore che questa assume per  = 7;7.5; 8; 8.5; 9; 9.5; 10; 10.5; 11; 11.5; 12; 12.5; 13 e delinearne graficamente l'andamento.

% zona di rifiuto sc=norminv(0.95, 7, sqrt(36/25)) normspec([sc +Inf], 7, sqrt(36/25)) % potenza del test m0=7; n=25; sigma=6; alpha=0.05; m1=(7:0.5:13)'; ma=sqrt(n).*(m1-m0)./sigma; zd=norminv(1-alpha); potd=1-normcdf(zd,ma,1); plot(m1, potd); TITLE('funzione di potenza '); % oppure p=1-normcdf(sc, m1, sigma/sqrt(n)) plot(m1, p, '-*')

Test d’ipotesi per la differenza di due medie

Esempio Si sono rilevati i tempi di produzione di 6 operai che assemblano componenti elettroniche secondo un determinato schema e si sono ottenuti i seguenti risultati (in minuti) 8,2 5,3 6,5 5,1 9,7 10,8. Si sono rilevati inoltre i tempi di produzione di 8 operai che assemblano componenti elettroniche dello stesso tipo ma secondo uno schema di lavoro diverso e si sono ottenuti i seguenti risultati (sempre in minuti) 9,5 8,3 7,5 10,9 9,3 8,0 11,3 8,8. Dopo aver introdotto le opportune ipotesi, verificare (=0.10) se è indifferente usare i due schemi di lavoro.

…in matlab x=[8.2 5.3 6.5 5.1 9.7 10.8]; y=[9.5 8.3 7.5 10.9 9.3 8.0 11.3 8.8]; [h sig, ci, tval]=ttest2(x,y,0.10,0)

Esercizio (esame 24/09/2003) Si sospetta che il livello medio di glucosio nel sangue della popolazione Messicana sia pari a 105. Da un campione di 20 persone si è rilevato un livello medio di glucosio pari a 110, con una devianza di 14. Supponendo che il livello di glucosio nel sangue (X) segua una distribuzione normale e posto =0.05, è possibile ritenere che il livello medio di glucosio nel sangue dell'intera popolazione sia maggiore di 105 ? Da un campione di 15 persone estratto da una popolazione del Nord America il livello medio del sangue è risultato pari a 100, con una deviazione standard di 12.5. Supponendo l'omogeneità delle varianze delle due popolazioni, si può ritenere significativa la differenza tra i due livelli medi di glucosio?

Esercizio (esame 23/06/2003) Una partita di 10000 chiodi viene venduta con un contratto che prevede che la frazione di difettosi non debba superare π=0.05. Il responsabile del controllo di qualità di una ditta aquirente decide di estrarre un campione casuale di n=500 chiodi e di accettare il lotto (e quindi di acquistarlo) solamente se nel campione si riscontrano meno di k=27 pezzi difettosi. .Determinare il sistema delle ipotesi e la regione critica del test corrispondente alla procedura decisionale sopra descritta. Calcolare il rischio del venditore, cioè la probabilità che venga rifiutata la partita quando essa effettivamente non contiene più dell' 5% di pezzi difettosi. Nel caso particolare di =0.1, calcolare il rischio del compratore, cioè la probabilità di accettare la partita. Trovare la dimensione campionaria n e la soglia critica k di un piano di un campionamento alternativo tale che il rischio del compratore (quando =0.1) e del venditore (quando =0.05) siano entrambi pari al 2%. Sapendo che nel campione (di numerosità n=500) si sono riscontrati x=28 pezzi difettosi, calcolare il p-value e commentare il risultato con riferimento al test d'ipotesi del punto a).