STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità discrete
Le distribuzioni di probabilità continue
Variabili aleatorie discrete e continue
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
Proprietà degli stimatori
Scale di misura delle variabili
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
LA DISTRIBUZIONE NORMALE
Bruno Mario Cesana Stefano Calza
Inferenza Statistica Le componenti teoriche dell’Inferenza Statistica sono: la teoria dei campioni la teoria della probabilità la teoria della stima dei.
Lez. 3 - Gli Indici di VARIABILITA’
Analisi dei dati per i disegni ad un fattore
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
Inferenza statistica per un singolo campione
Le Variabili Casuali Corso di Teoria dell’Inferenza Statistica 1
DALL'INTERVALLO DI PROBABILITÀ
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Distribuzioni di probabilità
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica lezione 4: La funzione di Gauss
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a DISTRIBUZIONE BINOMIALE (cenni)
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Lezione 6 Inferenza statistica
METODI E CONTROLLI STATISTICI DI PROCESSO
REGOLE DEL CALCOLO DELLE PROBABILITA’
Le distribuzioni campionarie
Unità 6 Test parametrici e non parametrici Test per la verifica della normalità Funzione di ripartizione.
TRATTAMENTO DEI DATI ANALITICI
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Gli indici di dispersione
La verifica d’ipotesi Docente Dott. Nappo Daniela
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Modelli di variabili casuali
Intervalli di confidenza
Distribuzioni di probabilità di uso frequente
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
Elaborazione statistica di dati
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
TRATTAMENTO STATISTICO DEI DATI ANALITICI
1 Statistica Scienza dell’incertezza PROBABILITÀ ALLA BASE DELL’INFERENZA Ipotesi VERA o FALSA? Campionamento Analisi statistica Scelta di una delle due.
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Transcript della presentazione:

STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico 2011-12 Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 5 21 Ottobre 2011

Esempio(Distribuzione campionaria) Si considerano 2 popolazione costituite dalle v.c :

Distribuzione campionaria Possibili campioni per n=2 Prob. Estrazione A Prob. Estrazione B Medie Varianze (1,1) (1,2) (1,3) (1,4) (1,5) (2,1) (2,2) (2,3) (2,4) (2,5) … (5,5) 0.20*0.20=0.04 0.04 …. 0.4*0.4=0.16 0.4*0.2=0.08 0.08 0.02 0.01 (1+1)/2=1 (1+2)/2=1.5 2 2.5 3 1.5 3.5 ….. 5 [(1-1)2+(1-1)2]/2=0 0.25 1 2.25 4

Distribuzione campionaria

Medie e varianze delle distribuzioni campionarie Le varianze campionarie non coincidono con quelle di popolazione , ma sono ad esse funzionalmente legate:valgono esattamente la metà !

Media e varianza campionaria La media campionaria è uno stimatore non distorto della media di una popolazione. Si noti che tale risultato vale se le osservazioni sono tra loro indipendenti,come nel caso del campione casuale semplice.

Varianza campionaria corretta s2 La varianza campionaria corretta è quindi uno stimatore corretto della varianza di popolazione

Campionamento da una popolazione binomiale o di Bernoulli Estrazione casuale semplice da popolazione infinita con eventi indipendenti(il verificarsi dell’evento non modifica quindi la probabilità degli eventi successivi ,ovvero campionamento con reimissione dell’elemento campionato). Esempio: Se in un’urna sono contenute 50 palline nere e 50 bianche P(nero)=0.5 P(bianco)=0.5 Se alla prima estrazione si verifica l’evento bianco (e la pallina non viene reinserita ),la probabilità di ottenere nero alla seconda estrazione è 50/99 ,quella del bianco 49/99. Se ,al contrario, dopo essere stata estratta ,la pallina viene reinserita allora alle successive estrazioni la probabilità di ottenere bianco o nero sarà sempre pari a 50/100. Sia π la proporzione di elementi con la caratteristica ‘Nero’ e (1- π) quella di elementi con caratteristica ‘Bianco’ .

Campionamento da una popolazione binomiale o di Bernoulli(2) Se da una popolazione dicotomica si estraggono campioni di dimensione n ,l’evento favorevole(Bianco per esempio) potrà presentarsi 0,1,2,3,4,….n volte. Il numero delle volte con cui l’evento si verifica (il numero di successi) è una variabile casuale discreta (a ciascun valore della variabile è associata una probabilità). Esempio :2 estrazioni (con reimissione )dall’urna dell’esempio precedente B=successo Possibili campioni n=2 X P(x) (B,B) (B,N) (N,B) (N,N) 2 1 π2 π(1- π) (1- π) π (1- π) 2

Campionamento da una popolazione binomiale o di Bernoulli(3) Esempio :3 estrazioni (con reimissione )dall’urna dell’esempio precedente B=successo Possibili campioni n=3 X P(x) (B,B,B) (B,B,N) (B,N,B) (N,B,B) (N,N,B) (N,B,N) (B,N,N) (N,N,N) 3 2 1 π3 π2(1- π) π2(1-π) π(1-π)2 (1-π)3 Le probabilità associate ai diversi tipi di estrazione sono espresse dai termini dello sviluppo del polinomio [π+(1- π)]n dove π e (1- π) sono le probabilità degli eventi semplici ‘Bianco’ e ‘Nero’ ed n e l’ampiezza del campione .

Campionamento da una popolazione binomiale o di Bernoulli(4) In generale per un campione di dimensione n la probabilità che x volte si verifichi il successo è data dalla funzione: Il coefficiente binomiale ci informa su quante sono le sequenze tra loro esclusive con cui gli x e gli n-x elementi possono presentarsi, la parte restante della funzione binomiale esprime la probabilità che si verifichi x volte l’evento successo. La sequenza dei coefficienti binomiale può essere ottenuta dal triangolo di Tartaglia Il valor medio della variabile binomiale è nπ , mentre la sua varianza è n π(1- π)

Esempio(Distribuzione Prob. Binomiale)

Esempio(Binomiale) Costruire la densità di frequenza di una variabile aleatoria binomiale n=5 ; p=0.5 .

Esempio(Binomiale) Riportare su un grafico la funzione di ripartizione binomiale con p=0.5 ed n=5.

Campionamento da una popolazione di Poisson La distribuzione di Poisson è adatta alla descrizione di eventi che si verificano con una frequenza molto bassa in uno spazio o in un tempo molto grande (‘Eventi Rari’). ESEMPIO: il numero di piante di una data specie presente in un areale, il numero di microrganismi in un certo volume di sospensione, il numero di mutanti antibiotico-resistenti in una popolazione di cellule batteriche o anche il numero di pezzi difettosi in una produzione di serie. La distribuzione di Poisson è il limite della binomiale per n→∞ e π→0 tale che nπ sia una costante finita:

Campionamento da una popolazione di Poisson(2) Infatti,poiché λ=nπ,allora π = λ/n e considerando che x è molto piccolo rispetto a n: I valori della media e della varianza di una distribuzione di Poisson sono pari a λ. La distribuzione è tipicamente asimmetrica , ma all’aumentare del numero di osservazioni essa tende alla Normale (distribuzione tipicamente simmetrica)

Campionamento da una popolazione di Poisson(3) Si noti come sia possibile trovare le probabilità in modo ricorrente, ovvero moltiplicando il valore al punto precedente P(j-1) per λ/j .

Distribuzione di Poisson λ1=3; λ2=10

Variabili Casuali Continue : la distribuzione Normale (di Gauss) I parametri media e varianza descrivono l’intera popolazione Normale. La curva è asintotica all’asse delle ascisse per x che tende a + ∞ e - ∞. La curva è simmetrica : media,moda e mediana coincidono. La probabilità si distribuisce quasi completamente in un intorno di 3 volte la deviazione standard .

Esempio(Distribuzione normale) Disegnare due curve normali con media pari a 10 e sd pari a 2 e 4

Esempio(Distribuzione normale) Disegnare due curve normali con media pari a 8 e 4 e sd pari a 3

Standardizzazione di una variabile Sia X una variabile casuale di cui si conosce la media μ e lo standard error σ . Z è la trasformazione che standardizza X . Se X si distribuisce come una Normale di media μ e standard error σ, la variabile Z si distribuisce ancora come una Normale con media 0 e standard error pari a 1

Esempio(Contenuto di cloro nell’acqua) Qual è la probabilità che, da un pozzo con un contenuto medio di cloro pari a 1 meq (milli-equivalente ) l-1, eseguendo l’analisi con uno strumento caratterizzato da un coefficiente di variabilità pari al 4%, si ottenga una misura pari o superiore a 1.1 meq l-1? E’ possibile che questa misura sia stata ottenuta casualmente, oppure è successo qualcosa di strano (errore nell’analisi o inquinamento del pozzo)? Questo problema può essere risolto immaginando che se è vero che il pozzo ha un contenuto medio di 1 meq l-1 i contenuti di cloro dei campioni estratti da questo pozzo dovrebbero essere distribuiti normalmente, con media pari ad 1 e deviazione standard pari a 0.04 (si ricordi la definizione di coefficiente di variabilità). Qual è la probabilità di estrarre da questa popolazione una misura pari superiore a 1.1 meq l-1?

Esempio(Distribuzione Normale) Nello stesso strumento dell’esercizio precedente e considerando lo stesso tipo di analisi, calcolare: 1 - la probabilità di ottenere una misura inferiore a 0.75 2 - la probabilità di ottenere una misura superiore a 1.5 3 - la probabilità di ottenere una misura compresa tra 0.95 e 1.05 Stabilire inoltre: 1 - la misura che è superiore al 90% di quelle possibili 2 - la misura che è inferiore al 70% di quelle possibili 3 - le misure entro le quali si trova il 95% delle misure possibili

Esempio : Indagine su neonati(Distribuzione Normale) Da un’indagine svolta su un campione di neonati ,il peso alla nascita è risultato avere media pari a 3.2 kg con σ di 0.6 kg. Ciò significa che nella popolazione il 68% circa dei neonati ha un peso tra 2.6 e 3.8 kg ,il 95% ha un peso tra 2 e 4.4 kg e meno dell’1% ha peso maggiore di 5 o minore di 1.4 kg. Ci si chiede: In un campione di 1000 nati ,quanti sono attesi avere un peso compreso tra 3.5 e 3.7 kg? Considerando i pesi medi rilevati su 20 nati in 1000 ospedali ,in quanti casi è attesa una media compresa tra 3.5 e 3.7?

Altre distribuzioni collegate alla normale Le distribuzione dei quadrati di variabili casuali Normali Standard è detta distribuzione χ2 (chi-quadrato) con 1 grado di libertà. z2~χ21 La somma dei quadrati di n VC normali standard indipendenti è distribuita come una χ2 con n gradi di libertà. Questa distribuzione è continua e può assumere valori soltanto positivi: se il numero dei gradi di libertà è piccolo la distribuzione è molto asimmetrica mentre tende alla simmetria in modo proporzionale all’aumento dei gradi di libertà. La media e la varianza della VC di χ2 sono rispettivamente pari al numero dei gradi di libertà ν e al doppio dello stesso numero 2 ν.

Distribuzione χ2 con v gdl Per un campione di v osservazioni :

Distribuzione χ2 con v gdl(2) Allora : Essendo E(zizj)=0 per l’indipendenza degli xi,segue che :

Distribuzione χ2 con v gdl(3) Per lo stesso motivo :

Distribuzione χ2

Distribuzione di Fisher Rapporto di 2 funzioni determinate su campioni indipendenti La funzione è asimmetrica ,al tendere di v2 all’infinito la distribuzione converge a

Distribuzione Fisher gdl=(3,4) red line gdl=(10,20) blue line

Distribuzione t di student (Fisher con v1=1)

t-student (gdl 2(red),10(blue),40(green))

Distribuzione degli scarti standardizzati

Grazie per l’attenzione