UN ESEMPIO DI ESPERIMENTO CASUALE

Slides:



Advertisements
Presentazioni simili
2. Introduzione alla probabilità
Advertisements

Rappresentazione tabellare dei dati
STATISTICA DESCRITTIVA
Proprietà degli stimatori
La probabilità.
Il chi quadro indica la misura in cui le
Variabili casuali a più dimensioni
Natura della scienza & Competenze scientifiche. Una ricerca inizia con una … Domanda di ricerca –Ciò che gli scienziati vogliono sapere.
Elementi di statistica Elementi di statistica M. Dreucci Masterclasses LNF Elementi di statistica M. Dreucci.
Metodi Probabilistici, Statistici e Processi Stocastici Università Carlo Cattaneo Emanuele Borgonovo Metodi Probailistici, Statistici e Processi Stocastici.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°3.
CAMPIONAMENTO Estratto dal Cap. 5 di:
GRIGLIA PER LA LETTURA DI UN LAVORO SCIENTIFICO
DISTIBUZIONE BINOMIALE
Processi Aleatori : Introduzione – Parte I
Matematica e statistica Versione didascalica: parte 8 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste
Appunti di inferenza per farmacisti
CRITERI DI MISURA AFFIDABILITA’: le informazioni ottenute dalle misurazioni devono essere coerenti e stabili nel tempo e tra osservatori diversi VALIDITA’:
“Dadi” diversi Utilizziamo strumenti diversi per studiare la casualità/per determinare la frequenza relativa in modo sperimentale.
Corso di biomatematica lezione 7: Test di significatività
Il Teorema del Limite Centrale
La mediazione culturale nei musei: modelli di ricerca sul campo Benedetto Vertecchi Aspetti sincronici e diacronici della mediazione culturale nei musei.
Lezioni per Insegnanti mod 4 Prof. Giovanni Raho 1 I metodi della ricerca sociale Corso S. I. S. S Mod. 4.
MICROBIOLOGIA SPECIALE
Caratteri In corrispondenza di ogni unità statistica si possono osservare dei caratteri. Un carattere può assumere modalità differenti per le varie unità.
Analisi bivariata Passiamo allo studio delle relazioni tra variabili
Pedagogia sperimentale
Popolazione campione Y - variabile casuale y - valori argomentali Frequenza relativa: Estrazione Densità della classe i-esima: Lezione 1.
Epidemiologia Lepidemiologia è lo studio della distribuzione e delle cause delle malattie e/o della mortalità nella popolazione umana. In tossicologia.
Modulo “Pensiero, ragionamento e decisione”
Elaborazione di Immagini II Parte Lezione N.2
Un buon latinista è anche un bravo matematico? I.S. Artemisia Gentileschi - NAPOLI Convegno finale Progetto Lauree Scientifiche – Matematica Università
LA METODOLOGIA DELLA RICERCA nelle scienze sociali:
Esperimento di statistica Palmo Fuoco – Giuseppe Valerio.
Evento Def: E’ il risultato di un esperimento o di un’osservazione oppure una proposizione che può essere vera o falsa e di cui non è noto il valore logico.
Statistica economica (6 CFU) Corso di Laurea in Economia e Commercio a.a Docente: Lucia Buzzigoli Lezione 5 1.
Le distribuzioni campionarie
QUALCHE LUCIDO DI RIPASSO… 1. Esperimento casuale ( e. aleatorio) risultato Esperimento condotto sotto leffetto del caso: non è possibile prevederne il.
OGNI PAIO DI CROMOSOMI CONTIENE GLI STESSI GENI NELLO STESSO ORDINE MA NON NECESSARIAMENTE IN FORMA IDENTICA. ALLELI: FORME DIVERSE DI UNO STESSO GENE.
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
Le variabili casuali e la loro distribuzione di probabilità Generalmente, lanciando un dado, si considera il valore numerico della faccia uscita.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica.
Corso di Logica Università di Cagliari Popolazione e campione Supponiamo di voler studiare una certa caratteristica, ad es. l’orientamento di voto, in.
P = Azioni occasionali / rivolti ad un numero contenuto di soggetti e/o categorie speciali C = Azioni consolidate / i n attività da un certo numero di.
Cristina Tortora a.a.: 2012/2013 Università degli Studi di Napoli Federico II Facoltà di Economia.
Nelle popolazioni naturali la variabilità genetica (ovvero ereditaria) può essere di tipo qualitativo o quantitativo La variabilità qualitativa si riscontra.
Martina Serafini Martina Prandi
IL CAMPIONE.
Appunti conclusioni simulazione lancio dadi
La variabile casuale poissoniana nell'ambito degli arrivi dei raggi cosmici Obiettivo: verificare che gli arrivi dei raggi cosmici seguono una distribuzione.
Competenza Costrutto di conoscenza, abilità, risorse Dimensione esterna (osservabile) e dimensione interna (esistenziale, raccontabile)
Test basati su due campioni Test Chi - quadro
Monoibrido - Carattere Locus Allele Test Cross. semi rotondi x semi grinzosi AUTOIMPOLLINAZIONE F2 F1 X P P Universita’ di Bari by GP&NA.
Lezione 3 Elementi di teoria delle variabili casuali Insegnamento: Statistica Corso di Laurea Magistrale in Matematica Facoltà di Scienze, Università di.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
La variabilità dei risultati economici Grado di leva operativa e Grado di Leva finanziaria.
Analisi della varianza Resistenza di una fibra sintetica: essa è legata alla percentuale di cotone che potrà però variare tra il 10 e il 40% perché il.
Intervalli di confidenza
La distribuzione campionaria della media
UNIVERSITA’ DEGLI STUDI DI PERUGIA
UNITA’ OPERATIVA DISI UNIVERSITA’ DI GENOVA Progetto MURST 5% Multimedialita’ Linea di ricerca 4 “Applicazione ai beni culturali”
PEDAGOGIA SPERIMENTALE MODELLI E PROCEURE PER L’EDUCAZIONE DEGLI ADULTI CORSO DI LAUREA SEAFC Prof. Cinzia Angelini Università Roma Tre Anno accademico.
Metodologia della ricerca e analisi dei dati in (psico)linguistica 24 Giugno 2015 Statistica inferenziale
TRATTAMENTO STATISTICO DEI DATI ANALITICI
DIPENDENZA STATISTICA TRA DUE CARATTERI Per una stessa collettività può essere interessante studiare più caratteri presenti contemporaneamente in ogni.
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
Ipotesi operative TeoriaEsperienza diretta e/o personale Quesito Piano esecutivo Scelta popolazione Scelta strumenti Scelta metodi statistici Discussione.
Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica
Momenti e valori attesi
Transcript della presentazione:

UN ESEMPIO DI ESPERIMENTO CASUALE Valori attesi di variabile casuale

Universo finito di N elementi Si consideri un universo formato da un numero N finito di elementi, e sia  la frequenza di un certo carattere in tale universo. Si immagini un esperimento consistente nell'osservare n<N elementi dell'universo e nel contare quanti elementi presentino detto carattere. Si abbia, ad esempio, una confezione di N=8 capsule nella quale la frequenza di capsule difettose è  =0.375, e di osservare un campione di n=3 capsule.

Campione finito di n=3 elementi Il campione osservato è solo uno dei possibili campioni di 3 elementi; ma quanti e quali sono gli eventi possibili dell'operazione di campionamento? In una situazione che implica piccoli numeri, è facile compilare l'elenco di tutti i possibili eventi. Per le regole del calcolo combinatorio, i possibili eventi sono tutte le k combinazioni N elementi in classe n : k = N!/[n!(N-n)!] = 8!/(3!5!) = 8765!/(325!) = 56 dove N! (detto N fattoriale) denota il prodotto dei primi N numeri naturali: N! = N (N-1) ... 1 , NB: se N=0, per definizione, N!=1.

un esempio di esperimento casuale Dette a1 a2 a3 le 3 capsule difettose, e ā1 ā 2 ā 3 ā 4 ā 5 le 5 capsule non difettose, universo ed eventi si possono così denotare: universo (I): {a1 a2 a3 ā1 ā 2 ā 3 ā 4 ā 5} un evento (e E): {a1 ā1 ā 5} I: a1 a2 a3 ā 1 ā 2 ā 3 ā 4 ā 5 ▼ e: L'insieme di tutti i possibili eventi prende nome di spazio «E» degli eventi o spazio campionario

ELENCO DI TUTTI I POSSIBILI EVENTI elementi Elementi e01 a1 a2 a3 e02 ā1 e07 e12 ā 1 e03 ā2 e08 e13 ā 2 e04 ā3 e09 e14 ā 3 e05 ā4 e10 e15 ā 4 e06 ā5 e11 ā 5 e16 e17 e27 e37 e18 e28 e38 ee19 e29 e39 e20 e30 e40 e21 e31 e41 elementi e22 a1 ā 2 ā 4 e32 a2 e42 a3 e23 ā 5 e33 e43 e24 ā 3 e34 e44 e25 e35 e45 e26 e36 e46 e47 ā 1 e48 e50 e49 e51 e52 e53 e54 e55 e56

COME ASSOCIARE LE PROBABILITÀ (1) Supponiamo di estrarre un campione di 3 capsule dalla confezione: l'operazione porterà sicuramente a uno dei 56 eventi possibili indicati in tabella: p {e E} = 1 (certezza) p {e E} = 0 (impossibilità) Rimane il problema di associare ad ogni evento una particolare probabilità; a tal fine, si assuma che la probabilità che ogni singolo elemento dell'universo ha di essere incluso nel campione non dipenda dalle caratteristiche dell'elemento. Ciò equivale ad affermare che i 56 campioni elencati in tabella hanno tutti la stessa probabilità di essere estratti, e si deduce che ad ogni campione è associata la probabilità p=1/56.

COME ASSOCIARE LE PROBABILITÀ (2) Perché le probabilità assegnate siano coerenti con la «legge empirica del caso» l'estrazione del campione va eseguita in modo conforme all'assunto. Possono non essere conformi i campioni formati dalle prime 3 capsule uscite al rovesciamento del contenitore: una capsula difettosa può avere probabilità minore di uscire per prima se è più leggera o di forma meno regolare, e diventa concettualmente impossibile asse­gnare le probabilità ai campioni.

CREAZIONE DI UNA VARIABILE CASUALE (1) Si consideri la variabile x=«numero di capsule difettose in un campione di 3 elementi». La probabilità p(xi), associata ad ogni valore xi che la variabile x può assumere, è la somma delle probabilità associate a tutti i campioni con xi capsule difettose, poiché gli eventi «estrazione di un particolare campione» sono incompatibili. La probabilità che x assuma valore 0, ad esempio, è la somma delle probabilità associate ai campioni che non includono capsule difettose (da e47 a e56). La funzione che assegna la probabilità p(xxi ) che x sia minore uguale ad xi si chiama «funzione di partizione o di distribuzione», e si denota come F(x).

CREAZIONE DI UNA VARIABILE CASUALE (2) Variabile x=«numero di capsule difettose in un campione di 3 elementi», e valori della probabilità [p(x)] e della funzione di partizione [F(x)] associati a ogni valore x che la variabile xi può assumere: valore n° di campioni probabilità p(x) Distribuzione xi tali che x=xi associata a x = xi F(xi) = p{x xi} x = 0 10 (da e47 a e56) 10/56=0.17857 x = 1 30 (da e17 a e46) 30/56=0.53571 40/56=0.71428 x = 2 15 (da e02 a e16) 15/56=0.26786 55/56=0.98214 x = 3 1 ( e01 ) 1/56=0.01786 56/56=1.00000

DEFINIZIONE DI VARIABILE CASUALE Quanto enunciato sinora è premessa sufficiente ad una definizione più generale di variabile casuale: Una variabile casuale è una variabile reale, per ogni intervallo di valori della quale è definita la probabilità di manifestarsi. La funzione F(x), che associa univocamente la probabilità a ciascuno degli intervalli (funzione di distribuzione o funzione di partizione), indica la probabilità che la variabile x assuma valori non superiori a una soglia (x*): F(x*) = p(x ≤x*) e deve soddisfare certi requisiti tra cui essere compresa tra 0 ed 1, ed essere mai decrescente: 0 ≤ F(x) ≤ 1 F(x1) ≤ F(x2) per x1 < x2 La probabilità che la variabile x assuma valori nell'inter­vallo (x1 , x2 ], è data dalla differenza tra i valori della funzione di partizione associati a x1 e x2 : p(x1 < x ≤x2 ) = F(x2) - F(x1)

VARIABILI CASUALI DISCRETE (1) Una variabile casuale è discreta se può assumere solo un numero finito o al più un'infinità numerabile di valori. Quale esempio di variabile casuale discreta infinita, si consideri un processo produttivo continuo in cui la pro­porzione di confezioni che, una dopo l'altra, cadono col marchio rivolto in basso (B) su un nastro trasportatore equivale a quella delle confezioni che cadono col marchio rivolto in alto (A): p(A) = p(B) = 0.5 Si definisca la variabile casuale x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio rivolto in basso» , Tale variabile è discreta poiché può assumere solo i valori 1, 2, ... n, ed infinita poiché non è possibile definire un valore massimo per x.

VARIABILI CASUALI DISCRETE (2) Le probabilità associate ai valori di x riportate nella seguente tabella si calcolano assai facilmente, poiché la probabilità dell'evento Bn=«comparsa di una confezione B dopo una sequenza di (n-1) confezioni A» equivale alla probabilità dell'evento B per il prodotto di (n-1) fattori pari alla probabilità dell'evento A, poiché A e B sono eventi indipendenti. x sequenza* p(xi) F(x)=p{x xi} 1 B1 0.51 = 0.500 1 - 0.5 = 0.500 2 A1 B2 0.52 = 0.250 1 - 0.52 = 0.750 3 A1 A2 B3 0.53 = 0.125 1 - 0.53 = 0.875 . n ... An-1 Bn 0.5x 1 - 0.5x *)A = marchio rivolto in alto; B = marchio rivolto in basso. Anche nel caso di variabili discrete ma infinite si può assegnare la probabilità ad ogni singolo evento. Si noti che la funzione F(x) è una funzione di partizione:

VARIABILI CASUALI DISCRETE (3) Rappresentazione grafica della distribuzione della variabile casuale x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio rivolto in basso». La variabile qui descritta prende il nome di variabile casuale geometrica.

DISTRIBUZIONE BINOMIALE (1) Si abbia un processo per la produzione di compresse tale che la probabilità di una compressa di essere difettosa sia  = 0.01. Si vuole calcolare la probabilità di trovare 0, 1, 2, 3, 4 compresse difettose in un blister di 4 compresse, sotto l'assunto che la probabilità di una compressa di finire in un dato blister non dipenda dalle caratteristiche della compressa stessa. Si noti che il blister può essere considerato un campione tratto da un universo virtualmente infinito (la produzione di compresse).

DISTRIBUZIONE BINOMIALE (2) Per enumerazione dei casi possibili, si osserva che 4 compresse difettose (f) e no (s) si combinano, con probabilità  ed (1- ) in 24 = 16 diversi modi. In analogia con ciò che si è già visto, la probabilità di osservare un blister con x compresse difettose è la somma delle probabilità associate ad ognuno dei diversi modi con cui il blister può includere x compresse difettose. Ad esempio, vi sono 4 modi con cui un blister può avere una sola compressa difettosa: essa può essere la prima, la seconda, la terza o la quarta.

compresse x 1 2 3 4 probabilità (1-π)(1-π)(1-π)(1-π) (1-π)4 = .994 .96059601 d s π (1-π)(1-π)(1-π) π(1-π)3 .011.993 .00970299 (1-π) π (1-π)(1-π) (1-π)(1-π) π (1-π) (1-π)(1-π)(1-π) π 4(1-π)3 4.011.993 .03881196 π π (1-π)(1-π) π2(1-π)2 .012.992 .00009801 π (1-π) (1-π) π π (1-π)(1-π) π (1-π) π π (1-π) (1-π) π (1-π) π D (1-π)(1-π) π π 6 π2(1-π)2 6.012.992 .00058806 π π π (1-π) π3(1-π) .013.991 .00000099 π π (1-π) π π (1-π) π π (1-π) π π π 4 π3(1-π) 4.013.991 .00000396 π π π π π4 .014 .00000001

DISTRIBUZIONE BINOMIALE (3) Detto n il numero delle occasioni (ad es., il numero di compresse nel blister) ed x il numero di eventi (ad es., il numero di compresse difettose nel blister) ognuno dei quali ha la stessa probabilità di verificarsi, si ha che: dove il termine nCx è detto coefficiente binomiale, e denota il numero di sequenze di lunghezza n che si possono formare con x elementi aventi il carattere d ed (n-x) elementi aventi il carattere s .

DISTRIBUZIONE BINOMIALE (4) Nell'esempio la probabilità d'osservare un blister con 2 compresse difettose può essere calcolata direttamente: La variabile le cui probabilità siano assegnate secondo tale legge è chiamata variabile casuale binomiale e si denota come x ~Bi(,n). Se è nota la funzione di probabilità, possiamo assegnare le probabilità agli eventi senza dover enumerare i casi possibili.

VALORE ATTESO DI UNA VARIABILE CASUALE: MEDIA E VARIANZA La media di una variabile casuale x, che è detta anche valore atteso di x e si denota come E(x), è un parametro tipico che indica la posizione dei valori di x. media: Nel caso di variabili discrete, può essere calcolata come media: La varianza σ2, o V(x), di una variabile casuale x è anch'essa parametro tipico di x ed indica la dispersione dei valori di x. Per definizione, essa è il valore atteso del quadrato degli scarti dalla media : Nel caso di variabili discrete, può essere calcolata come varianza:

Per la variabile casuale discreta finita x = «numero di capsule difettose in un campione di 3 elementi, estratto da una confezione dove vi sono 3 capsule difettose»: Per la variabile casuale discreta infinita x = «lunghezza della sequenza di confezioni che si osservano sino alla comparsa di una confezione con il marchio in basso (B) anziché in alto (A), per p(A)=p(B)=0.5»

COVARIANZA E CORRELAZIONE considerino due variabili casuali x e y tali che E(x)= μx; E(y)= μy ; V(x)= ; cioè x (x , ) cioè y ( y , ) V(y)= ; La covarianza xy di x e y è il valore atteso del prodotto (x- μx)(y- μy) e si denota come Cov(xy). Essa è un parametro tipico che indica l'associazione tra i valori di x e i valori di y. covarianza: Nel caso di variabili discrete, può essere calcolata come Il coefficiente di correlazione lineare xy è definito come rapporto tra la covarianza di x e y e la media geometrica delle varianze di x e y coefficiente di correlazione:

OPERATORI MEDIA E VARIANZA (1) Per gli operatori media [ E( ) ] e varianza [ V( ) ] valgono le seguenti regole: Il valore atteso di una costante k è la costante stessa: I II Data una variabile casuale x avente E(x)= μx e V(x)=σ2,per aggiunta di una costante k ad x si ottiene una nuova variabile casuale y, che ha media: III e varianza uguale a quella di x: IV

OPERATORI MEDIA E VARIANZA (1) Data una variabile casuale x avente E(x)= e V(x)=2 , il prodotto di x per una costante k dà una variabile casuale y, che ha media e varianza V VI Data la variabile casuale z = x ± y somma (o differenza) delle variabili casuali x (x , ) ed y ( y , ), si ha: VII VIII

VARIABILI INDIPENDENTI Definizione: Due variabili casuali x e y si dicono indipendenti, se indipendenti sono gli eventi «comparsa di un valore x=x0» e «comparsa di un valore y=y0». Se le variabili casuali x e y sono indipendenti si ha che il valore atteso del loro prodotto è uguale al prodotto dei loro valori attesi e che, quindi, la loro covarianza è nulla: Pertanto, la varianza della variabile z = x ± y somma (o differenza) delle variabili casuali indipendenti x~ (x , )  e y ( y , )  è uguale alla somma delle loro varianze: IX

OPERATORI MEDIA E VARIANZA (ESEMPIO) Si consideri la variabile casuale z = «difettosità della prima compressa in un blister di n compresse» Essa assume il valore 1 con probabilità , se la prima compressa è difettosa, e 0 con probabilità (1-), se la prima compressa è non-difettosa. Tale variabile è detta bernoulliana e ha media e varianza Si consideri ora che la variabile casuale binomiale x = «numero di compresse difettose in un blister di n compresse» può essere espressa come somma di n variabili casuali bernoulliane indipendenti: Per applicazione delle regole VII e IX, se ne deduce che:

MEDIA E VARIANZA DI VARIABILI CONTINUE Benché gli esempi di variabili casuali sinora illustrati siano stati riferiti a variabili discrete, il concetto di valore atteso vale anche per le variabili continue. Occorre tuttavia fornirne una definizione più generale, perché l'operatore sommatoria non si applica al caso di infinità non numerabile: Valore atteso di una variabile casuale continua x è l'integrale definito tra - e + del prodotto della variabile x per la funzione di densità di probabilità f(x) ad essa associata. distribuzione: media: varianza: NB: nel caso di variabili casuali discrete, l'operatore integrale corrisponde a quello di sommatoria, e f(x)dx=p(x), se x è un valore della variabile discreta, f(x)dx=0 in caso contrario.