Cap. 15 Caso, probabilità e variabili casuali Cioè gli ingredienti matematici per fare buona inferenza statistica
Determinismo e casualità Ci si trova in situazione deterministica quando è noto l’intero insieme di circostanze che determinano E. In questo caso E è prevedibile a priori con certezza
Determinismo e casualità Ci si trova in situazione casuale quando l’insieme di circostanze che determinano E è noto solo parzialmente. In questo caso E non è prevedibile apriori con certezza:
Definizioni di base La parte di circostanze ignote che impediscono di prevedere a priori con certezza il risultato E definisce il caso. Esperimento casuale: esperimento condotto sotto l’effetto del caso. Di un esperimento casuale è possibile solo elencare a priori l’insieme dei possibili esiti. Evento elementare: ciascuno dei possibili esiti di un esperimento casuale. Spazio campionario (W): l’insieme di tutti i possibili esiti (eventi elementari) di un esperimento casuale, elencabili a priori. Evento casuale (E): un sottoinsieme dello spazio campionario. NB: il concetto di evento casuale è più generale del concetto di evento elementare. Un evento elementare è un singolo elemento di W. Un evento casuale è un sottoinsieme di cioè un insieme di eventi elementari: ne può contenere molti, alcuni, tutti, uno solo o anche nessuno.
Esempio
Definizioni di base Realizzazione di un evento casuale (verificata a posteriori): uno degli eventi elementari necessariamente si verifica. Allora è W l’evento certo e Ø l’evento impossibile. Esempio: La probabilità P(E) di un evento casuale E è un numero associato a E che ne quantifica a priori il grado di incertezza ovvero la possibilità di realizzazione.
Probabilità Definizione classica: P(E) è il rapporto fra il numero di casi favorevoli ad E e il numero di tutti i casi possibili, posto che possano ritenersi tutti ugualmente possibili ( attenzione: circolarità!) Definizione frequentista: L’evento E di cui si vuole calcolare la probabilità P(E) è pensato come il risultato di un esperimento casuale ripetibile un gran numero N di volte sempre nelle stesse condizioni. Al termine di tali N prove, E si sarà verificato f volte (e non si sarà verificato le rimanenti N − f volte). P(E) è il valore intorno al quale tende a stabilizzarsi la frequenza relativa dopo un numero sufficientemente grande di prove: La definizione frequentista è più ampia di quella classica: permette di considerare spazi campionari infiniti e calcolare la probabilità anche di eventi anche quando i casi possibili non sono tutti equiprobabili. Bisogna però che l’esperimento sia ripetibile: quanto è un gran numero di volte? Come è possibile verificare che le condizioni siano le stesse?
Variabili casuali La variabile casuale (v.c.) è lo strumento matematico che permette di concentrarci sulle sole caratteristiche dell’esperimento che interessano e che trasforma gli eventi casuali in numeri reali, conservandone la probabilità. La v.c. formalizza le situazioni casuali – cioè gli eventi E e le loro probabilità P(E) in analogia con quanto fa la v.s. nella statistica descrittiva.
Esempio
Variabili casuali discrete Sfruttando l’analogia tra v.c. e v.s. si possono trasferire molti concetti dalla statistica descrittiva alla statistica inferenziale: V.c. discreta X: assume un numero finito (o infinito numerabile) di valori x che di solito sono numeri interi (in analogia con le modalità di una v.s.) Funzione di probabilità (in analogia con le frequenze relative di una v.s.): Funzione di ripartizione (in analogia con le frequenze cumulate relative di una v.s.): è la probabilità che la v.c. X assuma valori minori o uguali ad un generico valore x:
Variabili casuali discrete Media (o valore atteso), varianza, deviazione standard (definite e calcolate come per le v.s. ma utilizzando le probabilità al posto delle frequenze):
Esempio X : numero di teste nel lancio di due monete (bilanciate)
Variabile casuale binomiale Una particolare v.c. discreta, con le seguenti tre caratteristiche: l’esperimento casuale consiste nell’esecuzione di n prove indipendenti in cui cioè l’esito di ciascuna prova non influenza l’esito della prova successiva Ciascuna prova può avere come esito uno (e soltanto uno) di 2 eventi fra loro contrari ed esaustivi («successo» ed «insuccesso», con riferimento a fenomeni dicotomici) E’ nota e costante in ciascuna prova la probabilità p del successo n e p sono i parametri della v.c. binomiale Il generico risultato della serie di n prove (il generico evento elementare) è
Variabile casuale binomiale Qual è la funzione di probabilità P(X=x) della v.c. binomiale? Al generico risultato è associata la probabilità p(1-p)p…p(1-p)(1-p)…p = px(1-p)n-x Ma la realizzazione X=x può capitare anche in un altro ordine, sempre con la stessa probabilità. Qual è il numero di possibili combinazioni di x successi e n − x insuccessi in ordine diverso? Il coefficiente binomiale:
Variabile casuale binomiale Dunque la funzione di probabilità di una v.c. binomiale è Si può dimostrare che:
Variabili casuali continue Le v.c. continue assumono infiniti valori. Per identificarli, in analogia con le v.s. continue, bisogna fare riferimento ad intervalli. Si parla in questo caso di funzione di densità di probabilità, f(x) (in analogia con le densità di frequenza relative di una v.s.). La funzione di ripartizione F(x) è l’integrale della funzione f(x) (l’area sottostante). Esempio: dado alternativo NB: i singoli punti hanno probabilità pari a 0! La probabilità che X assuma valori in un intervallo è l’area sottesa al grafico di f(x) in quell’intervallo.
Variabile casuale normale Assume tutti i valori reali: È simmetrica, con media (e quindi anche mediana e moda) m e varianza s2 I punti di flesso nella funzione di densità di probabilità sono m-s e m+s
Variabile casuale normale Variazioni di m (a parità di s) determinano traslazioni di f(x) a sx e dx Variazioni di s (a parità di m) determinano appiattimenti o innalzamenti di f(x)
Standardizzazione di una variabile casuale E’ una operazione che permette di creare una v.c. con funzione di (densità di) probabilità con la stessa forma, ma media pari a 0 e varianza pari a 1. Esempio: lancio di 2 dadi:
Standardizzazione di una v.c.: esempio
Variabile casuale normale standard(izzata) Molti fenomeni (naturali e non) sono interpretabili come v.c. con distribuzione normale. Per calcolare le probabilità del verificarsi di specifiche realizzazioni (intervalli) bisogna guardare al valore della funzione di ripartizione, ovvero all’area sottostante alla funzione di densità. A prescindere dagli specifici parametri m e s , possiamo standardizzare la variabile e utilizzare i valori corrispondenti sulle tavole della normale standard.
Tavole della normale standard NB: i valori negativi non compaiono in quanto la v.c. è simmetrica
Intervalli tipici della normale