1 DISTRIBUZIONI DI PROBABILITÁ
2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete e continue, è associata una distribu- zione che permette di calcolare le probabilità degli eventi possibili. discreto Nel caso discreto, tale distribuzione soddisfa le due condizioni: continuo Nel caso continuo, si tratta di una funzione che soddisfa le due condizioni: 1. 2.
3 distribuzione binomiale p q = 1-p Si indichi con p la probabilità che si presenti un determinato evento in una prova, e con q = 1-p la probabilità che l’evento non si presenti; n k allora, la probabilità che in n prove l’evento si presenti esattamente k volte è data da: Si utilizza per eventi che possono assumere solo due valori, tipo “giusto-sbagliato”, “testa-croce”, “vero-falso”.
4 distribuzione binomiale n pk La formula permette di calcolare la probabilità che in n prove l’evento con probabilità p si verifichi k volte: dove: kn probabilità di k successi in n prove numero delle prove numero dei successi probabilità del successo probabilità dell’insuccesso
5 La quantità calcola la probabilità di ottenere in maniera ordinata k successi (eventi con probabilità p) e n-k insuccessi (eventi con probabilità q). Ovviamente non siamo interessati all’ordine con cui questi successi appaiono, quindi è necessario moltiplicare questa probabilità per il numero di successioni ordinate di n eventi in cui il numero di successi è k (ogni successione di k successi su n tentativi/eventi ha uguale probabilità). Questo numero è facilmente calcolabile con la formula per calcolare le combinazioni di n su k:
6 esempio 1 (1) Calcolare la probabilità di ottenere 4 teste lanciando una moneta non truccata 10 volte. L’evento che consideriamo, “esito del lancio di una moneta”, ha due risultati possibili, pertanto utilizziamo la distribuzione binomiale con: numero delle prove = 10 numero dei successi (teste) = 4 probabilità del successo (testa) = 0,5 probabilità dell’insuccesso = 0,5
7 esempio 1 (2) Calcolare la probabilità di ottenere 4 volte testa lanciando una moneta non truccata. Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di teste (compreso tra 0 e 10) in 10 prove.
8 esempio 1 (3) Rappresentazione grafica della distribuzione di probabilità della v.c. X = numero di teste in 10 lanci di una moneta 0 0,05 0,1 0,15 0,2 0, numero di teste in 10 lanci probabilità
9 proprietà (1) distribuzione binomiale La distribuzione binomiale gode delle seguenti proprietà: distribuzione discretak 0 n 1. È una distribuzione discreta in quanto k assume solo valori interi (compresi tra 0 e n); 2. P k 0 per qualunque valore di k; 3. Queste proprietà, in particolare la 2 e la 3 consentono di dire che la distribuzione binomiale è una distribuzione di probabilità.
10 proprietà (2) distribuzione simmetrica asimmetrica 4. se p = q = 0,5 si tratta di una distribuzione simmetrica, in tutti gli altri casi è asimmetrica (basti pensare che se la moneta è sbilanciata ed ha un’alta probabilità di produrre testa ad ogni tiro, un numero alto di teste nel totale dei tiri è più probabile di un numero basso di teste) la media 5. la media della distribuzione è data da la varianza 6. la varianza della distribuzione è data da la deviazione standard 7. la deviazione standard è data da
11 distribuzione ipergeometrica NN 1 N 2 N 1 + N 2 = Nn nk (n - k) Si utilizza quando si eseguono estrazioni senza reinserimento. In generale, volendo estrarre, da un insieme di N elementi, N 1 dei quali aventi una certa caratteristica ed N 2 un’altra caratteristica (con N 1 + N 2 = N), un campione di n elementi distinti me- diante un’estrazione senza reinserimento; ci si chiede quale sia la probabilità che, di questi n elementi, k siano di un tipo e gli altri (n - k) dell’altro tipo. Per determinare tale probabilità è necessario individuare quali siano i casi possibili nello spazio campionario relativo all’esperimento: “numero di campioni di n elementi che si possono ottenere dall’insieme”.
12 distribuzione ipergeometrica Alla fine, si giunge alla formula: dove: numero di elementi del campione numero di elementi del campione con la prima caratteristica numero di elementi dell’insieme numero di elementi dell’insieme con la seconda caratteristica numero di elementi dell’insieme con la prima caratteristica
13 esempio 2 (1) Un’urna contiene 10 palline di cui 4 sono rosse e 6 bianche. Si estraggono in blocco (senza reinserimento) 3 palline; calcolare la probabilità di estrarre 2 palline rosse. La variabile casuale che consideriamo è X = numero di palline rosse estratte, in particolare ci interessa determinare la probabilità che [X =2] con: numero di elementi del campione = 3 numero di elementi del campione con la prima caratteristica = 2 numero di elementi dell’insieme = 10 numero di elementi dell’insieme con la seconda caratteristica = 6 (bianco) numero di elementi dell’insieme con la prima caratteristica = 4 (rosso)
14 esempio 2 (2) Applicando la formula avremo: Allo stesso modo possiamo calcolare le probabilità di ottenere un qualunque numero di palline rosse (compreso tra 0 e 3) in un campione di 3 palline estratte senza reinserimento.
15 esempio 2 (3) Rappresentazione grafica della distribuzione di probabilità della v.c. X = numero di palline rosse estratte 0 0,1 0,2 0,3 0,4 0,5 0, numero di palline rosse estratte probabilità
16 proprietà distribuzione ipergeometrica 1. la distribuzione ipergeometrica è una distribuzione discreta; la media 2. la media della distribuzione è data da la varianza 3. la varianza della distribuzione è data da
17 distribuzione normale Si tratta della più importante distribuzione di variabili continue, in quanto: si può assumere come comportamento di molti fenomeni casuali, tra cui gli errori accidentali; è la forma limite di molte altre distri- buzioni di probabilità; trasformando opportunamente delle v.c. non normali, si possono ottenere nuove variabili distribuite normalmente; sotto determinate condizioni, delle somme di v.c. possono essere approssimate da una distribuzione normale (teorema del limite centrale).
18 distribuzione normale Una v.c. con media e varianza 2 (parametri della distribuzione) ha una distribuzione normale se la sua densità è data da dove: costante = 3, deviazione standard scarto dalla media elevato al quadrato base di logaritmi naturali = 2,183...
19 Rappresentazione grafica della distribuzione normale con media = 3 e varianza 2 = 4 distribuzione normale
20 proprietà distribuzione normale 1. la distribuzione normale è una distribuzione continua, con valori compresi tra - e + ; 2. la curva da essa descritta è simmetrica rispetto alla media (punto di ordinata massima): 3. per valori di X che vanno a - oppure a + la curva tende a zero senza mai toccare l’asse delle ascisse (la probabilità di ottenere valori “molto” lontani dalla media è “molto bassa”); 5. presenta due punti di flesso in corrispon- denza a - e + , punti in cui la curva da convessa diventa concava. 4. è crescente per valori di X che vanno da - a , decrescente per i valori da a +
21 ruolo dei parametri e (1/2) è la media della normale (la punta della campana) è un indicatore di posizione. Il suo variare “sposta” la campana sulla retta dei valori è la varianza è un indicatore di dispersione, è legata all’”apertura” della campana (valori più alti indicano distribuzioni più disperse). …
22 ruolo dei parametri e (2/2) Variazioni di Variazioni di
23 distribuzione normale standardizzata Si tratta di una distribuzione semplificata, e che consente di tabulare i valori di probabi- lità in apposite tavole; si ottiene mediante una trasformazione dei dati con la formula di conseguenza la funzione di densità diventa: con = 0 e = 1.
24 proprietà distribuzione normale standardiz- zata 1. la distribuzione normale standardiz- zata è una distribuzione continua, con valori compresi tra - e + , con media zero e deviazione standard 1; 2. la curva da essa descritta è perfettamente simmetrica rispetto al punto di ordinata massima: 3. per valori di X che vanno a - oppure a + la curva tende a zero senza mai toccare l’asse delle ascisse; 5. presenta due punti di flesso in corrispon- denza a -1 e +1, punti in cui la curva da convessa diventa concava. 4. è crescente per valori di X che vanno da - a 0, decrescente per i valori da 0 a +
25 tavole della normale I valori delle aree della distribuzione normale standardizzata sono tabulati in apposite tavole; tali tavole vengono utilizzate per due scopi: a) per calcolare l’area compresa tra due determinati valori della variabile studiata; b) per determinare la proporzione di punteggi compresi tra due valori di una variabile casuale (distribuita normalmente)
26 la tavola della normale
27 esempio 3 z = 0z = 1,96 Supponiamo di voler calcolare l’area compre- sa tra le ordinate z = 0 e z = 1,96.
28 la tavola della normale L’area compresa tra z = 0 e z = 1,96 è 0,475
29 esempio 4 z = -1z = +1 Supponiamo di voler calcolare l’area compre- sa tra le ordinate z = -1 e z = +1
30 esempio 4 (2) z = 0z = +1 Dalla lettura della tavola rileviamo che l’area compresa tra z = 0 e z = +1 è pari a 0,3413; z = -1 z = 0 dal momento che la curva è simmetrica e centrata sullo zero, l’area compresa tra z = -1 e z = 0 sarà identica e pari anch’essa a 0,3413; per ottenere l’area cercata sarà sufficiente sommare le due aree: 0, ,3413 = 0,6826 0,6826
31 esempio 5 Data una serie di 500 punteggi distribuiti normalmente con media 100 e deviazione standard 15, si stimi quanti possano essere i punteggi compresi tra 88 e 130. calcoliamo i punti zeta corrispondenti a 88 e 130, che saranno:
32 esempio 5 (2) z = -0,8z = 0 dalla lettura delle tavole ricaviamo che l’area compresa tra z = -0,8 e z = 0 è pari a 0,2881; z = 0z = +2 l’area compresa tra z = 0 e z = +2 è 0,4772; z = -0,8z = +2 l’area complessiva tra z = -0,8 e z = +2 sarà 0, ,4772 = 0,7653; tale valore 0,7653 può essere letto sia come proporzione dei casi compresi tra i valori 88 e 130, sia come la probabilità che il punteggio di un soggetto cada all’interno di tale intervallo; in conclusione, per ottenere il numero di punteggi che ci si attende nell’intervallo com- preso tra 88 e 130 si calcola:
33 distribuzione chi-quadrato Si tratta di una distribuzione continua con densità data dalla relazione: dove: costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1 gradi di libertà della distribuzione
34 distribuzione chi-quadrato = 1 Quando = 1 il grafico della curva è
35 distribuzione chi-quadrato = 2 Quando = 2 il grafico della curva è
36 distribuzione chi-quadrato = 3 Quando = 3 il grafico della curva è
37 proprietà 1.distribuzione 2 1. la distribuzione 2 è una distribuzione continua, con valori compresi tra 0 e + ; al crescere dei gradi di libertà la curva tende ad assumere la forma della normale; dato che la v.c. 2 è generata da una somma dei quadrati di n valori indipen- denti di una v.c. normale standardizzata, quando tali valori non sono indipendenti è necessario stabilire le condizioni che li vincolano; sottraendo ad n tali vincoli, si ottiene il numero di gradi di libertà, cioè il numero di valori, tra loro indipendenti, della v.c. normale standardizzata.
38 distribuzione t di Student Si tratta di una distribuzione continua con densità data dalla relazione: dove: costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1 gradi di libertà della distribuzione
39 distribuzione t di Student = 1 Quando = 1 il grafico della curva è
40 distribuzione t di Student = 10 Quando = 10 il grafico della curva è
41 proprietà 1.distribuzione t 1. la distribuzione t è una distribuzione continua, con valori compresi tra - e + ; si rivela particolarmente utile nello studio di fenomeni casuali relativi a campioni piccoli (n < 30); 3. = n il valore dei gradi di libertà è dato da = n 4. con la distribuzione tende alla distribuzione normale
42 distribuzione F di Snedecor Si tratta di una distribuzione continua con densità data dalla relazione: dove: costante tale da assicurare che l’area delimitata sotto la curva sia pari a 1 gradi di libertà della distribuzione
43 distribuzione F di Snedecor 1 = 2 2 = 4 Quando 1 = 2 e 2 = 4 il grafico della curva è
44 distribuzione F di Snedecor 1 = 4 2 = 4 Quando 1 = 4 e 2 = 4 il grafico della curva è
45 distribuzione F di Snedecor 1 = 12 2 = 12 Quando 1 = 12 e 2 = 12 il grafico della curva è
46 proprietà 1.distribuzione F 1. la distribuzione F è una distribuzione continua, con valori compresi tra 0 e + ; si dimostra che il rapporto tra due varianze campionarie si distribuisce con questa forma; 3. 1 = 1 2 3. con 1 = 1 e 2 la distribuzione tende alla normale standardizzata 4. 1 = 1 2 = 4. con 1 = 1 e 2 = la distribuzione è uguale alla distribuzione t di Student 5. 1 = 2 5. con 1 = e 2 la distribuzione tende a quella del 2