Distribuzioni di probabilità Sia X una variabile aleatoria discreta definita su uno spazio campionario S : f (x) = P (‘X=x’ ) P(‘XA’)=
Valore atteso di una variabile aleatoria discreta Esempio: Distribuzione di probabilità del numero di episodi di otite media nei primi 2 anni E(X)=0(.129)+1(.264)+2(.271)+3(.185)+4(.095)+5(.039)+6(.017)=2.038 x 1 2 3 4 5 6 P(‘X=x’) .129 .264 .271 .185 .095 .039 .017
Varianza (della popolazione) di una variabile aleatoria discreta Esempio:
Funzione di distribuzione cumulativa La funzione di distribuzione cumulativa (c.d.f.) di una variabile aleatoria è indicata con F(X ) ed è definita da F(x ) = P(‘X x’) Esempio F(x) = 0 se x < 0 F(x) = .129 se 0 x < 1 F(x) = .393 se 1 x < 2 F(x) = .664 se 2 x < 3 ………….. …………….
Rappresentazione grafica della c.d.f. Funzione a scalino = step function
Distribuzione di probabilità continua Si riferisce a una variabile aleatoria continua definita su un sottoinsieme S di R: = area sotto il grafico di f di base A
Distribuzione normale: formula indica la media della popolazione indica la deviazione standard della popolazione
Distribuzione normale: m=3, s=1
La probabilità che cada in un intervallo centrato sulla media di raggio z volte la deviazione standard dipende solo da z, da cui segue la regola empirica. z non è necessariamente un intero. Esempio: la media della altezza di un uomo adulto è 70 inches e s=4.0 inches. In base alla regola, 0.95 è la probabilità che un uomo adulto scelto a caso abbia un altezza compresa fra 62 e 78 inches.
Sia X una v. a. continua normale con media m e deviazione standard s:
Funzione di distribuzione cumulativa 0 F(x) 1; Monotona crescente
Quando trattiamo un campione di dati provenienti da una serie di misure e riteniamo che i dati siano distribuiti secondo una normale, se decidiamo di associare alla nostra stima una incertezza pari a una deviazione standard confidiamo che l’effettivo valore della grandezza misurata giaccia nell’intervallo da noi definito con una probabilità del 68%.
Distribuzione binomiale Si applica a variabili aleatorie che possono assumere solo 2 valori: ad esempio, un certo evento si verifica oppure no. Possono quindi essere codificate con 0 e 1. La distribuzione binomiale descrive il possibile numero di volte che la variabile assume il valore 0 (rispettiv. 1) in una sequenza di osservazioni, sapendo che la probabilità di verificarsi di 0 in una osservazione è p.
Distribuzione binomiale La probabilità di k successi in n prove indipendenti sapendo che la probabilità di successo in 1 prova è p:
Lancio della moneta Ad esempio, lanciando 4 volte una moneta equa sappiamo che P(‘Zero T’)=1/16 P(‘esatt. 1 T’)=4/16 P(‘esatt. 2 T’)=6/16 P(‘esatt. 3 T’)=4/16 P(‘esatt. 4 T’)=1/16 Se la moneta non è equa ma T ha probabilità p: P(‘k T su n prove’)=
Distribuzione binomiale: grafico
Esempio Nell’emocromo si misura anche il numero di globuli bianchi. Questi si dividono in 5 categorie: neutrofili, linfociti, monociti e basofili. Interessa la distribuzione di neutrofili k su 100 globuli bianchi. Qual è la probabilità che su 5 cellule 2 siano neutrofili sapendo che la probabilità che 1 cellula sia un neutrofilo è 0.6?
Ricordiamo che In quanto ad ogni sottoinsieme di k oggetti è associato il suo complementare che ha n-k oggetti. Qui i sottoinsiemi di k oggetti sono tanti quanti quelli di n-k oggetti.
Esempio dei neutrofili
sampling distribution Quando una statistica eseguita su una campione stima un parametro della popolazione, la stima dipende dal campione e ci si pone la domanda quanto la stima è prossima al valore del parametro della popolazione. Così la media campionaria, una proporzione campionaria sono variabili aleatorie e possiedono una distribuzione: sampling distribution
la proporzione di individui che votano per la lista A la percentuale di donne facenti parte di una giuria il numero medio di carcerati già condannati ad una pena detentiva su un campione di 100 detenuti del carcere XY
Distribuzione campionaria di medie campionarie La media è una variabile che cambia da campione a campione. La media della distribuzione campionaria è uguale a m, cioè, misurandola su campioni di dimensione n al tendere del numero dei campioni all’infinito la media delle medie campionarie tende alla media della popolazione m.
Errore di campionamento Errore standard La deviazione standard della distribuzione campionaria di si chiama errore standard. Vale la formula: Errore di campionamento m -
Teorema centrale del limite La distribuzione campionaria di un campione random tende ad una distribuzione normale al tendere della dimensione del campione all’infinito.
Osservazioni: La approssimata normalità della distribuzione campionaria delle medie si applica indipendente dal tipo della distribuzione della popolazione!!!