Lezione 4 Probabilità
Nella prima parte ... La definizione frequentista della probabilità: P La definizione classica della probabilità: P La definizione assiomatica della probabilità: assiomi di Kolmogoroff P A
P A Nella seconda parte… Una funzione di probabilità P è una funzione di insieme che: ha per dominio lo spazio degli eventi A , ha per codominio l’intervallo [ 0, 1 ] , soddisfa i 3 assiomi di Kolmogoroff P A se E1 , E2 , … , En , ... è una sequenza di eventi mutamente esclusivi dello spazio degli eventi A e se l’evento unione di tali eventi appartiene allo spazio degli eventi A, allora la probabilità dell’evento unione è pari alla somma delle probabilità dei singoli eventi:
Variabile casuale definizione: La variabile casuale X è una funzione avente come dominio lo spazio campione S e come codominio la retta reale, fissato che sia lo spazio di probabilità ( S, A, P [ ● ] ) in cui si opera. requisito: l’insieme di tutti gli elementi s Î S tali che la loro immagine X(s) sia minore di un determinato x Î R deve essere un evento. x2 Þ E = { s1, s3 }
Variabile casuale “Mappatura” di S (C,C) 0 (T,C) 1 (C,C) 2
Popolazione oggetto Si definisce “popolazione oggetto” l’insieme di tutti quegli elementi che hanno in comune almeno una caratteristica. Una popolazione oggetto può essere finita o infinita a seconda che sia composta da un numero finito o infinito di elementi (persone, oggetti, misure, osservazioni, …) Limitiamo il nostro interesse a quelle caratteristiche comuni agli elementi della popolazione oggetto che sono classificabili come “grandezze misurabili” (numerali, razionali, strumentali, selettive, complesse).
Dalla popolazione oggetto alla variabile casuale Caratteristica comune della popolazione oggetto con dimensione fisica Misure della caratteristica comune della popolazione oggetto con unità di misura adimensionale Valori della variabile casuale X
Dallo spazio campione alla retta reale tramite la variabile casuale definizione: La variabile casuale X è una funzione avente come dominio lo spazio campione S e come codominio la retta reale, fissato che sia lo spazio di probabilità ( S, A, P [ ● ] ) in cui si opera. convenzione: Indicheremo con X(s) la variabile casuale e con x i valori che essa assume
Sommario I modelli della popolazione oggetto I parametri dei modelli grandezza caratteristica introduzione ai modelli della popolazione oggetto funzione “di probabilità cumulativa” funzione “densità di probabilità” variabili casuali discrete variabili casuali continue I parametri dei modelli i valori attesi i quantili La distribuzione normale la distribuzione di Gauss la distribuzione normale “standardizzata”
parte 3 (segue) Le funzioni di probabilità
Modelli della popolazione oggetto Le funzioni di probabilità, cioè la densità di probabilità fX ( x ) e la distribuzione cumulativa di probabilità FX ( x ), sono “modelli matematici” con cui si cerca di descrivere la popolazione oggetto per quanto è attinente al valore (della misura) della caratteristica comune.
Variabili casuali continue
Funzione di distribuzione cumulativa La “funzione di distribuzione cumulativa FX ( x )” può essere concepita sia con riferimento a variabili casuali discrete, sia con riferimento a variabili casuali continue. In entrambi i casi la FX ( x ): ha per dominio l’asse reale, per codominio l’intervallo chiuso [ 0 , 1 ], ed è definita come: FX ( x ) = P [ X £ x ] = P [ { s : X ( s ) £ x } ]
Funzione di distribuzione cumulativa La funzione di distribuzione cumulativa FX ( x ), nel caso di una variabile casuale X di tipo continuo, presenta un andamento diverso da quello già visto nel caso discreto:
Funzione di densità di probabilità definizione: Data una variabile casuale continua X si dice “ funzione di densità di probabilità di X ” o “ funzione di densità ” quella funzione fx ( x ) per cui: FX (x) ricordiamo che se X è discreta: la funzione di distribuzione cumulativa FX ( x ) è legata alla funzione di densità discreta fX dalla relazione: FX (x)
Funzione di densità di probabilità La funzione di densità di probabilità fX ( x ) è una funzione da R nell’intervallo chiuso [ 0,1 ] che gode delle seguenti proprietà:
I parametri dei modelli della popolazione oggetto
Modello della popolazione Le funzioni di densità di probabilità fX ( x ) e distribuzione cumulativa FX ( x ) sono “modelli matematici” con cui si cerca di descrivere la popolazione per quanto è attinente alla caratteristica comune.
Parametri della distribuzione Le funzioni di densità di probabilità fX ( x ) e distribuzione cumulativa FX ( x ), oltre ad essere funzione della variabile X, dipendono anche da altri parametri. Questi parametri, di regola legati a quelli che si definiscono “valori attesi”, rivestono grande importanza nella caratterizzazione della forma della distribuzione. I principali parametri di una distribuzione sono: la media la varianza
Media definizione: Si definisce “media” (o “valore atteso”) della variabile casuale X la funzione: X variabile casuale continua con funzione di densità fX ( x ) X variabile casuale discreta con punti massa x1 , x2 , … , xn , … e con funzione di densità discreta fX X variabile casuale discreta con punti massa x1 , x2 , … , xn , … equiprobabili
Varianza definizione: Data una variabile casuale X con media mX si definisce “varianza” la funzione: X variabile casuale continua con funzione di densità fX ( x ) X variabile casuale discreta con punti massa x1 , x2 , … , xn , … e funzione di densità discreta fX X variabile casuale discreta con punti massa x1 , x2 , … , xn , … equiprobabili
Scarto quadratico medio definizione: si definisce “scarto quadratico medio” o “deviazione standard” la radice quadrata (positiva) della varianza:
Quantili definizione: il quantile q-esimo xq di una variabile casuale continua X è il più piccolo valore x Î R tale che F X (xq) = q
Quantili il quantile q-esimo xq di una variabile casuale continua X è il più piccolo valore x Î R tale che F X (xq) = q la definizione specifica che il quantile è “il più piccolo …” e non “il valore …” per poter avere validità sia con le variabili casuali continue sia con quelle discrete.
Quartili, percentili tra i quantili più comunemente usati vi sono i tre quartili Q1, Q2 e Q3 che hanno la caratteristica di suddividere l’area sottesa dalla funzione di densità in quattro parti uguali, di modo che ciascuna di queste parti rappresenta il 25% del totale. i percentili (o, più semplicemente, “centili”) sono quei quantili che suddividono l’area in cento parti uguali.
Distribuzione normale o “di Gauss” ( o “di Laplace” o di “De Moivre” )
Distribuzione normale o “di Gauss” definizione “classica”: una popolazione con media m e varianza s2 ha distribuzione normale se la sua densità fX ( x ) può essere espressa nella forma:
Distribuzione normale o “di Gauss” definizione “semantica”: una popolazione con media m e varianza s2 ha distribuzione gaussiana se la sua densità fX ( x ) può essere espressa nella forma:
Distribuzione normale una popolazione distribuita in modo normale su cui viene definita una variabile casuale continua X con media m e varianza s2 può essere modellata mediante una funzione di densità di probabilità fX ( x ) espressa nella forma:
Distribuzione normale la media m e varianza s2 ( o la sua radice quadrata che viene indicata come scarto quadratico medio s ) costituiscono i parametri di forma della distribuzione normale in quanto l’andamento della densità fX ( x ) viene condizionato dai valori di tali parametri: al variare del valore della media m la fX ( x ) trasla indeformata
Distribuzione normale la media m e varianza s2 ( o la sua radice quadrata che viene indicata come scarto quadratico medio s ) costituiscono i parametri di forma della distribuzione normale in quanto l’andamento della densità fX ( x ) viene condizionato dai valori di tali parametri: al variare del valore della varianza s2 la fX ( x ) si deforma
Dalla distribuzione normale alla “normale standard” teorema 2.x: se X è una variabile casuale con distribuzione normale, media m e varianza s2 , allora la variabile casuale Z ha distribuzione normale, con media nulla e varianza unitaria. La densità della Z è pertanto espressa dalla:
Dalla distribuzione normale alla “normale standard” teorema 2.x: se X è una variabile casuale con distribuzione normale, media m e varianza s2 , allora la variabile casuale Z ha distribuzione normale, con media nulla e varianza unitaria.
Dalla distribuzione normale alla “normale standard” se X è una variabile casuale con media m , varianza s2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: media mZ = 0,
Dalla distribuzione normale alla “normale standard” se X è una variabile casuale con media m , varianza s2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: media mZ = 0,
Dalla distribuzione normale alla “normale standard” se X è una variabile casuale con media m , varianza s2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: media mZ = 0, varianza var [ Z ] = 1,
Dalla distribuzione normale alla “normale standard” se X è una variabile casuale con media m , varianza s2 ed ha distribuzione normale allora la nuova variabile casuale Z che assume valore risulta avere: media mZ = 0, varianza var [ Z ] = 1,
Gli stimatori
Popolazione oggetto Si definisce “popolazione oggetto” l’insieme di tutti quegli elementi che hanno in comune almeno una caratteristica. Una popolazione può essere finita o infinita a seconda che sia composta da un numero finito o infinito di elementi (persone, oggetti, misure, osservazioni, …) La caratteristica comune agli elementi della popolazione oggetto viene, nella maggior parte dei casi, espressa da un numero che ne rappresenta il valore. Studieremo quindi popolazioni costituite da insiemi di numeri che rappresentano i valori ottenuti mediante la misurazione della caratteristica comune agli elementi della popolazione oggetto, valori che risultano distribuiti con una densita f [ ·].
Misurazione della caratteristica comune Il valore della caratteristica che accomuna gli elementi della popolazione campione può essere determinato con le più diverse procedure di misurazione: quando le misure non sono tali da procurare danni agli elementi misurati si può ipotizzare una prova “a tappeto”, ma quando le prove possono danneggiare i dispositivi la prova deve essere condotta “su di un campione”.
Gli “stimatori” Quando non è possibile individuare il valore di un parametro atteso dall’esame della distribuzione o dall’esame dell’intera popolazione retta da quella distribuzione si ricorre ad una sua stima esaminando un campione di numerosità limitata con l’ausilio di una funzione matematica detta “stimatore”.