Le distribuzioni di probabilità continue Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio Le distribuzioni di probabilità continue Giovanni Filatrella (filatrella@unisannio.it) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Distribuzioni continue Supponiamo di far ruotare un ago dando una spinta iniziale tale che farà molti giri prima che l’attrito lo fermerà. Qual è la probabilità che si fermi ad un angolo x? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Distribuzioni di probabilità per variabili continue Definiamo una variabile casuale x una variabile che può assumere diversi valori, per semplicità in un intervallo: x: xMinx xMax Ognuno di questi valori con probabilità f(x). Una variabile casuale si dice continua perché i valori che può assumere, cioè le x, non sono numerabili, cioè non si possono mettere in corrispondenza biunivoca con un insieme di indici interi, ma solo con un sottoinsieme dei numeri reali. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Attenzione a non confondere i seguenti 4 concetti: x è il simbolo che denota la variabile casuale x denota anche i valori che la variabile può assumere La f(x) è la densità di probabilità, non la probabilità. La probabilità che la variabile casuale assuma un valore all’interno di un intervallo è data dalla densità di probabilità tramite la formula: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Variabili continue: limite del caso discreto Supponendo di misurare una variabile continua per passi discreti, si può solo definire l’appartenenza di un individuo ad una classe. La distribuzione è approssimata con un istogramma. L’ampiezza delle classi è Dx La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)Dx. Variabili continue: limite del caso discreto f(x) xi x Dx G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Richiamo del significato di integrale f(x) L’integrale è l’area sottesa dalla funzione f(x) xMIN xMAX x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Uso dell’integrale nelle distribuzioni continue f(x) L’integrale è la probabilità che la variabile casuale assuma un valore in un intervallo e dipende dalla densità di probabilità f(x) x1 x2 x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Domande D1: Quanto vale l’area in giallo sotto la curva nella figura precedente? D2: Se si chiedesse la probabilità che una variabile continua assuma un valore specifico quanto vale? D3: Qual è il legame con gli istogrammi D4: Per la variabile casuale della roulette (la trasparenza 2) com’è fatto il grafico della densità di probabilità? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esercizio Come si interpreta il picco nella figura precedente? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
La distribuzione uniforme nel caso continuo 1/(2p) La densità di probabilità è identica per tutto l’intervallo L’altezza si trova dalla condizione che la probabilità totale sia 1 2p x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Valore aspettato per variabili continue prob di avere x Somma Variabili discrete G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Varianza per variabili continue probabilità di x Scarto quadratico Somma Variabili discrete G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Confronto del caso continuo e discreto L’integrale è approssimato con un istogramma. L’ampiezza delle classi è Dx (per Dx 0 si ottiene proprio l’integrale). La probabilità corrispondente ai valori discreti xi è l’area del rettangolo f(x)dx. Confronto del caso continuo e discreto f(x) xi x Dx G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esercizi *In base a questa corrispondenza trovare le formule per il valore aspettato e la varianza nel caso discreto a partire da quelle del caso continuo. **Trovare il valore aspettato della variabile casuale con distribuzione uniforme. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Carl Friedrick Gauss (1777 - 1855) Gentile concessione della Deutsche Bundesbank G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Distribuzione di Gauss-Laplace o “Normale” La distribuzione di Gauss ha due parametri, m e s, che la descrivono completamente: Caso m=0 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Altri casi di gaussiane con diversi valori aspettati -3 -1 1 +3 +5 0 +2 +4 +6 +8 Caso m=1 Caso m=4 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Distribuzione normale: interpretazione grafica dei parametri 0.68 è il valore in corrispondenza del massimo + s è un flesso - s è un flesso L’area fra m-s e m+s è 0.68 m 2s G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Distribuzione normale: significato dei parametri I parametri che appaiono nella formula della distribuzione gaussiana non a caso coincidono con i simboli di valore aspettato e varianza: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Quadro riassuntivo delle proprietà della gaussiana f(x): Normalizzazione: f(x) dx = 1 Simmetria attorno al valore aspettato: f(x-m)=f(m -x) Ha un massimo per x=m Ha un flesso per x=m+s e x=m-s Il valore aspettato è: E[x]=m La varianza è: Var[x]=s2 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Calcolo delle probabilità distribuite gaussianamente Se una variabile ha distribuzione gaussiana è completamente individuata dai parametri m e s. Supponiamo di avere m=2 e s=2.5, e che ci si chieda la probabilità che 1 x 5. Come si può procedere? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Soluzione Risolvendo l’integrale: Che equivale a trovare l’area: -8 -3 2 7 12 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Calcolo della soluzione Purtroppo l’integrale non è calcolabile esplicitamente, cioè non esiste una funzione semplice che permetta di valutarlo. Esistono delle tavole che riportano alcuni valori di quest’integrale per m=0 e s =1. Da questi valori si possono i corrispondenti valori per m e s arbitrari. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Tavola dell’integrale gaussiano C. Cametti, A. Di Biasio: “Introduzione all’elaborazione dei dati sperimentali” , Tabella I, p. 327 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Nomenclatura La z si chiama “variabile standardizzata”. Essa rappresenta il caso particolare di variabile gaussiana di media nulla e deviazione standard unitaria. Per trasformare una qualsiasi variabile gaussiana in quella standardizzata occorre dunque cambiare la variabile in modo che diventi a) a valore aspettato nullo b) a varianza unitaria. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Il cambiamento di variabile: 1) spostare il valore medio Per trovare questo cambiamento dobbiamo dunque avere: 0 m x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Il cambiamento di variabile: 2) cambiare la larghezza Per trovare questo cambiamento dobbiamo dunque avere: -s -1 0 +1 +s x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Sommario della procedura: Conoscere valore aspettato e deviazione standard della variabile originaria x Conoscere i limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa. Trasformare questi limiti nei limiti z1 e z2 della variabile standardizzata (z): Trovare la probabilità che la variabile standardizzata sia compresa fra questi limiti. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Esempio di calcolo di probabilità con una variabile gaussiana Supponiamo di avere m=2 e s=2.5, e che ci si chieda la probabilità che 1 x 5. In formule: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Applicazione del calcolo ad un caso specifico: Valore aspettato e deviazione standard della variabile originaria x: E[x]=2 Var[x]=2.5 I limiti x1 e x2 entro i quali si vuole trovare la probabilità che la variabile casuale sia compresa: x1=1 e x2 =5 I limiti z1 e z2 della variabile standardizzata (z): La probabilità che la variabile standardizzata sia compresa fra questi limiti: 0.885-0.656+0.5=0.729 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Tavole della gaussiana standardizzata Tavole come quella allegata non sono tavole per integrali con intervalli arbitrari. In particolare nella tabella si è riportata a: che è la probabilità da - a z (distribuzione cumulativa di probabilità). Come è stata calcolata la probabilità per un intervallo arbitrario? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Costruzione per ottenere l’area per differenza La probabilità che z sia compreso fra z1 e z2 si può trovare dalla probabilità che sia minore di z1 e minore di z2: z1 z2 x G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Un’estensione delle tavola Come si trovano le probabilità corrispondenti a valori negativi della variabile? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Un caso particolarmente importante Supponiamo di chiederci quale sia la probabilità che la variabile standardizzata sia compresa fra –1 e +1. Consultando la tavola si trova: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Proprietà delle gaussiane Si può tradurre il risultato precedente in un fatto generale: “per qualsiasi distribuzione gaussiana la probabilità di trovare un valore della variabile fra m-s ed m+s è il 68%” Osservazioni: Questa proprietà è tipica solo delle gaussiane, non di altre distribuzioni; E’ un metodo per trovare s dal grafico. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
Applicazione di questa proprietà Il risultato precedente si può rappresentare matematicamente come: ed analogamente si può dimostrare che: G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Esempio per m=14 e s =3 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali
G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Domande Qual è la probabilità di trovare la variabile casuale fra m-s ed m+s per una distribuzione uniforme? Da un grafico di una gaussiana di cui non si conosce la deviazione standard, come la si potrebbe determinare? G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali