La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Il Teorema del Limite Centrale Giovanni Filatrella ( )

Presentazioni simili


Presentazione sul tema: "G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Il Teorema del Limite Centrale Giovanni Filatrella ( )"— Transcript della presentazione:

1 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Il Teorema del Limite Centrale Giovanni Filatrella ( ) Elaborazione Statistica dei Dati Sperimentali Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio

2 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 2 Somma di variabili casuali La somma di variabili casuali uniformemente distribuite tende ad essere fortemente piccata: + ++…

3 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 3 Somma di variabili casuali normali: La somma di variabili casuali normali sembra non cambiare forma funzionale: + ++…

4 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 4 Teorema del limite centrale (Gauss) Date n variabili casuali X 1,X 2,…,X n, ognuna con valore aspettato 1, 2,…, n, e varianza 1, 2,…, n, se i valori aspettati e le varianze sono finite, la somma delle variabili casuali X= i X i tende ad essere Gaussiana per N, qualunque sia la distribuzione delle X i, con valore medio: E[X]= i E[ X i ] e varianza Var[X]= i Var[ X i ]

5 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 5 Alcune importanti precisazioni sul teorema del limite centrale 1.Il teorema è vero nel limite di infinite variabili, quindi si può applicare anche alle distribuzioni discrete; 2.Per distribuzioni gaussiane la somma di variabili gaussiane è esattamente gaussiana, con valore aspettato la somma dei valori aspettati e varianza la somma delle varianze; 3.Il teorema non dice (in questa forma) quale sia la velocità della convergenza, cioè per quale valore finito del numero di variabili si ottiene lapprossimazione gaussiana entro una tolleranza predeterminata.

6 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 6 Limite gaussiano della distribuzione binomiale La distribuzione normale può essere concepita come il limite a cui tende la distribuzione binomiale per un valore fisso di p e N. Bisogna però stare attenti a come trasformare una variabile discreta in una variabile continua

7 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 7 Gaussiana e Binomiale Mera sostituzione dei valori Formula corretta di trasformazione

8 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 8 Formula per lapprossimazione di una distribuzione binomiale in una distribuzione gaussiana: Si può immaginare che la somma S n di n variabili gaussiane sia approssimabile ad una funzione gaussiana per il teorema del limite centrale, quindi: a e b, - < a < b< +,

9 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 9 La distribuzione di Gauss si applica a molti sistemi Esempio: il numero di galassie in un determinato volume delluniverso. Se si considerano zone sufficientemente ampie delluniverso, ogni volume contiene un numero di galassie che è distribuito gaussianamente attorno ad un valore medio.

10 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 10 La distribuzione gaussiana e la genetica Se si misura laltezza degli individui di un determinato sesso si trova che listogramma è ben approssimato da una curva gaussiana: Distribuzione (in pollici) delle altezze di 9593 donne di età fra i 21 ed i 75 anni Data come from the Health and Nutrition Examination Survey I (HANES I). On U.S. civilian population between 1971 and 1974.

11 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 11 Il dilemma di Galton Domanda: Come mai succede? Francis Galton, medico e scienziato inglese ( ) che studiò sperimentalmente la questione della distribuzione delle altezze, si chiedeva: se da un lato la distribuzione normale deve essere causata dalla somma di molte e piccole variabili indipendenti, dallaltro sappiamo che i fattori ereditari sembrano essere determinanti nellaltezza di un individuo, e questi sono solo due, come può essere che si osserva un andamento gaussiano?

12 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 12 Il dilemma risolto Se assumessimo che laltezza degli individui sia controllato in larga misura da un solo gene, lobiezione di Galton sarebbe corretta. Infatti se assumessimo che uno specifico gene controllasse laltezza degli esseri umani, poiché ogni genitore contribuisce con un allele, avremmo solo quattro possibili risultati. La moderna formulazione è che molti geni contribuiscono alla determinazione di un carattere quale laltezza. Questi geni possono causare effetti la cui ampiezza è diversa. Così se rappresentiamo ogni gene con una variabile casuale X i, che può assumere 4 valori, laltezza sarà la somma di tutte queste variabili casuali: H = X 1 + X 2 + …+ X N e H sarà quindi distribuita gaussianamente

13 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 13 Legame fra statistica e probabilità Statistics: Given the information in your hand, what is the box? Probability: Given the information in the box, what is in your hand? da: Statistics, Norma Gilbert, W.B. Saunders Co., 1976


Scaricare ppt "G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 Il Teorema del Limite Centrale Giovanni Filatrella ( )"

Presentazioni simili


Annunci Google