Corso di biomatematica lezione 4: La funzione di Gauss

Slides:



Advertisements
Presentazioni simili
Test delle ipotesi Il test consiste nel formulare una ipotesi (ipotesi nulla) e nel verificare se con i dati a disposizione è possibile rifiutarla o no.
Advertisements

8) GLI INTERVALLI DI CONFIDENZA
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
Le distribuzioni di probabilità continue
variabili aleatorie discrete e continue
Distribuzione Normale o Curva di Gauss
Intervalli di confidenza
Proprietà degli stimatori
Stime per intervalli Oltre al valore puntuale di una stima, è interessante conoscere qual è il margine di errore connesso alla stima stessa. Si possono.
LA DISTRIBUZIONE NORMALE
2.VARIABILI CONTINUE A. Federico ENEA; Fondazione Ugo Bordoni Scuola estiva di fonetica forense Soriano al Cimino 17 – 21 settembre 2007.
Lez. 3 - Gli Indici di VARIABILITA’
Progetto Pilota 2 Lettura e interpretazione dei risultati
Distribuzione degli Errori di Misura
Valutazione delle ipotesi
Esercizi x1=m-ts x2=m+ts
DIFFERENZA TRA LE MEDIE
DISTRIBUZIONI TEORICHE DI PROBABILITA’
Distribuzioni di probabilità
Matematica e statistica Versione didascalica: parte 7 Sito web del corso Docente: Prof. Sergio Invernizzi, Università di Trieste.
Corso di biomatematica lezione 5: propagazione degli errori
Corso di biomatematica lezione 9: test di Student
Corso di biomatematica lezione 10: test di Student e test F
Corso di biomatematica Lezione 2: Probabilità e distribuzioni di probabilità Davide Grandi.
Corso di biomatematica lezione 6: la funzione c2
Corso di biomatematica lezione 7-2: Test di significatività
Corso di biomatematica Lezione 3: Distribuzioni di probabilità continue Davide Grandi.
Corso di biomatematica lezione 7: Test di significatività
STATISTICA a.a PARAMETRO t DI STUDENT
Esercizi x1=m-ts x2=m+ts
Valutazione della stima: gli intervalli di confidenza
VERIFICA DEI RIFLESSI …Tutto ciò che avreste voluto sapere e non avete mai osato chiedere… M. & D.
Num / 36 Lezione 9 Numerosità del campione.
Lezione 4 Probabilità.
Popolazione campione Y - variabile casuale y - valori argomentali Frequenza relativa: Estrazione Densità della classe i-esima: Lezione 1.
Propagazione degli errori
Corso di biomatematica lezione 3b: applicazioni di probabilità Davide Grandi.
Corso di biomatematica lezione 8: Massima verosimiglianza Davide Grandi.
PROBABILITÀ La probabilità è un giudizio che si assegna ad un evento e che si esprime mediante un numero compreso tra 0 e 1 1 Evento con molta probabilità.
METODI E CONTROLLI STATISTICI DI PROCESSO
Le distribuzioni campionarie
PROBABILITA : se un EVENTO si verifica in h modi diversi su n possibili (POPOLAZIONE) p = h/n Questa definizione è talvolta applicabile a priori (es. lancio.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
STATISTICA INFERENZIALE
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Intervalli di fiducia.
PROPAGAZIONE DEGLI ERRORI:
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
Esercizi Determinare la probabilità che, lanciando due dadi da gioco, si abbia: A: somma dei risultati maggiore di 10 B: differenza dei punteggi in valore.
“Teoria e metodi della ricerca sociale e organizzativa”
Misura di una quantità fisica
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
Intervalli di confidenza
Eventi aleatori Un evento è aleatorio (casuale) quando non si può prevedere con certezza se avverrà o meno I fenomeni (eventi) aleatori sono studiati.
La distribuzione campionaria della media
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
In alcuni casi gli esiti di un esperimento possono essere considerati numeri naturali in modo naturale. Esempio: lancio di un dado In atri casi si definisce.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
Distribuzioni limite La distribuzione normale Si consideri una variabile casuale rappresentata mediante una combinazione lineare di altre variabili casuali.
1 VARIABILI CASUALI. 2 definizione Una variabile casuale è una variabile che assume determinati valori in modo casuale (non deterministico). Esempi l’esito.
La distribuzione normale. Oltre le distribuzioni di frequenza relative a un numero finito di casi si possono utilizzare distribuzioni con un numero di.
Statistica con Excel Corso di Fisica ed Elementi di Laboratorio ed Informatica CdL Scienze Biologiche AA 2015/2016.
Introduzione alle distribuzioni di probabilità di Gauss o normale di Bernoulli o binomiale di Poisson o dei casi rari.
Introduzione all’inferenza
Transcript della presentazione:

Corso di biomatematica lezione 4: La funzione di Gauss Davide Grandi

Sommario Distribuzione di Gauss: Rappresentazione matematica integrali valor medio Stima della varianza Somma in quadratura

Distribuzioni continue Funzione di distribuzione normale o di Gauss Partendo dall’idea di distribuzioni limite, abbiamo il passaggio da una serie di valori discreti ad una funzione continua (distribuzione di probabilità). Quindi xi  f(x) quindi avremo che f(x)dx saranno le misure che cadono in un intervallo compreso tra x e x+ dx La sommatoria si sosituirà con l’integrale Davide Grandi - Dottorato in Biologia

Distribuzioni continue Funzione di distribuzione normale o di Gauss E avremo in particolare il valor medio Ed inoltre la varianza sarà Corrispondente allo scarto quadratico medio (detti ei gli scarti) Davide Grandi - Dottorato in Biologia

Distribuzione Normale Valore vero di una grandezza: quello a cui ci si avvicina sempre più facendo un gran numero di misure (vedi esempi dei dadi) Se le misure sono soggette ad errori casuali “piccoli” e posso trascurare gli errori sistematici, la loro distribuzione può assumere la forma di una campana centrata sul valore più probabile, in altre parole da funzione di distribuzione di probabilità che meglio approssima la mia distribuzione di dati può essere la funzione di Gauss: Davide Grandi - Dottorato in Biologia

Distribuzione Normale La curva è centrata sul valore x=m ed in corrispondenza di esso assume il valore La funzione è normalizzata posso partire dalla distribuzione e trovare il coefficiente di normalizzazione dalla condizione Davide Grandi - Dottorato in Biologia

Distribuzione Normale Teorema del limite centrale Le medie di campioni di dimensioni n sufficientemente grandi estratti da una popolazione comunque distribuita, seguono la legge di distribuzione normale con media m e varianza s2/n Da questo si deduce immediatamente l’importanza di studiare la distribuzione normale o gaussiana Il teorema si può utilizzare anche nel limite della somma di un numero relativamente piccolo di variabili, dell’ordine della decina Davide Grandi - Dottorato in Biologia

Distribuzione Normale Integrali della funzione L’integrale della funzione di Gauss non è risolvibile matematicamente, ma attraverso metodi numerici. La probabilità che una variabile aleatoria cada in un intervallo centrato su m (valor medio) di larghezza s è data da: Davide Grandi - Dottorato in Biologia

Distribuzione Normale Integrali della funzione Nel grafico si vede la probabilità che la mia variabile aleatoria cada in un intervallo di larghezza ts centrato sempre sul valo medio m Questo corrisponde al un limite di confidenza del 68% t=1, 95% t=2 etc. Davide Grandi - Dottorato in Biologia

Distribuzione Normale Integrali della funzione Ricapitolando: Probabilità che le misure siano comprese tra m – s e m+ s 68,27% m – 2s e m+ 2s 95,45% m –3s e m+ 3s 99,73% Davide Grandi - Dottorato in Biologia

Distribuzione Normale Distribuzione standardizzata Eseguendo la sostituzione X=(x – m)/s riduco alla stessa forma tutte le distribuzioni normali, rendendo m=0 il valor medio (distribuzione centrata nello zero) e prendo s come unità di misura, ovvero ho una distribuzione con s=1 Gli scarti x – m diventano scarti ridotti (x – m)/s e la probabilità sarà Davide Grandi - Dottorato in Biologia

Distribuzione Normale Utilizzo distribuzione standardizzata ricordiamo che ora abbiamo lo scarto standardizzato z=(x – m)/s Data una popolazione di pesci di lunghezza media m=35 cm e deviazione standard s =5 cm Calcoliamo la probabilità di avere l 40 (a destra di z=1) l<40 (a sinistra di z=1) l<25 (a sinistra di z= – 2) l 40 e l 50 (tra z=1 e z=3) l 30 e l 40 (tra z=– 1 e z=1) Davide Grandi - Dottorato in Biologia

Distribuzione Normale Utilizzo distribuzione standardizzata Sapendo che area sottesa tra m e z=+1 è 34,13% a sinistra z= – 2 2,28% Avremo…. Davide Grandi - Dottorato in Biologia

Distribuzione Normale Utilizzo distribuzione standardizzata Sapendo che area sottesa tra m e z=+1 è 34,13% a sinistra z= – 2 2,28% Avremo…. l 40 (a destra di z=1) 15,87% l<40 (a sinistra di z=1) 84,13% l<25 (a sinistra di z= – 2) 2,28% l 40 e l 50 (tra z=1 e z=3) 15,73% l 30 e l 40 (tra z=– 1 e z=1) 68,26% Davide Grandi - Dottorato in Biologia

Distribuzione Normale Applicazione alle distribuzioni discrete Molte distribuzioni discrete sono approssimate dalla distribuzione gaussiana Le distribuzioni discrete forniscono probabilità per singoli valori, cioè la probabilità di ottenere esattamente il numero x, mentre con le distribuzioni continue si calcola l’area sottesa, quindi per applicarlo a distribuzioni discrete si deve o meglio “dovrebbe” calcolare l’area sottesa nell’intervallo x 0,5 Davide Grandi - Dottorato in Biologia

Distribuzione Normale Media come migliore stima Non essendo mai nota la funzione f(x) eventualmente gaussiana, abbiamo solo a che fare con le misure (discrete) {x1, x2, x3,……xn} e vorrei arrivare alla miglior stima di X Se fossero noti X e s potrei risalire alla f(x) e quindi anche alla probabilità di ottenere i valori x1, x2, x3,……xn Ovvero per ottenere x compreso tra x1 e x+dx1 abbiamo Davide Grandi - Dottorato in Biologia

Distribuzione Normale Media come migliore stima Semplificando avremo La probabilità di ottenere l’intero insieme di N valori sarà il prodotto delle probabilità, quindi Davide Grandi - Dottorato in Biologia

Distribuzione Normale Media come migliore stima Le stime migliori per X e s sono quelle più probabili, ovvero quelle che massimizzano P(x..), cioè dobbiamo minimizzare l’esponente, quindi dovremo avere Ovvero da cui Davide Grandi - Dottorato in Biologia

Distribuzione Normale Media come migliore stima La stima migliore per s si ottiene derivando rispetto a s e ponendo la derivata uguale a zero, quindi O sostituendo il valor medio al valore vero Davide Grandi - Dottorato in Biologia

Distribuzione Normale Stima dello scarto quadratico medio Partendo da una serie di dati vogliamo confrontarci con la distribuzione gaussiana, ovvero stimare i parametri che la caratterizzano (m e s ). Ricordiamo l’errore di una singola misura: Dove zi è lo scarto dalla media della misura i-esima, al quadrato avrò Davide Grandi - Dottorato in Biologia

Distribuzione Normale Stima dello scarto quadratico medio Sommando otteniamo Divido per N otteniamo Ora abbiamo che (distribuzione gaussiana) Davide Grandi - Dottorato in Biologia

Distribuzione Normale Stima dello scarto quadratico medio Ovvero Ed infine Davide Grandi - Dottorato in Biologia

Distribuzione Normale Stima dello scarto quadratico medio Inoltre dalla relazione Deduco l’errore della media che sarà dunque E non semplicemente Davide Grandi - Dottorato in Biologia

Distribuzione Normale Somma in quadratura Per introdurre la propagazione degli errori vediamo come ad esempio stimare l’errore nella misura di una grandezza Z=X+Y date le misure delle due grandezze X e Y e le rispettive deviazioni standard sono sx e sy . Date le due distribuzioni di probabilità avremo: Davide Grandi - Dottorato in Biologia

Distribuzione Normale Somma in quadratura Essendo X e Y misurati indipendentemente, la probabilità di ottenere X e Y è data dal prodotto delle due, ovvero: Ora possiamo calcolare la probabilità di ottenere X+Y si può dimostrare che: Davide Grandi - Dottorato in Biologia

Distribuzione Normale Somma in quadratura Cioè che vale Da cui ovvero Davide Grandi - Dottorato in Biologia

Distribuzione Normale Media pesata e deviazione standard Ricordiamo la definizione IMPRECISA data della media pesata e ridefiniamola correttamente, date le incertezze si definiamo il peso wi da cui ottengo il valor medio Davide Grandi - Dottorato in Biologia Davide Grandi - Dottorato in Biologia

Distribuzione Normale Ed ottengo l’espressione dell’errore che sarà: Che per si =s si riduce a Davide Grandi - Dottorato in Biologia