Identificabilità a priori: esperimento “ideale”

Slides:



Advertisements
Presentazioni simili
Corso di esperimentazione di fisica 1 Il metodo dei minimi quadrati
Advertisements

Come organizzare i dati per un'analisi statistica al computer?
Dipartimento di Economia
Approssimazione e convergenza
Intervalli di confidenza
Proprietà degli stimatori
Parametri dinteresse IUT Nice – Côte dAzur Département STID 6 Janvier 2006 Sondages Corso di campionamento.
La teoria di portafoglio: cap.7-9
ANALISI DELLA COVARIANZA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11
Metodi Quantitativi per Economia, Finanza e Management Lezione n°6.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°8
Metodi Quantitativi per Economia, Finanza e Management Lezione n°9.
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 11.
redditività var. continua classi di redditività ( < 0 ; >= 0)
Ipotesi e proprietà dello stimatore Ordinary Least Squares (OLS)
Inferenza statistica per un singolo campione
Valutazione delle ipotesi
Weighted least squares. Covarianza con Spazio delle misurazioni (N dimensionale): variabili non deterministiche sottoposte a errore di misura. Es. coordinate.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
MODELLO DI REGRESSIONE LINEARE MULTIPLA
Dip. Economia Politica e Statistica
Processi Aleatori : Introduzione – Parte I
Appunti di inferenza per farmacisti
Metodi Quantitativi per Economia, Finanza e Management Lezione n° 9.
Sistemi di equazioni lineari
Corso di biomatematica lezione 6: la funzione c2
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
CORSO DI MODELLI DI SISTEMI BIOLOGICI LAUREA IN INGEGNERIA CLINICA E BIOMEDICA.
INGEGNERIA CLINICA E BIOMEDICA
STATISTICA a.a PARAMETRO t DI STUDENT
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Valutazione della stima: gli intervalli di confidenza
Stima dei parametri di una distribuzione
Determinazione Orbitale di Satelliti Artificiali Lezione 5
Lezione 8 Numerosità del campione
Num / 36 Lezione 9 Numerosità del campione.
Teoria degli errori.
Analisi della varianza
Quale valore dobbiamo assumere come misura di una grandezza?
Regressione Logistica
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Le distribuzioni campionarie
TRATTAMENTO DEI DATI ANALITICI
Errori casuali Si dicono casuali tutti quegli errori che possono avvenire, con la stessa probabilità, sia in difetto che in eccesso. Data questa caratteristica,
Test parametrici I test studiati nelle lezioni precedenti (test- t, test-z) consentono la verifica di ipotesi relative al valore di specifici parametri.
La teoria dei campioni può essere usata per ottenere informazioni riguardanti campioni estratti casualmente da una popolazione. Da un punto di vista applicativo.
STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5 Analisi Bivariata I° Parte.
La verifica d’ipotesi Docente Dott. Nappo Daniela
Lezione B.10 Regressione e inferenza: il modello lineare
Un insieme limitato di misure permette di calcolare soltanto i valori di media e deviazione standard del campione, ed s. E’ però possibile valutare.
Corso di Analisi Statistica per le Imprese
Strumenti statistici in Excell
IL CAMPIONE.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5.
Def : uno stimatore è una statistica T n le cui determinazioni servono a fornire delle stime del parametro ignoto  della v.c. X in cui sono state effettuate.
Intervallo di Confidenza Prof. Ing. Carla Raffaelli A.A:
FILTRI ANALOGICI E DIGITALI Modulo del Corso Integrato di: Progetto di Circuiti per il Trattamento dei Segnali.
Intervalli di confidenza
Elaborazione statistica di dati
TRATTAMENTO STATISTICO DEI DATI ANALITICI
La covarianza.
Operazioni di campionamento CAMPIONAMENTO Tutte le operazioni effettuate per ottenere informazioni sul sito /area da monitorare (a parte quelle di analisi)
DATA MINING PER IL MARKETING (63 ore) Marco Riani Sito web del corso
Regressione semplice e multipla in forma matriciale Metodo dei minimi quadrati Stima di beta Regressione semplice Regressione multipla con 2 predittori.
1 DISTRIBUZIONI DI PROBABILITÁ. 2 distribu- zione che permette di calcolare le probabilità degli eventi possibili A tutte le variabili casuali, discrete.
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE SEMPLICE
Statistica per l’economia e l’impresa Capitolo 4 MODELLO DI REGRESSIONE LINEARE SEMPLICE.
Transcript della presentazione:

Identificabilità a priori: esperimento “ideale” Esperimento reale: raccolta di dati sperimentali y1, y2,…,yn in corrispondenza delle variabili x1, x2,…,xn (t1, t2,…, tn) Ad ogni dato sperimentale è associato un errore sperimentale: 1, 2, …, n

In corrispondenza delle variabili x1, x2,…,xn (t1, t2,…, tn) il modello fornisce le sue previsioni: fi=f(ti,p1,p2,…,pp) Confronto tra misure e previsioni del modello: errori di misura errori nel segnale di input errori nella struttura del modello

STIMATORI Unbiasedness: la funzione di distribuzione probabilità dei vettori p è distribuita simmetricamente intorno al valore vero p0 Varianza minima: tra tutti i possibili stimatori unbiased, deve avere varianza minima: Efficienza: uno stimatore efficiente è quello che raggiunge il valore più basso della covarianza (limite inferiore di Cramer-Rao). Consistenza: Al tendere all’infinito della dimensione del campione (del numero di misure effettuate) la stima tende al valore vero p0:

HP: MODELLO LINEARE NEI PARAMETRI METODO DEI MINIMI QUADRATI e= differenza tra valore misurato e previsione del modello R = matrice di covarianza degli errori di misura. HP: MODELLO LINEARE NEI PARAMETRI Questo stimatore verifica le condizioni richieste sopra (in particolare, la varianza minima, che non è invece verificata se non c’è la matrice di covarianza). Nel caso in cui gli errori di misura sono bianchi (cioè, non correlati) la matrice di covarianza è diagonale. Se inoltre gli errori di misura sono gaussiani, allora le stime sui parametri ricavate con questo stimatore sono distribuite normalmente con media e deviazione standard come ricavate dal fit. E’ quindi possibile fare tutta una serie di considerazioni di tipo statistico riguardanti la bontà del fit e gli intervalli di confidenza.

METODO DEI MINIMI QUADRATI Squared sums of the weighted residuals (objective function)

modello lineare nei parametri METODO DEI MINIMI QUADRATI modello lineare nei parametri

Modello non lineare nei parametri METODO DEI MINIMI QUADRATI Modello non lineare nei parametri In questo caso, la funzione da minimizzare non è più quadratica nei parametri incogniti, e quindi quando si considerano le derivate per la minimizzazione non si ha più un sistema di equazioni lineari del prim’ordine in p: soluzioni possibili utilizzando procedure iterative. PROCEDURA PIU’ COMUNE: Algoritmo di Levenberg-Marquardt Metodo delle approssimazioni quadratiche Metodo della massima pendenza (steepest descent)

Metodo delle approssimazioni quadratiche ALGORITMO DI LEVENBERG-MARQUARDT Metodo delle approssimazioni quadratiche Approssimazione della funzione obiettivo in un intorno di un dato set di valore del vettore dei parametri p dove b è un vettore p-dimensionale legato al gradiente della funzione obiettivo, e A una matrice di dimensioni pxp

Metodo delle approssimazioni quadratiche Metodo della steepest descent ALGORITMO DI LEVENBERG-MARQUARDT Metodo delle approssimazioni quadratiche Si valutano i valori dei componenti di A e b in corrispondenza di un determinato valore pj del vettore dei parametri, e si calcola poi pj+1=pj+A-1b Metodo della steepest descent In questo caso l’incremento in ogni iterazione si calcola pj+1=pj+c·b ove c è una opportuna costante. Il primo metodo più efficace vicino al minimo, il secondo metodo più efficace lontano dal minimo.

METODO DELLA MASSIMA VEROSIMIGLIANZA Questo metodo richiede in anticipo una conoscenza di qual è la distribuzione di probabilità attesa per i risultati delle misure. Al processo di raccolta dei dati sperimentali va associata una FUNZIONE DI DISTRIBUZIONE DI PROBABILITA’, che sarà in qualche modo dipendente dai parametri del modello: L(y, p). Dato un set di misure y1, y2,…, yn, viene quindi ricercato il valore dei parametri che rendono massima la probabilità di ottenere quei valori misurati: Lo stimatore ML possiede tutte le proprietà asintotiche richieste nel caso in cui le misure sono statisticamente indipendenti, ma questo non è garantito nel caso di numero piccolo di misure.

METODO DELLA MASSIMA VEROSIMIGLIANZA Nel caso in cui la funzione di probabilità è gaussiana, allora la funzione da massimizzare risulta la seguente: essendo R la matrice di covarianza degli errori, che nel caso siano tutti indipendenti è diagonale e quindi: I due metodi coincidono, e quindi anche nel caso di modelli non lineari valgono le proprietà asintotiche dello stimatore ML.

DISTRIBUZIONE DEL CHI-QUADRATO Si consideri una serie di misure (x1,…,xn) rappresentative di una popolazione con valore vero μ e con varianza σ. Si definisce chi- quadrato: Funzione di distribuzione di probabilità per ν gradi di libertà ove: Γ(x+1) = xΓ(x); Γ(1) = 1 Γ(1/2) = All'aumentare dei gradi di libertà, la distribuzione del chi-quadrato tende alla distribuzione normale.

DISTRIBUZIONE DEL CHI-QUADRATO

DISTRIBUZIONE DEL CHI-QUADRATO SI DIMOSTRA CHE, SE LE OSSERVABILI SONO DISTRIBUITE NORMALMENTE, IL VALORE MINIMO ASSUNTO DA SSWR E' DISTRIBUITO COME UNA VARIABILE χ2 CON (n-p) GRADI DI LIBERTA’ POSSIBILITA' DI VALUTARE IN MANIERA STATISTICA LA BONTA' DEL FIT.

DISTRIBUZIONE DEL CHI-QUADRATO SI DIMOSTRA CHE, SE LE OSSERVABILI SONO DISTRIBUITE NORMALMENTE, IL VALORE MINIMO ASSUNTO DA SSWR E' DISTRIBUITO COME UNA VARIABILE χ2 CON (n-p) GRADI DI LIBERTA’ POSSIBILITA' DI VALUTARE IN MANIERA STATISTICA LA BONTA' DEL FIT. Nel caso dell'analisi compartimentale, sono stati sviluppati degli indicatori appositi che permettono di avere informazioni sulla bontà del fit, ma che in particolare sono utili per confrontare tra loro strutture compartimentali "concorrenti": AIC (Akaike Information Criterion): uMIN + 2n SC (Schwarz Criterion): uMIN + n·ln(N)

Criterio di convergenza Come varia il peso associato ad un dato sperimentale a seconda delle opzioni scelte ERRORE ESPRESSO COME SD=d FSD=f Dati Modello Dati Modello ASSO LUTO RELA TIVO

allora si considera soddisfatto il criterio di convergenza. Modello di varianza In ogni iterazione, il programma cerca valori dei parametri che risultano in una diminuzione del valore della funzione obiettivo. Se, per ogni parametro, la differenza tra il valore assunto dal p nella i-esima iterazione e quello assunto nella iterazione precedente verifica la relazione: allora si considera soddisfatto il criterio di convergenza.

RESIDUI: CHIQUADRO: Iniettato Ingerito Residuo Chiquadro Residuo Chiquadro 0.147 0.022 0.202 0.041 -0.735 0.540 -0.356 0.127 0.365 0.133 0.622 0.387 0.965 0.931 0.114 0.013 -0.335 0.112 0.246 0.061 0.653 0.426 0.160 0.026 0.039 1.52e-3 0.517 0.267 -0.286 0.082 0.101 0.010 -1.876 3.519 -0.233 0.054 1.090 1.188 -1.436 2.062 0.476 0.227 0.494 0.244 1.882 3.542 -0.748 0.560 10.724 3.851 14.575

CHI QUADRO Chiquadro calcolato: 14.575 Numero di gradi di libertà: numero di dati sperimentali meno numero di parametri determinati: 24-7 = 17 Chiquadro ridotto: 0.857 Probabilità: 62.88 % (0.8: 70%; 1.0: 45%)