La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Ricostruzione degli ingressi nei sistemi fisiologici

Presentazioni simili


Presentazione sul tema: "Ricostruzione degli ingressi nei sistemi fisiologici"— Transcript della presentazione:

1 Ricostruzione degli ingressi nei sistemi fisiologici
I Sistemi Positivi X Scuola Nazionale CIRA di Dottorato "A. Ruberti” Bertinoro, Luglio 2006 Ricostruzione degli ingressi nei sistemi fisiologici Giuseppe De Nicolao Dipartimento di Informatica e Sistemistica, Università di Pavia

2 Serie Temporali di Concentrazione nel Plasma
La misura delle serie temporali delle concentrazioni nel plasma di ormoni, substrati, farmaci, fornisce informazioni preziose per scopi conoscitivi, diagnostici, e terapeutici ESEMPI

3 Interpretazione Causa-Effetto
Il segnale della concentrazione nel plasma di una sostanza y(t) è interpretabile come l’uscita di un sistema che ha come ingresso il flusso di produzione della stessa sostanza u(t) INGRESSO u(t) SISTEMA USCITA y(t) concentrazione nel plasma (massa/volume) secrezione (massa/tempo)

4 Modello del Segnale di Concentrazione
Ipotesi: sistema dinamico lineare (tempo-invariante) SISTEMA g(t) y(t) u(t) secrezione concentrazione

5 Modello del Segnale di Concentrazione
Ipotesi: sistema dinamico lineare (tempo-invariante) vk + SISTEMA g(t) y(tk) + zk y(t) u(t) secrezione concentrazione serie misurata k=1, 2. …n Ws={t1 , t2 ,..., tn}

6 Ruolo della Cinetica nel Segnale di Concentrazione
SISTEMA PRONTO SISTEMA LENTO 10 u(t) 10 u(t) Secrezione massa/t 5 massa/t 5 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 1 1 0.8 g(t) 0.8 g(t) Risposta impulsiva 0.6 0.6 1/vol 0.4 1/vol 0.4 0.2 0.2 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 y(t)=g(t)*u(t) y(t)= g(t)*u(t) 0.5 1 0.4 Concentrazione 0.3 massa/vol massa/vol 0.5 0.2 0.1 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 Oss. La velocità di g(t) determina la “memoria” del sistema

7 Ruolo della Cinetica nel Segnale di Concentrazione
SISTEMA PRONTO SISTEMA LENTO 10 u(t) 10 u(t) Secrezione massa/t 5 massa/t 5 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 1 1 0.8 g(t) 0.8 g(t) Risposta impulsiva 0.6 0.6 1/vol 0.4 1/vol 0.4 0.2 0.2 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 y(t)= g(t)*u(t) 0.5 y(t)=g(t)*u(t) 1 0.4 Concentrazione e campioni rumorosi 0.3 massa/vol massa/vol 0.5 0.2 0.1 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 0.5 {zk} 1 {zk} 0.4 Serie misurata 0.3 massa/vol massa/vol 0.5 0.2 0.1 0.2 0.4 0.6 0.8 1 0.2 0.4 0.6 0.8 1 t t E’ importante studiare la secrezione, che però non è misurabile in vivo

8 Formulazione del Problema di Deconvoluzione
u(t) SISTEMA g(t) y(t) + zk vk z(tk) ? Problema di deconvoluzione: Ricostruire l’ingresso u(t) nota la risposta impulsiva g(t) e n campioni rumorosi dell’uscita su Ws={t1 , t2 ,..., tn} k=1, 2. …n

9 Deconvoluzione: un Problema Classico
Esempi: rimozione distorsioni da un segnale o misura di un segnale per via indiretta Telecomunicazioni Image restoration Geofisica Sismologia Spettroscopia Quantistica Astronomia Acustica Elettromagnetismo

10 Deconvoluzione per l’Analisi di Segnali Fisiologici
Tramite il sistema nel settembre 2004 la parola chiave “deconvolution” individuava 2310 riferimenti bibliografici in decine e decine di ambiti, es: Endocrinologia Metabolismo Farmacocinetica Elettrofisiologia / Potenziali evocati Medicina Nucleare Radiologia / Tomografia Medical Imaging / Ultrasuoni Meccanica dei Materiali Microscopia

11 Deconvoluzione: gli elementi del problema (1 di 2)
I dati griglia di campionamento Ws={t1 , t2 ,..., tn} (uniforme o non uniforme) studiata in relazione alla dinamica attesa dei segnali in gioco C-peptide time-series minutes pmol/ml 0.6 1.0 1.4 1.8 200 400 600 800 1000 1200 C-peptide in plasma minutes pmol/ml 0.0 0.3 0.6 0.9 1.2 1.5 1.8 40 80 120 160 200 240 errore di misura {vk} E[vk] = 0 E[vk2] = sk2 costante con k o no (es. CV costante), nota o no Di solito {vk} è assunto gaussiano a campioni scorrelati, per cui la matrice di covarianza di v=[v1, v2, ..., vn]T: E[vvT] = Sv è diagonale. Inoltre E[v]=0

12 Deconvoluzione: gli elementi del problema (2 di 2)
Il modello della risposta impulsiva Di solito: Approcci per dare dei valori a M e a [Ai, ai]: 1) modello di popolazione 2) modello individuale 2a) basato su un esperimento I/O (costoso, ma preciso) es. 20 40 60 80 100 120 140 160 180 5 10 15 C-peptide decay curve minutes pmol/ml g(t)= 8.52 e-0.287t e-0.081t e-0.023t NB. Poiché ci può essere variabilità intraindividuale conviene fare l’esperimento I/O subito prima dell’esperimento di deconvoluzione 2b) basato su informazioni di tipo antropometriche

13 Problemi ben-posti Nel 1924, Hadamard diede la seguente definizione di problema ben posto “Un problema è ben posto se esso possiede una e una sola soluzione e questa dipende con continuità dai dati. In caso contrario, viene detto mal posto”

14 La deconvoluzione discreta
Ipotesi (semplificative) u(t) e' causale u(t) costante a tratti sulla griglia di campionamento il campionamento è uniforme 0 t t2 t3 t4 t tn-1 tn u u2 u un y y2 y3 y4 y yn-1 yn ti=iT i=1, 2, ….n t0=0 convoluzione discreta NOTA k=0, 1, ..., n-1 INCOGNITA, DA STIMARE k=1, 2, ..., n (NB: n incognite da n dati)

15 Modello delle misure z = y+ v= Gu + v G matrice di Toeplitz
k=1, 2, ..., n z = y+ v= Gu + v G matrice di Toeplitz u=[u1, u2, …,un]T y=[y1, y2, …,yn]T v=[v1, v2, …,vn]T z=[z1, z2, …,zn]T

16 (ignora l’esistenza di v)
Raw-Deconvolution z = Gu + v G è invertibile raw-deconvolution (ignora l’esistenza di v) Implementazione algoritmica 1+2+3+…n = n(n+1)/2 moltiplicazioni complessità o(n2)

17 Prestazioni della raw-deconvolution

18 Problema reale: secrezione insulina
200 400 600 800 1000 50 100 150 250 300 raw deconvolution minutes pmol/min 0.6 0.8 1 1.2 1.4 1.6 reconvolution vs data pmol/ml -1 -0.5 0.5 % residuals min %

19 Problema reale: secrezione LH
20 40 60 80 100 120 140 160 180 -0.2 0.2 0.4 0.6 0.8 raw deconvolution minutes mUl/min 5 6 7 8 9 10 reconvolution vs data mU/ml -1 -0.5 0.5 1 % residuals min %

20 Necessità degli studi di simulazione
Usando solo dati reali è difficile valutare le prestazioni degli algoritmi di deconvoluzione (non posso confrontare û(t) con u(t) vero) problemi simulati Esempio: problemi “fisiologici” (uso generatori di serie temporali) problemi “astratti” (uso funzioni analitiche, es. Hunt)

21 Il problema simulato di Hunt (1971)
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 1.2 INGRESSO t unità di misura RISPOSTA IMPULSIVA 50 150 USCITA E CAMPIONI (n=41, SD=3)

22 100 200 300 400 500 600 700 800 900 1000 -1 -0.5 0.5 1 1.5 2 Raw deconvolution e ingresso vero del sistema t unità di misura 50 150 riconvoluzione e dati -2 residui pesati res/SD

23 E se ridefinissi il problema aumentando la frequenza di campionamento ?
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 1.2 INGRESSO t unità di misura RISPOSTA IMPULSIVA 50 150 USCITA e CAMPIONI (n=102, SD=3)

24 peggiorerebbero !!! (oscillazioni ancora più marcate)
i risultati ... 100 200 300 400 500 600 700 800 900 1000 -1.5 -1 -0.5 0.5 1 1.5 2 Raw deconvolution e ingresso vero del sistema t unità di misura 50 150 riconvoluzione e dati -2 residui pesati res/SD peggiorerebbero !!! (oscillazioni ancora più marcate) t

25 Il problema è dovuto al passaggio da tempo continuo a tempo discreto ?
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Raw deconvolution e ingresso vero del sistema t unità di misura 50 150 riconvoluzione e dati -2 -1 2 residui pesati res/SD NO !!!

26 Il mal-condizionamento
La presenza di oscillazioni spurie è dovuta al fatto che i dati sono rumorosi il problema di deconvoluzione è mal-condizionato A causa del mal-condizionamento, anche piccoli errori nei dati possono provocare grandi errori nella soluzione

27 Analisi del mal-condizionamento: Ruolo del rumore di misura
dove: è l’errore di stima. Statisticamente E[e]=0 nella varianza dell’errore c’e’ un fattore di amplificazione

28 Valutazione qualitativa del mal-condizionamento
Il mal-condizionamento è tanto peggiore quanto più è alta la frequenza di campionamento (vd. ad es. quanto mostrato tramite il problema simulato) Per due problemi di deconvoluzione con frequenza di campionamento uguale, il mal-condizionamento è peggiore per il sistema meno pronto (vd. ad es. quanto illustrato nell’esempio simulato che segue)

29 Mal-condizionamento: ruolo della cinetica
0.2 0.4 0.6 0.8 1 5 10 SISTEMA LENTO massa/t u(t) 1/vol g(t) 0.5 massa/vol y(t) {zk} t SISTEMA PRONTO

30 SISTEMA PRONTO SISTEMA LENTO
0.2 0.4 0.6 0.8 1 -10 -5 5 10 15 raw deconvolution e ingresso vero t 0.5 1.5 riconvoluzione e dati 0.1 0.3 Per due problemi di deconvoluzione con frequenza di campionamento uguale, il mal-condizionamento è peggiore per il sistema meno pronto

31 Raw-deconvolution: Lezioni
Credere “ciecamente” ai dati è sbagliato perché i dati sono affetti da rumore. Il mal-condizionamento amplifica il rumore provocando nella stime dell’ingresso degli errori, in particolar modo ad alta frequenza (ovvero oscillazioni veloci e spurie) Oss: è la soluzione del problema (vd. dimostrazione pagina seguente) La raw-deconvolution determina la stima dell’ingresso servendosi dei soli dati di misura Ciò porta a stime contaminate da ampie oscillazioni spurie e non conformi alle nostre attese sul segnale

32 Dimostrazione Poichè il primo addendo a secondo termine non dipende da û, la û che minimizza J (û) è la stessa che minimizza ed è la stessa che minimizza anche JIII, che differisce da JII per un fattore di scala 1/2. La funzione JIII(û) è nella forma che si dice quadratica. Posso allora sfruttare un noto risultato della teoria del minimi quadrati per cui Dato che G è per noi quadrata ed invertibile, si ha

33 Il metodo di regolarizzazione

34 Il metodo di regolarizzazione
IDEA (Phillips, 1962), (Tikhonov, 1963): Determinare la stima operando un compromesso tra due esigenze: spiegare i dati sperimentali ottenere una stima dell’ingresso “regolare” (smooth) aderenza ai dati regolarità della stima F è una matrice quadrata (stessa dimensione di û) costruita in modo tale che ||Fû||2 costituisca un’indice della irregolarità della stima dell’ingresso Tipicamente, F è costruita in modo che Fû fornisca il vettore delle differenze m-esime di û (m = 1, 2, ...). Ciò si ottiene ponendo: F=Dm

35 Penalizzazione differenze prime
Per rendersi conto che Fû con F=D fornisce il vettore delle differenze prime di û è sufficiente eseguire l’operazione

36 Penalizzazione differenze seconde
m=2 Per rendersi conto che Fû con F=D2 fornisce proprio il vettore delle differenze seconde di û ...

37 Come lo stimatore ûR, anche lo stimatore PT è lineare
Osservazione: Valori grandi di g privilegeranno stime che rendono piccola a scapito di stime che rendono piccola Valori piccoli di g privilegeranno stime che rendono piccolo a scapito di stime che rendono piccolo g si dice quindi parametro di regolarizzazione

38 Risultati problema Hunt con g=5000 (m=2)
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Problem Hunt (sd=3) (ST, g=5000; q=7.1031; d=2; Tw) time arbitrary units 50 150 reconvolution against data -5 5 weighted residuals res/SD

39 g=1000 (m=2) 100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Raw deconvolution e ingresso vero del sistema t unità di misura 50 150 riconvoluzione e dati -4 -3 -2 -1 2 3 residui pesati res/SD

40 g=0.1 (m=2) 100 200 300 400 500 600 700 800 900 1000 -0.5 0.5 1 1.5 Raw deconvolution e ingresso vero del sistema t unità di misura 50 150 riconvoluzione e dati -0.3 -0.2 -0.1 0.1 0.2 0.3 0.4 residui pesati res/SD

41 g è un parametro dell’algoritmo e la sua scelta è critica
g è un parametro dell’algoritmo e la sua scelta è critica. Nella pratica non posso che affidarmi a dei criteri di regolarizzazione

42 Criterio di discrepanza
(Twomey, 1965) Idea (Twomey, 1965): considerare i residui (NB: i residui dipendono da g) Poiché v= y - Gu, il vettore dei residui r può essere pensato come una stima del vettore degli errori di misura Si può ritenere ragionevole che debba valere Dipende da g Dipende dalla varianza degli errori di misura

43 Criterio di discrepanza: Regolare g in modo che
Algoritmo da usare in pratica ripeto scelgo g calcolo la stima di u per il g scelto calcolo la riconvoluzione calcolo il vettore dei residui calcolo finchè

44 Risultati Hunt con g =104 (discrepanza)
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Problem Hunt (sd=3) (ST, g= ; q= ; d=2; Twomey ) time arbitrary units 50 150 reconvolution against data -2 -1 2 weighted residuals res/SD

45 Risultati Insulina 200 400 600 800 1000 50 100 150 250 300 deconvoluted ISR (ST, g= ; q= ; d=2; Tw minutes pmol/min 0.6 0.8 1 1.2 1.4 1.6 reconvolution vs C-peptide data pmol/ml -8 -6 -4 -2 2 4 6 % residuals min %

46 Risultati LH 20 40 60 80 100 120 140 160 180 -0.2 0.2 0.4 0.6 0.8 DECONVOLUZIONE(g= ; q(g)= ; d=1; Tw) minutes mU/min 5 6 7 8 9 10 RICONVOLUZIONE E DATI mU/ml -10 -5 RESIDUI % min %

47 Il criterio di discrepanza risolve il problema ?
Il criterio di discrepanza di Twomey è intuitivo ma ha una base teorica debole Si può dimostrare che, in media, il criterio di Twomey conduce ad oversmoothing (g troppo grande) Esistono in letteratura altri criteri di regolarizzazione, ma più complicati, ad esempio: Maximum Likelihood (ML, massima verosimiglianza) Minimum Risk (rischio minimo) Generalized Cross-Validation inclusi nel software WINSTODEC

48 Regolarizzazione: problemi ancora aperti
campionamento rado / non uniforme 100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Raw deconvolution e ingresso vero del sistema unità di misura vincolo non negatività 100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 Problem Hunt (sd=3) (ST, g= ; q= ; d=2; Max Lik1) time arbitrary units

49 Campionamento non uniforme / rado
La griglia virtuale PROBLEMA: essendo partiti dalla raw-deconvolution, abbiamo sempre considerato griglia di campionamento = griglia delle stime IDEA: Disaccoppiamo la griglia di campionamento (dimensione n) da una griglia "virtuale" (dimensione N>>n) su cui discretizziamo l'ingresso ESEMPIO: griglia campionamento (non uniforme e rada) ? ? ? ? ? ? ? ? ? ? griglia “virtuale” (1 min)

50 In dettaglio Se avessi tutti i campioni sulla griglia virtuale... Eliminando le righe corrispondenti ai dati “mancanti” ... Si ottiene ...

51 Soluzione in presenza di griglia virtuale
nX1 nXN NX1 = + z G u v z = Gu + v Soluzione in forma chiusa invertibile perchè definita positiva semi-definita positiva definita positiva

52 Risultati Hunt con griglia virtuale
100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 DECONVOLUZIONE ( g= ; q(g)= ; d=2; Twomey ) time arbitrary units 50 150 RICONVOLUZIONE E DATI -2 -1 2 RESIDUI PESATI res/SD

53 Risultati insulina con griglia virtuale
200 400 600 800 1000 50 100 150 250 300 regularized deconvolution (g= , q(g)=34.07, n=115, Twomey) minutes pmol/min 0.6 0.8 1 1.2 1.4 1.6 reconvolution vs data pmol/ml -10 -5 5 10 % residuals min %

54 Risultati LH con griglia virtuale
20 40 60 80 100 120 140 160 180 -0.2 0.2 0.4 0.6 0.8 DECONVOLUZIONE(g= ; q(g)= ; d=1; Tw) minutes mU/min 5 6 7 8 9 10 RICONVOLUZIONE E DATI mU/ml -10 -5 RESIDUI % min %

55 Vincolo di non negatività
La regolarizzazione "lineare" puo' produrre stime negative IDEA: Vincolare il problema Problemi La stima diventa non lineare: Scelta di g ? Algoritmi ? Rimedi Per g uso un valore che funziona bene (quantità di regolarizzazione adeguata) nel caso lineare Come algoritmo numerico per risolvere il problema di minimo vincolato utilizzo un metodo iterativo

56 100 200 300 400 500 600 700 800 900 1000 0.2 0.4 0.6 0.8 1 DECONVOLUZIONE CON VINCOLO DI NON NEGATIVITA’ vs VERO time Unità di misura 50 150 RICONVOLUZIONE e DATI -6 -4 -2 2 4 6 RESIDUI PESATI res/SD


Scaricare ppt "Ricostruzione degli ingressi nei sistemi fisiologici"

Presentazioni simili


Annunci Google