“Studio e implementazione di algoritmi di regressione robusta con applicazione alla stima del rumore nelle immagini mammografiche ” di Ciotoli Michele Università degli Studi di Roma “ Tor Vergata ” Laurea Specialistica in Ingegneria Elettronica, A.A. 2006/2007 RELATORE Prof. Marcello Salmeri CORRELATORE Prof.ssa Arianna Mencattini
Indice Cancro al seno e Mammografia Rumore nelle Mammografie Stima della varianza di rumore Problemi affrontati Conclusioni
Cancro al seno e Mammografia La mammografia è l’esame diagnostico più importante per la diagnosi del Cancro al seno Con oltre di nuovi casi ogni anno, è la seconda forma di cancro più diffusa al mondo! (International Agency for Research on Cancer, Word Cancer Report 2003) In Italia è la prima causa di morte per le donne tra i 35 ed i 44 anni e la seconda per le donne oltre i 55.Secondo l’AIRC (Associazione Italiana per la ricerca sul cancro) il tumore al seno colpisce 1 donna su 10 e rappresenta il 25% dei tumori che colpiscono le donne. Purtroppo la prevenzione primaria risulta impossibile dal momento che le cause sono ad oggi sconosciute LA DIAGNOSI PRECOCE E LO SCREENING PERIODICO SONO LE ARMI PIÙ EFFICACI PER COMBATTERE IL TUMORE!
Cancro al seno e Mammografia Anomalie identificabili in un mammogramma: Masse Microcalcificazioni Proprietà di assorbimento dei raggi X simili a quelle del tessuto sano Proprietà intrinsecamente superiori ma dimensioni ridotte
Cancro al seno e Mammografia L’interpretazione dei mammogrammi è molto difficile! È stato ipotizzato che i mammogrammi mostrino solo il 3% dell’informazione! Il 10-30% delle lesioni non viene identificato in fase di screening! In circa i 2/3 dei casi le lesioni sono evidenti a posteriori Elaborazione dell’immagine per migliorarne la qualità Scarso contrasto tra aree sospette e tessuto ghiandolare che le circonda Dimensioni minute per quanto riguarda le microcalcificazioni Dimensioni e forme variabili e natura sfumata delle masse Fattori umani In fase di screening la maggior parte dei mammogrammi è normale.
Il rumore nelle mammografie In fase di diagnosi, ogni minimo particolare della mammografia può essere determinante per identificare l’esistenza di patologie. Anche un rumore di bassa intensità come quello presente nei mammogrammi può mascherare dei dettagli importanti diminuendo il contenuto informativo dell’immagine quando i dettagli devono essere evidenziati. A tale scopo nelle varie fasi dell’elaborazione è inclusa una fase di stima ed eliminazione del rumore. Non c’è un evidente rumore e neanche i dettagli sono così evidenti I dettagli devono essere messi in risalto Practice guideline for digital radiography, Tech. Rep. ACR American College of Radiology. 2007
Il processo di formazione dell’immagine determina la natura dei fenomeni rumorosi: Assorbimento di Fotoni Fluttuazione del numero di fotoni in arrivo (rumore di Poisson) Scattering fotonico (eliminabile) Rumore elettronico (gaussiano indipendente dal segnale) Nella mammografia classica esistono componenti di rumore introdotte dallo scanner durante il processo di digitalizzazione. X-ray Source Detector Modello generale: Il rumore nelle mammografie Termine indipendente dal segnale
Il rumore nelle mammografie Nella maggior parte dei lavori presenti in letteratura si fa l’approssimazione di considerare il rumore come caratterizzato da una statistica gaussiana e omoscedastico (cioè a varianza costante) Il rumore nel nostro caso ha delle caratteristiche statistiche che variano con l’intensità, in particolare la sua varianza varia con essa (eteroscedasticità) Un particolare tipo di rumore in cui la varianza non è unica ma dipende dall’intensità è il rumore di Poisson: Processo gaussiano di varianza unitaria e media nulla Purtroppo nel nostro caso il rumore di Poisson non basta a descrivere la statistica del rumore presente in queste immagini ma il modello sarà molto più complesso come vedremo più avanti nei risultati
Richiedono una stima della varianza del rumore 2 ! VisuShrink SUREShrink BayesShrink Il rumore nelle mammografie Esistono vari metodi di thresholding in un contesto wavelet, utilizzato in questo tipo di immagini, tutti hanno la particolarità di richiedere la stima della varianza del rumore.
Low-Pass Filter Edge detector Threshold Negative Signal Dependent Noise Variance Estimation Original Image Stima della varianza di rumore Mascherature dell’immagine P.Gravel,B.Gilles,and J.A.De Guise, “ A method for modeling noise in medical images,”IEEE Transactions in medical images vol.23,no. 10,pp ,Oct.2004 Matteo Arnò,“Stima e riduzione del rumore di Poisson nelle immagini radiografiche”, Università degli studi di Roma Tor Vergata, tesi di laurea
Nk=Nk= N,k = med|N k – med(N k )| Divisione dell’asse in 100 intervalli (bin) Ripetendo per k = 1…100 Varianza Intensità Normalizzata k-esimo intervallo errori corrispondenti Stima della varianza di rumore La stima della deviazione standard relativa al k- esimo intervallo di intensità è calcolata tramite uno stimatore robusto
Problemi affrontati 1) Come ci aspettiamo i dati distribuiti in ogni bin? I dati ce li aspettiamo distribuiti secondo una gaussiana In realtà Ci può essere una presenza di code che altera il modello gaussiano Alterando soprattutto media e varianza
Problemi affrontati Il secondo problema affrontato si è messo in evidenza una volta effettuata la stima in tutti gli intervalli e costruita la risultante mappa intensità-varianza 2) Ci si potrebbe aspettare una relazione funzionale semplice Si evidenzia un legame funzionale Non c’è il legame funzionale precedente
Stima della varianza nei bin N,k = med|N k – med(N k )| Nella formula lo stimatore robusto si basa su una costante che moltiplica il Mad(Median Absolute Deviation) MAD (Median Absolute Deviation), IQR (Interquartile Range) STD (Standard Deviation), AAD (Average Absolute Deviation) Perché usiamo il MAD? Stimatori di varianza
Stima della varianza di rumore L’operatore mediano è insensibile agli outlier Per esempio: Dato un vettore Ordinamento dei dati Mediano Media 3 La media è molto sensibile all’outlier Svantaggio del metodo: Onere computazionale dell’ordinamento dei dati! Necessità di utilizzarlo: L’IQR funziona solo se gli outlier sono in entrambe le code ma siccome non possiamo saperlo a priori preferiamo usare il MAD
Stima della varianza di rumore Effettuata la stima nei bin otteniamo una mappa intensità-varianza e costruiamo una curva che lega le due variabili. Fitting lineare: 2 = 1 I + 2 Per caratterizzare lo sparpagliamento dei dati, abbiamo pensato di assegnare un peso ai dati Intensità Normalizzata Varianza
Scelta dei pesi Applichiamo a ciascuno dei 100 intervalli in cui abbiamo diviso l’asse normalizzato dei livelli di grigio il test del chi quadro Il test del chi quadro indica se una distribuzione è simile ad una distribuzione assegnata Facendo l’ipotesi che i pixel sono distribuiti secondo una distribuzione gaussiana La probabilità in uscita dal test viene usata come peso per i punti luminanza- varianza
Eliminazione delle code Probabilità bassa per la presenza di code Aumento della probabilità La distribuzione dei dati non è una gaussiana E’ molto più vicina ad essere una gaussiana La gaussiana del test deviava fortemente dalla gaussiana attesa per la presenza di code
Applicazione dei pesi Regressione lineare Regressione pesata
Applicazione dei pesi Cubic smoothing spline Spline pesata C. De Boor, A Practical guide to splines. Springer 2001.
Altri risultati delle simulazioni Spline pesata
Altri risultati delle simulazioni Spline pesata
Altri risultati delle simulazioni Spline pesata
Conclusioni E’ stato implementato un algoritmo robusto di stima della varianza dipendente dall’intensità dei pixel nelle immagini considerate I nuovi dati sulla varianza saranno utilizzati in una successiva fase di denoising Questo algoritmo può essere applicato ad altri contesti in cui i segnali sono affetti da rumore con caratteristiche dipendenti dal segnale stesso Lo stesso algoritmo ottiene ottimi risultati anche nel caso più semplice in cui il rumore ha caratteristiche di omoscedasticità.