Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica

Slides:



Advertisements
Presentazioni simili
Metodo di Calcolo Numerico per Equazioni differenziali Ordinarie
Advertisements

DI3 – Dip. Ing.Industriale e dell’Informazione
Corso di Percezione Robotica (PRo) A. A. 99/00 B
Informatica Generale Susanna Pelagatti
2. Introduzione alla probabilità
6. Catene di Markov a tempo continuo (CMTC)
Introduzione Cosa sono le reti di Petri?
ODE PROBLEMA DI CAUCHY IN 1-D Sia f : I x RR, I  R.
Elettrostatica 3 23 maggio 2011
1 Istruzioni, algoritmi, linguaggi. 2 Algoritmo per il calcolo delle radici reali di unequazione di 2 o grado Data lequazione ax 2 +bx+c=0, quali sono.
6. Catene di Markov a tempo continuo (CMTC)
Metodi Quantitativi per Economia, Finanza e Management Lezione n°5
Trasformazioni nel dominio spaziale
Teoria e Tecniche del Riconoscimento
Filtro di smoothing Gaussiano
Apprendimento Non Supervisionato
Enver Sangineto, Dipartimento di Informatica Multimedia Information Retrieval.
V.Caglioti - Autolocalizzazione
INFERENZA NEL MODELLO DI REGRESSIONE LINEARE MULTIPLA (parte 1)
Processi Aleatori : Introduzione – Parte I
Visione Artificiale La visione del robot può essere definita come il processo di estrazione, caratterizzazione e interpretazione delle informazioni provenienti.
Strumentazione per bioimmagini
BIOINGEGNERIA S. Salinari Lezione 4.
Algoritmi per l’Image Alignment
Apprendimento di movimenti della testa tramite Hidden Markov Model
Corso di Laurea in Comunicazione Digitale Corso di Realtà Virtuali - a.a. 2009/10 Prof. Paolo Pasteris Tutor: Stefano Baldan Bouncing Balls Obiettivo:
CONTROLLO DI SUPPLY CHAIN MEDIANTE TECNICHE H-INFINITO E NEGOZIAZIONE
SOLUZIONE DELLO STRATO LIMITE SU UNA PARETE PIANA
Riconoscimento automatico di oggetti in immagini digitali
Elaborazione (digitale) delle immagini
Analisi di Immagini e Dati Biologici
Il calcolo di radiosity
Modellazione di terreni a risoluzione adattiva
Misure di trasporto elettronico (Effetto Hall)
Elementi di Informatica di base
Esercizio 10.* Un cassiere vuole dare un resto di n centesimi di euro usando il minimo numero di monete. a) Descrivere un algoritmo goloso per fare ciò.
Illuminamento e Shading
Presentazione Attività di Ricerca Secondo periodo – Aprile-Settembre Ottobre 2008.
Efficient Region- Based Image Retrieval di Roger Weber e Michael Mlivoncic Swiss Federal Institute of Technology (ETH) Presentazione di Laura Galli, Mauro.
Matematica della visione
Effetti fotorealistici
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
Multimedia Information Retrieval
Enver Sangineto, Dipartimento di Informatica Annotazione Automatica di materiale multimediale.
Multimedia information retrieval. Problematica Materiale multimediale: non solo testo, ma audio (speech, musica..) immagini, video Retrieval basato su.
Texturing - Tessiture Daniele Marini.
DIPARTIMENTO DI ELETTRONICA E INFORMAZIONE Lab 8 – Info B Marco D. Santambrogio – Riccardo Cattaneo –
Approssimazione di derivate
Superfici nascoste Daniele Marini.
Sul problema del gamma Daniele Marini.
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
DIGITALIAZZAZIONE Di Alessio.
Laurea Ing EO/IN/BIO;TLC D.U. Ing EO 6 PULSE CODE MODULATION (PCM)
Variabili Numeriche –Interi (byte, short, int, long): complemento a 2 –A virgola mobile (float, double): IEEE 745 Alfanumeriche –Carattere (char): Unicode.
Didattica e Fondamenti degli Algoritmi e della Calcolabilità Terza giornata: principali classi di complessità computazionale dei problemi Guido Proietti.
Analisi di Immagini e Dati Biologici Edge detection and sharpening L7 38.
A proposito di spazio scala e di altre features locali... Elisabetta Delponte
Trasformata di Hough.
Trasformata di Fourier
Esercitazione 5 Corso di Elaborazione e Trasmissione delle Immagini Pisa, 27 ottobre 2004.
Esempio di riconoscimento biometrico
HMM in Image Analysis Francesco Finazzi Lezione /04/2008.
1 Lezione IX seconda parte Avviare la presentazione col tasto “Invio”
L’analisi di regressione e correlazione Prof. Luigi Piemontese.
Trattamento delle immagini numeriche Marcello Demi CNR, Institute of Clinical Physiology, Pisa, Italy.
Teoria computazionale della visione Marcello Demi CNR, Institute of Clinical Physiology, Pisa, Italy.
Modello di Marr (1982) Il sistema visivo analizzerebbe in maniera sequenziale 3 tipi di rappresentazione prima di identificare l’oggetto –Immagine –Primal.
Gli Indici di VARIABILITA’
Lezione n. Parole chiave: Corso di Laurea: Insegnamento: Docente: A.A Salvatore Cuomo La ricorsione 15 Approccio ricorsivo, esercizi sulla.
Operatori differenziali
Transcript della presentazione:

Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica

Recupero di immagini attraverso la forma In unimmagine, più che il colore o la texture, ciò che più caratterizza un oggetto è la sua forma I sistemi di Content Based Image Retrieval (CBIR) che trattano la forma accettano come query: –immagini desempio –disegni stilizzati (sketch) –…

Ese.: query by sketch

Pre-processing: estrazione dei bordi La forma di oggetto in unimmagine può essere data da: –la sagoma (e. g., i punti interni di unimg binaria) –I bordi (interni e/o esterni)

Immagini binarie (semplice)

Immagine non binaria…

Estrazione dei contorni da immagini non binarie I contorni (bordi) interni e/o esterni di un oggetto sono normalmente contraddistinti da discontinuità luminose (transizione tra superfici diverse) Individuando le discontinuità (un cambiamento brusco dellintensità di grigio dei pixel) è possibile rilevare i bordi e quindi la forma degli oggetti di unimmagine

Estrazione di contorni tramite operatori differenziali Unimmagine I può essere vista come una funzione a due variabili I(x,y): I: R 2 -> R (sorvoliamo per ora sulla discontinuità di I)

Gradiente di unimmagine Il gradiente G di I nel punto (x,y) è: G(x,y) punta nella direzione di massima crescita di I in (x,y)

Rappresentazione alternativa Se: Allora: dove: –r(p) è lintensità del gradiente in p e –φ(p) è la sua direzione

Interpretazione grafica del gradiente in un punto

Approssimazioni del gradiente Il gradiente può essere calcolato utilizzando delle maschere (operatori) con cui si effettua la convoluzione con I In pratica, le maschere sono delle matrici di coefficienti (e.g., 3X3) con cui pesare lintensità dei pixel nellintorno di p in una somma pesata che dà Gx(p) e Gy(p)

Operatore di Sobel Maschera per Gx Maschera per Gy

Rappresentazioni del gradiente Iterando il processo per tutti i pixel p di I possiamo rappresentare i valori di G(p) (o D(p)) con nuove immagini: –I r (p) = r(p) –I Gx (p) = G x (p) –I Gy (p) = G y (p)

Esempio Maschera per contorni verticali Maschera per contorni orizzontali I Gx (p) G x =15 G y =-13 r |Gx|+|Gy| = 28 = arctg(-13/15) I Gy (p)

I r : esempio I r (p) = 0 in un intorno di p, I è costante

I r : esempio [2]

I r : esempio [3]

Punti di edge Binarizzando opportunamente I r è possibile ottenere una seconda immagine E, detta edge map E rappresenta i punti con gradiente più elevato in modulo, ovvero i punti di bordo (edge points) di I

Esempio

Esempio [2]

Shape Retrieval: Principali approcci Approccio statistico Approccio tramite template matching (deformabile)

Approccio statistico Si stabiliscono delle feature per rappresentare la forma degli oggetti tramite punti nello spazio delle feature R n La distanza (e.g., Euclidea) tra punti in R n corrisponde alla similarità percepita dallutente

Ese. di feature (semplice) Data la sagoma (img binaria) di unoggetto, calcolo: –Larea, –Il perimetro, –La compattezza (rapporto perimetro 2 / area), –…

Coefficienti di Fourier del bordo esterno

Esempio

Momenti digitali Supponiamo che S sia il risultato di una binarizzazione di I: S = {(x,y): I(x,y) < th} Per ogni coppia di interi non negativi (j,k), il momento digitale (j,k)-esimo di S è dato da: E facile constatare che M 00 (S) corrisponde allarea di S

Momenti digitali [2]

Vantaggi e svantaggi dell'approccio statistico Possibilità di indexing Dubbio potere discriminante (spesso le feature usate sono poco discriminanti) Gli oggetti devono essere completamente isolabili (problema di segmentazione)

Template Matching Deformabile Gli approcci di questo filone si basano sul tentativo di far allineare lo sketch disegnato dall'utente con (una porzione de-) l'immagine attualmente analizzata dal sistema

Template Matching Deformabile [2] L allineamento avviene deformando iterativamente lo sketch iniziale per adattarlo come se fosse un elastico ai bordi degli oggetti delle immagini in memoria Il processo iterativo termina: –quando si raggiunge una sovrapposizione accettabile (successo), oppure: –quando il grado di deformazione supera un certo valore massimo (fallimento)

Esempio immagine presa da: Del Bimbo, Pala, Visual Image Retrieval by Elastic Matching of User Sketches, IEEE PAMI 1997

Esempio: Elastic Matching (Del Bimbo-Pala) Le immagini vengono inserite nel DB del sistema nella forma contenente solo gli edge (pre-processing) L'utente disegna il suo sketch usando un tool grafico e la sagoma finale viene rappresentata con una spline codificata mediante i suoi punti di controllo: P = (p 1,..., p n ), p i = (x i, y i )

Elastic Matching [2] Se la sovrapposizione tra i pixel dello sketch e quelli dei bordi dell'immagine candidata è elevata, la procedura termina qui Altrimenti, i vari p i vengono perturbati in modo da modificare lo sketch e re- iterare la comparazione

Misura di matching Più esattamente, la bontà del matching tra lo sketch P e l'immagine I è definita da: M(P,I) = C(P,I) - D(P,I), dove: C() e D() sono delle funzioni, rispettivamente, del grado di sovrappozione e di deformazione dello sketch Il modo più semplice per ottenere C(P,I) è contando il numero di pixel dello sketch (definito da P) e dellimmagine che sono sovrapposti

Misura di matching [2] D(P,I) = S(P,I) + B(P,I), dove: S() e B() sono funzioni del grado di tensione e di curvatura dello sketch

immagine presa da: Del Bimbo, Pala, Visual Image Retrieval by Elastic Matching of User Sketches, IEEE PAMI 1997

Ricerca dei massimi della funzione di matching

Metodi iterativi

Metodo del gradiente ascendente

Elastic Matching: riassunto dellalgoritmo Per ogni immagine I del DB: –Proietto lo sketch fornito dallutente su I rappresentandolo tramite linsieme P(0) dei punti di controllo di una spline –Per ogni iterazione k: Utilizzo il metodo del gradiente ascendente per calcolare P(k+1) da P(k) Mi fermo quando trovo un massimo locale M(P(h),I) –Dal valore raggiunto M(P(h),I) decido se I contiene lo sketch oppure no

Elastic Matching: problemi aperti La convergenza dipende fortemente dalla soluzione iniziale P 0 : –non è invariante rispetto a roto-traslazioni e cambiamenti di scala –segmentazione manuale di tutti i possibili oggetti di interesse nelle immagini del DB (e.g., tramite il minimo rettangolo includente), oppure –iterazioni successive del metodo per valori diversi di P 0

Rettangolo Includente immagine presa da: Del Bimbo, Pala, Visual Image Retrieval by Elastic Matching of User Sketches, IEEE PAMI 1997

Template matching deformabile: vantaggi e svantaggi No indexing Maggiore tolleranza ad occlusioni e sfondi non uniformi rispetto allapproccio statistico Problemi di segmentazione solo parzialmente risolti…

Considerazioni generali sui limiti dei sistemi content based (con query by example) Tutta linformazione che un sistema content based ha rispetto all oggetto cercato (e.g., una determinata forma visiva o segnale auditivo) deriva dalla query

Considerazioni generali sui limiti dei sistemi query by X [2] Per quanto sofisticato sia il sistema di rappresentazione o di matching è difficile distinguere le variazioni di forma lecita da quelle non lecite (rumore, altri oggetti…)

Considerazioni generali sui limiti dei sistemi query by X [3] Il cervello umano impara a distinguere la forma di un cavallo solo dopo averne visti diversi e in varie posizioni Prestazioni paragonabili per i sistemi artificiali sono probabilmente possibili solo mediante una fase di apprendimento automatico

Riferimenti Del Bimbo, Pala, Visual Image Retrieval by Elastic Matching of User Sketches, IEEE PAMI 1997 Long et al., Fundamentals of Content-based Image Retrieval, in: D. D. Feng, W. C. Siu, H. J. Zhang (Ed.),Multimedia Information Retrieval & Management-Technological Fundamentals and Applications, Springer-Verlag, New York(2003) Smeulders et al., Content-Based Image Retrieval at the End of Early Years, IEEE PAMI 2000

Domande…