Presentazione Attività di Ricerca Secondo periodo – Aprile-Settembre 2008 02 Ottobre 2008.

Slides:



Advertisements
Presentazioni simili
DI3 – Dip. Ing.Industriale e dell’Informazione
Advertisements

Materiale di supporto all’insegnamento di ELABORAZIONI IMMAGINI 1
Macchine di Percezione
Corso di Percezione Robotica (PRo) A. A. 99/00 B
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
Ombre e riflessioni in tempo reale
BUMP MAPPING dott.ing.jun Alex Zupan –
SVILUPPO DI UN METODO DI CALIBRAZIONE DI UN SISTEMA STEREOSCOPICO PER LA MISURA DELLA LARGHEZZA DI PRODOTTI PIANI LAMINATI A CALDO Laureando: MASSIMO DAL.
Cinematica diretta Un manipolatore è costituito da un insieme di corpi rigidi (bracci) connessi in cascata tramite coppie cinematiche (giunti). Si assume.
Visione Stereo & Geometria Epipolare
SEGMENTAZIONE DELLE IMMAGINI
Annotazione Automatica di materiale multimediale
Support Vector Machines
V.Caglioti - Autolocalizzazione
Costruzione di Interfacce Lezione 4 Sistemi di riferimento e trasformazioni
Costruzione di Interfacce Lezione 4 Nozioni di geometria per la grafica
Costruzione di Interfacce Lezione 4 Geometria per la grafica
Università degli Studi di Padova
Structure from motion Corso Visione e percezione a.a.2008/2009
Tesine per il corso visione e percezione: Struttura e temi.
Università degli Studi di Roma “Sapienza” Facoltà di Ingegneria Laurea Magistrale in Ingegneria Informatica Tesina del Corso di Visione e Percezione A.A.
Scene Modelling, Recognition and Tracking
PLATES RECOGNITION Part II
“Riconoscimento di Facce”
“Riconoscimento Targhe Automobilistiche” Parte II: Clustering e Riconoscimento Caratteri (implementazione MATLAB) Studenti: Damaggio Elettra Firmani Donatella.
PROFESSORESSA STUDENTI F. Pirri D. G. Ferriero V. Virili TUTOR M. Pizzoli RICOSTRUZIONE METRICA 3D DI UN OGGETTO RIPRESO DA PIÙ VISTE CON LA STESSA TELECAMERA.
Applicazioni progettuali di grafica computerizzata a.a. 2008/2009 Rendering grafico.
Isometrie del piano In geometria, si definisce isometria
Elaborazione (digitale) delle immagini
Analisi di Immagini e Dati Biologici
Lima 3D FASE 1 Durata: 1 mese (avviamento del progetto) FASE 2
Infomatica Grafica a.a DICGIM – University of Palermo Dipartimento di Ingegneria Chimica, Gestionale, Informatica e Meccanica Environment Mapping.
Strutture periodiche discrete: introduzione del vincolo di periodicità e studio della ricostruzione da due proiezioni. A. Del Lungo, A. Frosini, M.Nivat,
Un motion planner per guide multimediali interattive
Le proiezioni e la prospettiva
Efficient Region- Based Image Retrieval di Roger Weber e Michael Mlivoncic Swiss Federal Institute of Technology (ETH) Presentazione di Laura Galli, Mauro.
Un approccio soft per i primi tre anni della primaria
Papagna Sabino Flavia Camoes
Analisi e realizzazione software
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
Multimedia Information Retrieval
Enver Sangineto, Dipartimento di Informatica Annotazione Automatica di materiale multimediale.
Multimedia information retrieval. Problematica Materiale multimediale: non solo testo, ma audio (speech, musica..) immagini, video Retrieval basato su.
Daniele Marini, Maurizio Rossi
Texturing - Tessiture Daniele Marini.
Le proiezioni e la prospettiva
Le proiezioni e la prospettiva
Sul problema del gamma Daniele Marini.
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
Università degli Studi di Cagliari
Controllare le proiezioni
Corso di Programmazione Grafica e Laboratorio Daniele Marini
Controllare la prospettiva
Ombre e riflessioni in tempo reale Daniele Marini Parzialmente tratte de: Haines-M ö ller Corso di Programmazione Grafica aa2005/2006.
Visione Artificiale Ing. Roberto Vezzani a.a
Un approccio soft per i primi tre anni della primaria
LABORATORIO DI ANALISI AVANZATA DEI DATI Andrea Cerioli Sito web del corso ESTENSIONI DEL MODELLO DI REGRESSIONE LINEARE MULTIPLA.
Progetto MIUR SPA.DA. Riunione Genova 7 Giugno 2002.
Visione e Percezione progetto conclusivo “Human recognition : A BIOMETRICAL APPROACH ” Simone Balsanelli Adriano Cerocchi.
La geometria nel secondo ciclo
Analisi di Immagini e Dati Biologici Edge detection and sharpening L7 38.
Distanze Per riconoscimento di un oggetto in un’immagine si intende la sua assegnazione ad una classe di equivalenza prefissata. Il riconoscimento può.
A proposito di spazio scala e di altre features locali... Elisabetta Delponte
Trasformata di Hough.
RILIEVO FOTOGRAFICO E rilievo speditivo
Analisi della similarità tra immagini.
Daniele Marini Con contributi di Maurizio Rossi
Esempio di riconoscimento biometrico
Teoria computazionale della visione Marcello Demi CNR, Institute of Clinical Physiology, Pisa, Italy.
Transcript della presentazione:

Presentazione Attività di Ricerca Secondo periodo – Aprile-Settembre Ottobre 2008

Obiettivi progetto 1.Studio di fattibilità ed analisi dei requisiti; ricerca e definizione di sistemi di acquisizione, telecamere e sistema di illuminazione più adatto allo scopo; studio dello stato dellarte negli algoritmi e nelle librerie software per il pick and place 2.Studio e sviluppo di algoritmi di visione per lindividuazione della posizione e rotazione nel 3D (o 2D ½) del pezzo per calcolo del punto di pick; 3.studio e sviluppo di algoritmi per lindividuazione dellingombro dei contenitori dei manufatti 4.studio di segmentazione e localizzazione dei pezzi anche in caso di due oggetti adiacenti o parzialmente sovrapposti 5.Realizzazione di un primo sistema prototipale e campagna di test 6.Estensione al caso di gruppi di pezzi sovrapposti e sviluppo di librerie invarianti alla dimensione e forma dei pezzi 7.Realizzazione di un sistema prototipale e campagna di test fatto (periodo 1) fatto (periodo 2)

Ricostruzione 3D

Ricostruzione 3D Problemi ancora da affrontare: La presenza in alcuni casi di picchi non corretti dovuti alla mancanza di match corretto tra le due viste; verranno studiati metodi per eliminarle o tollerarle La gestione di parti poco riflettenti, come il nero, o troppo riflettenti (come specchio o superfici lucide), nonché la gestione delle parti contenenti dei liquidi

Segmentazione oggetti complessi Che approccio utilizzare? Segmentazione basata sullapparenza/colore Colori non unici Apparenza molto confusa e occlusioni Segmentazione basata sui contorni Occlusioni Contrasti non evidenti e riflessi Segmentazione basata su modello 3D completo Modello 3D complesso da acquisire Computazionalmente oneroso Segmentazione basata su feature matching e trasf. geometriche Robusto a rotazione, scaling, luminosità, ecc. Veloce (pochi punti, non immagine completa o modello 3D) Feature matchate devono essere correlate Segmentazione non completa, ma a punti

Nostro approccio I metodi di segmentazione feature-based implementano i seguenti passi: Feature extraction Feature matching Calcolo trasformazione geometrica tra modello e immagine SIFT

Feature extraction: SIFT SIFT (Scale Invariant Feature Transform) – Lowe 2004 I passi principali dellalgoritmo SIFT sono i seguenti: 1.Scale-space extrema detection: questo passo ricerca i massimi su tutte le scale e tutte le locazioni spaziali. Viene implementato efficientemente utilizzando le DoG (Difference of Gaussians) per identificare punti di interesse invarianti alla scala e allorientazione. 2.Keypoint localization: per ogni punti di massimo trovato, un modello dettagliato viene utilizzato per determinare la locazione e la scala. I keypoint selezionati alla fine sono scelti sulla base di una misura di stabilità. 3.Orientation assignment: ad ogni keypoint vengono assegnate una o più orientazioni, sulla base delle direzioni del gradiente in un intorno del keypoint. Tutte le operazioni fatte successivamente sul keypoint vengono fatte rispetto alla direzione, scala e locazione assegnate al keypoint, garantendo quindi invarianza a queste caratteristiche. 4.Keypoint descriptor: vengono calcolati i gradienti locali alla scala selezionata e in un intorno del keypoint. Questi vengono poi trasformati in una rappresentazione che permette distorsioni locali della forma e cambi di illuminazione.

Scale-space extrema detection

Scale-space extrema detection

Ricerca massimi nello scale-space Oltre a cercare i massimi in un intorno Elimino i punti con basso contrasto Elimino i punti sugli edge

Ricerca massimi nello scale-space Keypoint risultanti

Calcolo orientazione dei keypoints Calcolo modulo e orientazione del gradiente Si calcola listogramma delle orientazioni, quantizzato per 36 direzioni Il picco dellistogramma e gli altri picchi entro l80% del picco maggiore sono scelti come direzione principale del keypoint. Se ne risultano più di uno (e ciò succede in media il 15% delle volte), si crea un keypoint per ciascuna direzione principale. Queste direzioni multiple contribuiscono significativamente alla stabilità del matching. Il descrittore viene calcolato su un intorno di 16 x 16 orientato in modo concorde alla sua direzione principale. Questo intorno viene suddiviso in 16 matrici 4 x 4 e per ciascuna listogramma dellorientazione del gradiente discretizzato su 8 bin (4x4x8=128 valori).

Matching dei keypoints Semplice distanza Euclidea tra i descrittori a 128 valori Per aumentare la robustezza vengono scartati tutti i match per cui il rapporto tra la distanza del match migliore e la distanza del secondo match migliore è maggiore di 0.8. Questo permette di evitare match falsi dovuti allo sfondo o ad altri oggetti nella scena.

Trasformate geometriche

Trasformata proiettiva o omografica Colleziono tutti i punti e con SVD o MLE stimo i 9 parametri della trasformata

Trasformata proiettiva o omografica Usando direttamente tutti i punti per la trasformazione ho due tipi di problemi: Match sbagliati Match corretti ma su oggetti diversi

Trasformata omografica con RANSAC Allora abbiamo usato il RANSAC (dettagli sul report)

Trasformata Euclidea Necessità di distinguere (clusterizzare) match di oggetti diversi keypoint punto caratterizzante vettore spostamento keypoint matchato proiezione punto caratterizzante vettore spostamento ruotato MODELLOOGGETTO

Alcuni risultati (il resto dal vivo …)

Difetti … del SIFT 1.Il SIFT, come la maggior parte di questi metodi, si basa sul gradiente, quindi sul fatto che gli oggetti di interesse presentano parti texturate con un buon contrasto. Se questo non è vero i keypoints ottenuti sono troppo pochi e non affidabili; 2.Il SIFT ha dimostrato di avere una limitata robustezza ai cambi di luminosità localizzati, ad esempio dovuti ai riflessi dei flowpacks ; 3.Il nostro approccio considera di confrontare limmagine corrente con un modello delloggetto da cercare. Sebbene questo nel nostro caso sia inevitabile (volendo creare un sistema flessibile e non vincolato ad un solo oggetto), se il modello non è sufficientemente rappresentativo delle situazioni possibili il nostro approccio diventa inaffidabile; 4.Il SIFT, per costruzione, ottiene sempre solo un match per ciascun keypoint del modello; questo significa che nel caso di oggetti poco texturati i pochi keypoints ottenuti sul modello rischiano di essere suddivisi sulle varie istanze delloggetto presenti nellimmagine corrente e non essere sufficienti per segmentarli tutti.

Sviluppi (quasi-)futuri MULTI-MODELLO: Copie multiple da fondere Varie faccie: mutualmente esclusive MULTI-MATCH: Correggere il problema del SIFT del match 1-a-1

Integrazione 3D Come integrare segmentazione e 3D? Altezza solo nei punti di prelievo! Abbiamo davvero bisogno di prelevare il più alto? O solo quelli non coperti da altri?