Riconoscimento automatico di oggetti in immagini digitali

Slides:



Advertisements
Presentazioni simili
presentazione aziendale
Advertisements

Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Caduta di un corpo circolare sommerso in un serbatoio 50 cm 28 cm Blocco circolare.
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
CALENDARIO FORMAZIONE LISEM 2004/2005 Labirinto, test sul potenziale imprenditoriale 01/10/2004 (ven) h – Tecniche creative e pensiero propositivo.
1 t Mobilità internazionale e conversione dei voti Maria Sticchi Damiani Università della Calabria 8 febbraio 2013.
/ fax
I SEGRETI PER IL SUCCESSO SU LAVORO
Frontespizio Economia Monetaria Anno Accademico
1 la competenza alfabetica della popolazione italiana CEDE distribuzione percentuale per livelli.
DISEGNO TECNICO INDUSTRIALE
Lez. 3 - Gli Indici di VARIABILITA’
Dipartimento di Ricerca Sociale - Università del Piemonte Orientale 1 Castelli Aperti giugno 2005 Castello di Camino (AL) IL PUBBLICO DI CASTELLI.
Inferenza statistica per un singolo campione
1 Seconda ora Larchitettura di un sistema di e- government: parte seconda Un esempio di progetto di e-Government: il progetto servizi alle imprese Un esempio.
Enver Sangineto, Dipartimento di Informatica Multimedia Information Retrieval.
Annotazione Automatica di materiale multimediale
Processi Aleatori : Introduzione – Parte I
Computer Graphics Marco Tarini Università dellInsubria Facoltà di Scienze MFN di Varese Corso di Laurea in Informatica Anno Accademico 2004/05 Lezione.
1 Lobiettivo dellimpresa vs la visione La visione dellimpresa riguarda le modalità di sviluppo e il tipo di contributo innovativo che essa si prefigge.
Dipartimento di Informatica e Sistemistica Alessandro DE CARLI Anno Accademico MOVIMENTAZIONE CONTROLLATA AZIONAMENTI CON MOTORE BRUSHLESS.
Informatica e Tecnologie per la comunicazione in rete 1
Dipartimento di Ingegneria Idraulica e Ambientale - Universita di Pavia 1 Simulazione di un esperimento di laboratorio: Caduta di un corpo quadrato in.
OPERAZIONI CON TRINOMI DI II° GRADO
Qualità - 1 / 26 Lezione 1 La qualità del prodotto.
Dipartimento di Economia
Colore Eidomatico e Percezione del colore 1
19 Lezione 21/5/04 Composizione dell'immagine 1 COMPOSIZIONE DELLIMMAGINE.
2 3 4 RISERVATEZZA INTEGRITA DISPONIBILITA 5 6.
1ROL - Richieste On Line Ente pubblico 5ROL - Richieste On Line.
Fondamenti delle Reti di Computer Il Browser Carasco 22/04/2010.
Scheda Ente Ente Privato Ente Pubblico. 2ROL - Richieste On Line.
1 SOSTEGNO PSICOLOGICO SCUOLE DELLAQUILA. 2 Aiuto ai docenti in qualità di persone. L obiettivo è quello di sostenere e contenere lo stato emotivo personale.
Ministero dellIstruzione, dellUniversità e della Ricerca Servizio per lAutomazione Informatica e lInnovazione Tecnologica – Ufficio di Statistica -VII.
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Bando Arti Sceniche. Per poter procedere è indispensabile aprire il testo del Bando 2ROL - Richieste On Line.
Roberto Ariani Presidente Comm. Supporto e sviluppo informatico I Siti in cui dobbiamo navigare per crescere SINS - Seminario Istruzione Nuovi Soci - Arezzo,
1 Questionario di soddisfazione ATA - a. sc. 2008/09 Il questionario è stato somministrato nel mese di aprile Sono stati restituiti 29 questionari.
La tabella dei voti ECTS Maria Sticchi Damiani Sapienza, Roma 26 settembre
1101 = x 10 x 10 x x 10 x = CORRISPONDENZE
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
Multimedia Information Retrieval
Enver Sangineto, Dipartimento di Informatica Annotazione Automatica di materiale multimediale.
Multimedia information retrieval. Problematica Materiale multimediale: non solo testo, ma audio (speech, musica..) immagini, video Retrieval basato su.
Image Based Rendering Daniele Marini.
Dal modello alla visualizzazione: Verso il foto realismo Daniele Marini.
Ad opera di: Matteo Donatelli e Maurizio Di Paolo Presentazione su : Elettropneumatica 1.
C’è / Ci sono Scegli un numero.
I dati del questionario di autovalutazione dei docenti Prime rilevazioni.
Bando di Residenza Cap Scheda ENTE 3ROL - Richieste On Line.
A.s scuola primaria 5° - circolo L. Tempesta - Lecce Questionario di rilevazione della soddisfazione delle famiglie.
1Piero Scotto - C14. Finalità del corso Programma Materiale Requisiti Spendibilità 2Piero Scotto - C14.
Shape-based visual information retrieval Enver Sangineto Dipartimento di Informatica
1 Guida per linsegnamento nei corsi per il conseguimento del CERTIFICATO DI IDONEITÀ ALLA GUIDA DEL CICLOMOTORE.
Pippo.
Distribuzione per causa delle irregolarità al servizio Azienda ATL (Valori assoluti) 1.
Gli italiani e la caccia (ricerca quantitativa – luglio 2013)
Il sistema duale La formazione professionale in Germania
Bando Valorizzazione a rete. 2ROL - Richieste On Line Pittori e scultori.
Bando Pittori e Scultori in Piemonte alla metà del ‘700
Bando Beni in comune. 2ROL - Richieste On Line 3.
Lez. 3 - Gli Indici di VARIABILITA’
lun mar mer gio ven SAB DOM FEBBRAIO.
MONITORAGGIO POF a.a. 2013/14 ALUNNI SECONDARIA I°
OPERAZIONI CON TRINOMI DI II° GRADO
1 Analisi della gestione finanziaria dal 04 Gennaio 2008 Fondo Pensione Astri Comparto Bilanciato report al: 4 giugno 2010.
1 DOSSIER STATISTICO Conoscere per Programmare Gli alunni con cittadinanza non italiana Anno Scolastico 2001/2002.
IL GIOCO DEL PORTIERE CASISTICA. Caso n. 1 Il portiere nella seguente azione NON commette infrazioni.
Analisi della similarità tra immagini.
Transcript della presentazione:

Riconoscimento automatico di oggetti in immagini digitali Enver Sangineto, Dipartimento di Informatica

Panoramica della presentazione Motivazioni Problemi Principali approcci

Riconoscimento di oggetti L’obiettivo di un sistema di object recognition è rilevare la presenza di “oggetti” d’interesse all’interno di immagini/video digitali Passo fondamentale per permettere ad un computer di “capire cosa sta guardando”

Perchè riconoscere automaticamente gli oggetti di un'immagine Recupero/classificazione d'immagini in data base visivi (Image Retrieval): ricerche on-line, annotazione (automatica) video, organizzazione di archivi fotografici musei, e-commerce... Visione applicata alla robotica: manipolazione d’oggetti, navigazione guidata dalla visione

Perchè riconoscere automaticamente gli oggetti di un'immagine [2] Video sorveglianza: rilevamento di intrusioni, … Biometria Interfacce uomo-macchina di tipo “intelligente” Guida automatica di veicoli su strada Visione industriale, medica, aerea, militare, ... Altro…

Object recognition è un problema aperto Non esistono sistemi general purpose

Problemi principali nel riconoscimento di oggetti Variabilità delle apparenze Segmentazione della scena

Variabilità: cambiamento del punto di vista Michelangelo 1475-1564

Variabilità [2]: cambiamento delle condizioni di illuminazione

Variabilità [3]: oggetti deformabili Xu, Beihong 1943

Variabilità [4]: variazione intra-classe

Segmentazione: Occlusioni Magritte, 1957

Segmentazione [2]: separazione dallo sfondo Klimt, 1913

Approcci principali al riconoscimento Model-based Machine learning

Ipotesi… Un solo oggetto per immagine Machine learning per rappresentare la conoscenza

Riconoscimento tramite apprendimento automatico: schema generale Suppongo di disporre, in fase di training, di un insieme T = {(I1, y1), …, (IN, yN)}, dove Ij è un’immagine e yj un’etichetta che indica l’oggetto in essa contenuto: yj {o1, …, om}

Riconoscimento tramite apprendimento automatico [2] Ogni Ij è rappresentata tramite un punto xj in Rn, detto spazio delle feature Utilizzo T per stimare la distribuzione statistica dei punti in Rn e costruire il classificatore C

Riconoscimento tramite apprendimento automatico [3] On-line, uso C per classificare un’immagine nuova I, non appartenente a T: C(I) {o1, …, om}

Un semplice esempio Istogramma dell’intensità dei pixel in I: Divido il range [0, 255] in n bin Assegno ogni pixel ad un bin: I(p) -> divn(I(p)) f(I) = (v0, …, vn-1)T, dove: vi = # { p I : divn(I(p)) = i}

Esempio [2] Rappresentazione di T in Rn (n,m = 2)

Esempio [3] Rappresentazione della nuova immagine (x = f(I))

Rappresentazione di un’immagine mediante feature Una feature è una rappresentazione, tramite valori numerici, di tutta o parte dell’immagine Se I' è una sottoparte dell’immagine I, allora una feature f è t.c.: f(I') Rd, f(I') = (v0, … vd-1)T, d >= 1

Feature globali e locali I' = I: feature globale I' I: feature locale

Esempio: feature locale fi(I') I' I immagine presa da: Tutorial CVPR 07

Scelta delle feature L’immagine in esame viene quindi descritta usando i valori di un insieme di feature pre-scelte f1, …, fk

Spazio delle feature Se: fj(I) Rd (1 <= j <= k), allora: x(I) = (f1(I) T f2(I) T … fk(I) T)T è un punto in Rk*d (spazio delle feature)

Proprietà (desiderabili) delle feature Stabilità, Capacità discriminative, Efficienza computazionale, …

Proprietà (desiderabile) del feature space Punti geometricamente “vicini” corrispondono ad immagini simili

Teoria Decisionale Bayesiana Data l’immagine x e m classi di oggetti C1, … Cm, associare x alla classe più probabile Scelgo Cj* tale che: Notazione abbreviata:

Esempio Le probabilità sono stimate tramite training immagine presa da: Duda, Hart, Stork, Pattern Classification

Metodi discriminativi Mirano a determinare i bordi di decisione (superfici iper-dimensionali) che meglio partizionano Rn rispetto alle classi d’interesse

Bordi di decisione: ese. monodimensionale

Bordo di decisione: ese. bidimensionale

Esempi di classificatori discriminativi Reti neurali (ANN) Support Vector Machines (SVM) Decision Trees K-Nearest Neighbor (k-NN) Boosting …

Riassumendo… In un approccio all’object recognition basato sul machine learning è necessario modellare due tipi di conoscenza: Conoscenza visiva (e.g., scegliere le feature) Conoscenza statistica (e.g., scegliere il classificatore)

Alcuni riferimenti Forsyth, Ponce, Computer Vision, a Modern Approach 2003 Duda, Hart, Stork, Pattern Classification (II edition) 2001 Bishop, Pattern Recognition and Machine Learning, 2006 Sebe, Cohen, Garg, Huang, Machine Learning in Computer Vision, 2005

Domande…