Teoria e Tecniche del Riconoscimento

Slides:



Advertisements
Presentazioni simili
Le forme dello spazio Caffè Scienza. Associazione formaScienza.
Advertisements

Calcolo vettoriale E.F. Orsega – Università Ca’ Foscari di Venezia
Teoria e Tecniche del Riconoscimento
Selezione delle caratteristiche - Principal Component Analysis
Prof.Maurita Fiocchi Corso A-ERICA RICERCA PUNTI ESTREMANTI LIBERI DELLE FUNZIONI REALI A DUE VARIABILI REALI z = f( x ; y )
FUNZIONI REALI DI DUE VARIABILI REALI
L’ IPERBOLE.
Le distribuzioni di probabilità continue
Sistema di riferimento sulla retta
Autovalori e autovettori
MATLAB.
MATLAB.
Geometria analitica dello spazio
METODI EQUAZIONI DIFFERENZIALI Funzioni che mettono in relazione una variabile indipendente ( es. x), una sua funzione ( es. y = f(x) ) e la.
COORDINATE POLARI Sia P ha coordinate cartesiane
La teoria di portafoglio: cap.7-9
Sistemi di supporto alle decisioni 2. Features space
ANALISI DELLA COVARIANZA
Lezione 3) Cenni di teoria dell’elasticità, sforzi e deformazioni, l’equazione delle onde elastiche.
TEORIA RAPPRESENTAZIONALE DELLA MISURA
Teoria e Tecniche del Riconoscimento
Support Vector Machines
Support Vector Machines
Dip. Economia Politica e Statistica
VETTORI.
Processi Aleatori : Introduzione – Parte I
Cinematica differenziale
Inversione differenziale della Cinematica
PER FUNZIONI DI PIÙ VARIABILI - 2.
CALCOLO DIFFERENZIALE PER FUNZIONI DI PIÙ VARIABILI. ESTREMI VINCOLATI, ESEMPI.
SISTEMI D’EQUAZIONI ED EQUAZIONI DIFFERENZIALI LINEARI.
Introduzione alla fisica
Costruzione di Interfacce Lezione 4 Nozioni di geometria per la grafica
MATLAB.
Teoria e Tecniche del Riconoscimento
Teoria e Tecniche del Riconoscimento
Teoria e Tecniche del Riconoscimento
BIOINGEGNERIA S. Salinari Lezione 4.
STATISTICA a.a METODO DEI MINIMI QUADRATI REGRESSIONE
Valutazione della stima: gli intervalli di confidenza
Marco CristaniTeoria e Tecniche del Riconoscimento1 Notizie preliminari Introduzione Facoltà di Scienze MM. FF. NN. Università di Verona A.A
Marco CristaniTeorie e Tecniche del Riconoscimento1 Notizie preliminari Introduzione Facoltà di Scienze MM. FF. NN. Università di Verona A.A
Studente Claudia Puzzo
Analisi delle corrispondenze
Num / 36 Lezione 9 Numerosità del campione.
UNIVERSITÀ DEGLI STUDI DI PERUGIA Dipartimento di Ingegneria Industriale Prof. Francesco Castellani Corso di Meccanica Applicata A.A.
Lezione 13 Equazione di Klein-Gordon Equazione di Dirac (prima parte)
Assicurazioni vita e mercato del risparmio gestito
Il calcolo di radiosity
Spazi vettoriali astratti Somma e prodotto di n-ple Struttura di R n.
1 MATHESIS Società Italiana di Scienze Matematiche e Fisiche Sezione di Lanciano-Ortona 24 febbraio 2010 Ferdinando Casolaro - Università del Sannio
Sistemi di riferimento
Introduzione alla Regressione Lineare e alla Correlazione.
Unità 2 Distribuzioni di probabilità Misure di localizzazione Misure di variabilità Asimmetria e curtosi.
UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA PER LA GESTIONE D’AZIENDA Tesi di laurea: Progettazione.
Pippo.
Stabilità per E.D.O. (I): STABILITÀ LINEARIZZATA
Vettori dello spazio bidimensionale (R 2)
Sottospazi vettoriali
Vettori A B VETTORE è un segmento orientato caratterizzato da: C D
Riassumendo: ipotesi per OLS 1.Modello lineare 2.X e Y sono frutto di osservazioni indipendenti 3.X è di rango pieno 4.I residui hanno media = 0 5.I residui.
Analisi discriminante lineare - contesto
LA RETTA Assi cartesiani e rette ad essi parallele
Assicurazioni vita e mercato del risparmio gestito Lezione 13 Modelli media varianza con N titoli.
MATEMATICA PER L’ECONOMIA e METODI QUANTITATIVI PER LA FINANZA a. a
Metodi di minimizzazione Ricerca del minimo di dove è l’insieme delle variabili (coordinate)
REALIZZAZIONE DI UN SISTEMA DI CLASSIFICAZIONE Prof. Roberto Tagliaferri Studente: Ragognetti Gianmarco Corso di Reti Neurali e Knowledge Discovery A.A.
Lezione n° 5: Esercitazione
Riduzione dei Dati. Nelle scienze sociali ci si trova molto spesso di fronte a ricerche in cui vi è una sovrabbondanza di misurazioni nel tentativo di.
Transcript della presentazione:

Teoria e Tecniche del Riconoscimento Facoltà di Scienze MM. FF. NN. Università di Verona A.A. 2010-11 Teoria e Tecniche del Riconoscimento Metodo di Fisher, Principal Component Analysis Marco Cristani Teoria e Tecniche del Riconoscimento

La trasformata di Fisher Il problema è quello di ridurre la dimensionalità dello spazio delle features in modo da rendere il problema di classificazione computazionalmente trattabile. È in sostanza la proiezione delle feature caratterizzanti un campione su una retta, cioè su una direzione (da un problema d-dimensionale ad un problema 1-dimensionale). Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Si supponga di avere un insieme di N campioni d-dimensionali x1, .., xN, di cui N1 classificati come 1 ed N2 classificati come 2. Si vuole cercare una trasformazione w, ossia una combinazione lineare delle componenti di x tale da generare i corrispondenti campioni (scalari) y1,..., yN: wt x = y Geometricamente, se la norma di w è pari a 1 allora ogni yi è la proiezione del campione xi sulla retta di direzione w. Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Siccome si vuole separare le due classi anche nel nuovo spazio monodimensionale allora si considera come misura di separazione la differenza delle medie dei campioni. Quindi: dove Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Si vuole ottenere che la differenza tra le medie delle due classi (trasformate) sia grande rispetto alla deviazione standard di ogni classe. Allora, si definisce il discriminante lineare di Fisher come la funzione lineare wtx per la quale la funzione J è massima: Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento dove sono le dispersioni (scatter) dei campioni classificati 1 ed 2, rispettivamente, definite come: Si vuole che le dispersioni siano abbastanza piccole, ossia, che i campioni di una classe siano abbastanza concentrati intorno al valore medio. Per ottenere J come una funzione esplicita di w si definiscono le matrici di dispersione (scatter matrices) Si ed Sw: Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Analogamente: In tal modo: dove SB = (m1 - m2)  (m1 - m2)t Quindi per ottenere J(w) massimo, si deve esplicitare J in funzione diretta di w e quindi derivarlo rispetto a w ed eguagliare a 0. Marco Cristani Teoria e Tecniche del Riconoscimento

Teoria e Tecniche del Riconoscimento Derivando ottengo che: che è la trasformata di Fisher. Marco Cristani Teoria e Tecniche del Riconoscimento

PCA Il dato = un vettore N-dimensionale di valori di pixel Supponiamo N=2  dati = punti 2D Come posso descrivere in modo compatto questi M punti? SOL 1: Con un punto (vettore) solo, che minimizzi la distanza media quadratica con tutti i pti m poco espressivo!!! Problema Soluzione: il vettore media

PCA SOL2: Con una retta di proiezione, che minimizzi la distanza media quadratica con tutti i pti In questo caso useremmo una dimensione per descrivere i dati (la posizione sulla retta)! Alcune vanno bene ... altre no. intuitivamente Supp. una retta di proiezione nello spazio

PCA Per convenienza, imponiamo passaggio dalla media, e specifichiamo quindi i punti della retta come Troviamo quindi i coefficienti che minimizzano la distanza quadratica

PCA Sostituendo in otteniamo , ossia Scatter matrix ≈ mat. di covarianza Minimizzare significa massimizzare tenuto conto che , via moltiplicatori di Lagrange; ossia A conti fatti: e deve essere autovettore; Poiché deve essere massimo Minimizzo;

Esempio La matrice di covarianza è Ottengo 2 autovettori (e autovalori): quale prendo?

Esempio - osservazioni La matrice di covarianza è simmetrica, reale  gli autovettori {e} sono ortogonali, formanti una base per lo spazio N dimensionale  gli autovalori più grandi si hanno nelle direzioni di massima dispersione dei dati

Esempio - osservazioni I coefficienti , per i =1,...,N, sono le componenti del punto per la base trovata Quindi un punto può essere scritto come

Da PCA ad eigenfaces Dato un gruppo di punti, ho trovato la base che descrive lo scattering dei punti Ogni punto puo’ essere mappato tramite i componenti della base (numero componenti = numero dimensioni N) Usare meno componenti (le componenti principali) permette di proiettare i punti in un sottospazio altamente informativo  riduzione della dimensionalità dei punti Ora passiamo alle facce (...punti!)dataset di M facce, N dimensioni N.B.: di solito, M<<N …

Da PCA ad eigenfaces (2) … Preprocessing - Le immagini devono contenere esclusivamente facce (no outliers) Le immagini devono essere ragionevolmente prive di rumore Le facce devono avere la stessa dimensione riscalamento Stesse condizioni di illuminazione, o compensazione Non ci deve essere sfondoritaglia le facce, catturale su sfondo neutro (alternativa: background subtraction) In maniera automatica, utilizzo di un metodo di face detection …

Eigenfaces - proiezioni Dopo aver ricavato gli autovettori {e} (eigenfaces) dalla matrice di covarianza S, calcolo le componenti {a} (o proiezione) per la faccia x ed ho Le ricostruzioni, g, possono avvenire anche nei sottospazi descritti dalle eigenfaces con eigenvalues più grandi – riduzione dimensionalità m + … n. coeff. 10 20 30 50 70 82

Eigenfaces Autovettori {e} (eigenfaces): in pratica?

Eigenfaces - problema Sia pertanto S = AA’ Con un’img 256 x 256 ho : problemi di overflow! Trick: calcolo gli autovettori di , ossia , tenuto conto che di solito si usano 20-30 eigenfaces e che N x M N x N quindi

Eigenfaces - note Gli M autovalori di A’A corrispondono agli M autovalori più grandi di S (così come i corrispondenti autovettori)

Eigenfaces - algoritmo Sottraggo ad ogni immagine x(k) ,k=1...M, la media ottenendo i vettori da cui costruisco la matrice Calcolo M autovettori di formando la matrice Ricavo gli M autovettori più grandi di S = AA’, ossia o in forma matriciale Ricavo i corrispondenti componenti (o coeff. di proiezione)

Proprietà chiave della rappresentazione ad eigenfaces Date 2 immagini usate per costruire l’eigenspace è la proiezione nell’eigenspace dell’img allora, ossia, la distanza nell’eigenspace è approssimativamente uguale alla distanza tra due immagini.

Riconoscimento con le eigenfaces Analizza il database d’immagini etichettato (<volti,identità>) Esegui PCA — calcola le eigenfaces, formo U Calcola i K coefficienti per ogni immagine x(k) k=1,...,M Calcola le M proiezioni nello spazio delle eigenfaces ω(k) k=1,...,M Calcolo la soglia Data una nuova img (da riconoscere) x, Ne sottraggo la media del dataset di training m, ottengo Proietto, ossia calcolo le K componenti Calcolo il set di distanze TRAINING ossia RICONOSCIMENTO

Riconoscimento con le eigenfaces Ricostruisco la faccia usando eigenfaces e componenti Calcolo la distanza tra la faccia di partenza incognita e la ricostruzione Se non è una faccia è una nuova faccia è una faccia conosciuta, la kbest-esima, dove RICONOSCIMENTO

Dettagli pratici Quanti eigenvector usare? Controlla il decadimento degli eigenvalues Dati “buoni” ossia trattabili hanno poche dimensioni ad alta varianza Nel caso in cui tutti gli N autovalori sono stati calcolati per un dataset N-dimensionale vale K M i =

Problemi eigenfaces Illuminazione: stessi soggetti con differente illuminazione risultano lontani nello spazio delle eigenfaces Pose differenti :le componenti di un volto frontale non servono per un riconoscimento con profili Allineamento differente Espressione facciale differente Outlier Sample outliers = non facce Intra-sample outliers = facce affette da rumore

Problemi eigenfaces (2) Funzionale solo per la rappresentazione di dati appartenenti ad un’unica classe Non separano classi differenti