“Riconoscimento di Facce” Progetto di Visione e Percezione Parte I “Riconoscimento di Facce” Studentessa: Piera Salvatore Docente: Fiora Pirri Anno Accademico 2007/2008
Tre contributi chiave sono alla base del progetto: METODO Il metodo di riconoscimento utilizzato è quello proposto da Viola & Jones. Tre contributi chiave sono alla base del progetto: Immagini Integrali Algoritmo di apprendimento AdaBoost Cascata di classificatori
Features L’analisi dell’immagine viene eseguita utilizzando un set ristretto di features“Haar-Like” in grado di codificare ad-hoc il dominio della conoscenza: Tipo 0 Tipo 2 Tipo 4 Tipo 3 Tipo 1
Classificatori Tra le tantissime features a disposizione, il compito di selezionare quelle che genererebbero un errore minore, è affidato all’algoritmo AdaBoost che al termine dell’elelaborazione ci fornisce il classificatore robusto, costituito dai diversi classificatori deboli scelti.
Cascata di classificatori Ottimizzare la ricerca indirizzandola verso quelle che si possono definire le regioni più promettenti, è lo scopo dell’utilizzo di una cascata di classificatori. Idea base: Le regioni dove occorrono facce si possono individuare molto facilmente ed il parametro di valutazione è il numero di falsi positivi, cioè il numero di sottofinestre identificate come potenziali facce. Struttura della cascata
L’algoritmo AdaBoost non si preoccupa di ottenere un elevato tasso di riconoscimento e per ottenere anche questa prestazione sono state effettuate le seguenti modifiche: Il valore della soglia è stato modificato adattatamente per ottenere un tasso di riconoscimento accettabile Il numero delle iterazioni non è definito a priori ma ad ogni iterazione l’algoritmo decide se è necessaria una nuova iterazione oppure no
RISULTATI La fase di addestramento dell’algoritmo AdaBoost è durata più di due settimane e si sono ottenuti 4 livelli della cascata. Una delle prime caratteristiche selezionata come classificatore è quella che si concentra sulla proprietà che la regione degli occhi è spesso più scura della regione della fronte.
La fase di test è stata eseguita su un campione di 10 immagini contenenti gruppi di persone. Per ognuna di esse sono stati memorizzati i centri dei volti all’interno di una struttura. Le regioni di interesse (ROI) clacolate dal detector sono state valutate come successi o insuccessi attraverso la stima della distanza euclidea tra i centri dei volti e quelli delle ROI La figura mostra una parte delle ROI ottenute dal detector e tra di esse è possibile notare come alcune riescono ad individualizzare meglio il volto mentre altre si allontanano troppo dal centro.
La seguente curva ROC mostra le effettive prestazioni dell’applicazione: Detection rate False positive rate