Apprendimento di movimenti della testa tramite Hidden Markov Model Relatore: Candidato: Prof.ssa Fiora Pirri Anna Belardinelli Università degli Studi di Roma “La Sapienza” Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica
Metodi probabilistici Overview Apprendimento automatico Apprendimento imitativo Scienze Cognitive Metodi probabilistici Esperimento apprendimento di movimenti della testa
Applicazioni all’Ingegneria Robotica mobile Sicurezza e sorveglianza Assistenza a soggetti disabili Interfacce uomo-macchina Strumentazione per video-conferenza Informatica grafica …
Apprendimento Automatico non supervisionato supervisionato con rinforzo Markov Decision Process Reti Neurali Maximum Likelihood Alberi di decisione Clustering Q-learning
Apprendimento per imitazione Approccio innovativo mutuato dalle Scienze Cognitive (Rao, Shon, Meltzoff, 2004) Vantaggi maggior adattabilità in ambienti dinamici riduzione dei costi di programmazione per compiti specifici processo di apprendimento più efficiente e veloce
Apprendimento per imitazione Approccio tradizionale vs. probabilistico Metodi tradizionali Metodi probabilistici presentano limiti nell’elaborazione e memorizzazione delle incertezze del mondo reale gestiscono meglio la natura stocastica del mondo reale I metodi probabilistici risultano più adatti all’apprendimento per imitazione in ambienti realistici, dinamici e rumorosi, caratteristica necessaria per lo sviluppo di sistemi artificiali autonomi. Es.: filtro di Kalman, particle filtering, metodi Monte Carlo, Hidden Markov Model
Markov Chain Monte Carlo: l’algoritmo di Metropolis-Hastings Generare campioni x che approssimino una distribuzione obiettivo p(x) usando un meccanismo a catena di Markov. Idea: Si inizializza for i=0 to N-1
Hidden Markov Model (HMM) Elementi: N, numero degli stati (nascosti) del modello M, numero dei simboli osservabili A, matrice delle probabilità di transizione tra gli stati B, matrice delle probabilità di emissione dei simboli ∏, distribuzione iniziale degli stati Assunzione markoviana
Genesi del modello e schema di apprendimento Scopo: imparare a seguire i movimenti della testa come compito base per implementare un modello di attenzione condivisa tra sistema artificiale e utente umano (Nagai, 2005). L’imitazione è il risultato dell’osservazione, della classificazione e della scelta del modello da riprodurre. OSSERVAZIONE COMPUTER UOMO APPRENDIMENTO ADATTAMENTO
Architettura cognitiva imitazione osservazione
Fase di osservazione Segmentazione tramite K-mean di un frame ogni 5 e selezione della testa. Calcolo della posizione del centro della testa e degli spostamenti relativi tra un frame e l’altro. Da ogni video si è prodotto un vettore di coppie di elementi del tipo
Produzione dei dati di addestramento Per generalizzare il modello osservato l’apprendimento deve avvenire su sequenze di spostamenti simili alla sequenza vista 200 sequenze di campioni di spostamenti lungo l’asse x e l’asse y ottenute fornendo all’algoritmo di Metropolis il vettore degli spostamenti e la distribuzione Gaussiana da cui campionare
Modellazione con HMM N= direzioni degli spostamenti discretizzate su 9 casi possibili M= spostamenti rilevati con la segmentazione, classificati in 9 combinazioni possibili A= matrice delle probabilità di transizione tra le direzioni degli spostamenti B= matrice delle emissioni dati gli stati ∏= tutte le direzioni sono inizialmente equiprobabili
Addestramento del modello Tramite le formule di Baum-Welch che ristimano i parametri del modello (A e B) in modo che sia massimizzata la probabilità delle osservazioni di addestramento
Riconoscimento Tramite l’algoritmo di Viterbi viene riconsiderata la sequenza iniziale di osservazioni e, in base ai nuovi parametri stimati, ricostruita la sequenza di stati che più probabilmente l’ha prodotta. Risultati: coincidenza tra stati ricostruiti e stati effettivi superiore ai 2/3 del totale.
Fase di imitazione Risultati 1
Fase di imitazione Risultati 2
Conclusioni e sviluppi futuri Il sistema ha appreso ad imitare modelli di spostamenti della testa, fornendo buoni risultati di riconoscimento E’ opportuno applicare la capacità imitativa anche alle distanze coperte dagli spostamenti L’implementazione di una memoria associativa che operi il pattern matching aumenterà la versatilità del sistema