La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

UNIVERSITA’ DEGLI STUDI DI GENOVA

Presentazioni simili


Presentazione sul tema: "UNIVERSITA’ DEGLI STUDI DI GENOVA"— Transcript della presentazione:

1 UNIVERSITA’ DEGLI STUDI DI GENOVA
Corso di Laurea in Ingegneria Elettronica   STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof. Francesco Curatelli Studente : Lorenzo Banderali

2 MOTIVAZIONI I sistemi di riconoscimento vocale sono sempre più diffusi ed importanti. Possono essere impiegati in: - Telefonia mobile - Stazioni telefoniche - Refertazione automatica - Interazione facilitata uomo-macchina Università degli Studi di Genova – Facoltà di Ingegneria

3 ACQUISIZIONE E’ necessario acquisire il segnale vocale e trasformarlo in un segnale tempo discreto tramite un appropriato campionamento Università degli Studi di Genova – Facoltà di Ingegneria

4 MODELLO PLP Il modello PLP simula la percezione dell’udito umano e stima con accuratezza i parametri del parlato in modo veloce

5 MEMORIA ASSOCIATIVA Associa i parametri del parlato ottenuti con il modello PLP ad un set predefinito di caratteristiche Adatta per una rappresentazione vettoriale dei dati Rende possibile il riconoscimento della forma d’onda Università degli Studi di Genova – Facoltà di Ingegneria

6 SISTEMA DI RICONOSCIMENTO
Fase di Apprendimento (training) Analisi del segnale vocale per ogni frame Costruzione database con i vettori PLP Fase di riconoscimento Analisi del segnale vocale (PLP) Calcolo score rispetto al database di training Stima parola con algoritmo DTW Università degli Studi di Genova – Facoltà di Ingegneria

7 OBIETTIVI Rendere il sistema di riconoscimento più rapido e meno costoso Mettere a punto un sistema software che permetta di minimizzare i tempi di calcolo senza provocare un significativo peggioramento del risultato finale Università degli Studi di Genova – Facoltà di Ingegneria

8 OTTIMIZZAZIONE Riduzione del file di training - Algoritmo di Lloyd
- Algoritmo K-Means - Disattivazione Università degli Studi di Genova – Facoltà di Ingegneria

9 Lloyd & K-Means Si muovono ripetitivamente tutti i valori di riferimento alla media del loro Voronoi set (L) o considerando il punto vincitore (K) Il riferimento si posiziona come un centroide per un insieme di punti

10 DISATTIVAZIONE Elimina i punti “sparsi” attratti più da altre classi che da quella di appartenenza Può essere effettuata prima o dopo la riduzione tramite Lloyd & K-Means Riduce ulteriormente il file di training

11 DIAGRAMMA DI VORONOI Permette di dividere il piano assegnando a ciascun punto il seme più vicino

12 PROVE EFFETTUATE Utilizzo di un database di registrazioni composto da parole pronunciate da differenti parlatori in più sessioni Addestramento con files di training completi e ridotti Riconoscimento di parole dello stesso o di altri parlatori nelle varie sessioni Università degli Studi di Genova – Facoltà di Ingegneria

13 Riduzione Lloyd e nessuna disattivazione ulteriore (XV)
RISULTATI Riduzione Lloyd e nessuna disattivazione ulteriore (XV) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N S S Università degli Studi di Genova – Facoltà di Ingegneria

14 Riduzione Lloyd e disattivazione ulteriore (XV V*)
RISULTATI Riduzione Lloyd e disattivazione ulteriore (XV V*) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N N N Università degli Studi di Genova – Facoltà di Ingegneria

15 Riduzione Lloyd e disattivazione ulteriore (XX* V)
RISULTATI Riduzione Lloyd e disattivazione ulteriore (XX* V) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N S S Università degli Studi di Genova – Facoltà di Ingegneria

16 CONCLUSIONI Significativa riduzione dei file di training
Diminuzione dei tempi di esecuzione del programma di riconoscimento “Spear” Pochi errori nel riconoscimento delle parole Università degli Studi di Genova – Facoltà di Ingegneria


Scaricare ppt "UNIVERSITA’ DEGLI STUDI DI GENOVA"

Presentazioni simili


Annunci Google