La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

UNIVERSITA DEGLI STUDI DI GENOVA Corso di Laurea in Ingegneria Elettronica STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof.

Presentazioni simili


Presentazione sul tema: "UNIVERSITA DEGLI STUDI DI GENOVA Corso di Laurea in Ingegneria Elettronica STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof."— Transcript della presentazione:

1 UNIVERSITA DEGLI STUDI DI GENOVA Corso di Laurea in Ingegneria Elettronica STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof. Francesco Curatelli Studente : Lorenzo Banderali

2 MOTIVAZIONI I sistemi di riconoscimento vocale sono sempre più diffusi ed importanti. Possono essere impiegati in: - Telefonia mobile - Stazioni telefoniche - Refertazione automatica - Interazione facilitata uomo-macchina Università degli Studi di Genova – Facoltà di Ingegneria

3 ACQUISIZIONE E necessario acquisire il segnale vocale e trasformarlo in un segnale tempo discreto tramite un appropriato campionamento Università degli Studi di Genova – Facoltà di Ingegneria

4 MODELLO PLP Il modello PLP simula la percezione delludito umano e stima con accuratezza i parametri del parlato in modo veloce

5 MEMORIA ASSOCIATIVA Associa i parametri del parlato ottenuti con il modello PLP ad un set predefinito di caratteristiche Adatta per una rappresentazione vettoriale dei dati Rende possibile il riconoscimento della forma donda Università degli Studi di Genova – Facoltà di Ingegneria

6 SISTEMA DI RICONOSCIMENTO Fase di Apprendimento (training) –Analisi del segnale vocale per ogni frame –Costruzione database con i vettori PLP Fase di riconoscimento –Analisi del segnale vocale (PLP) –Calcolo score rispetto al database di training –Stima parola con algoritmo DTW Università degli Studi di Genova – Facoltà di Ingegneria

7 OBIETTIVI Rendere il sistema di riconoscimento più rapido e meno costoso Mettere a punto un sistema software che permetta di minimizzare i tempi di calcolo senza provocare un significativo peggioramento del risultato finale Università degli Studi di Genova – Facoltà di Ingegneria

8 OTTIMIZZAZIONE Riduzione del file di training - Algoritmo di Lloyd - Algoritmo K-Means - Disattivazione Università degli Studi di Genova – Facoltà di Ingegneria

9 Lloyd & K-Means Si muovono ripetitivamente tutti i valori di riferimento alla media del loro Voronoi set (L) o considerando il punto vincitore (K) Il riferimento si posiziona come un centroide per un insieme di punti

10 DISATTIVAZIONE Elimina i punti sparsi attratti più da altre classi che da quella di appartenenza Può essere effettuata prima o dopo la riduzione tramite Lloyd & K-Means Riduce ulteriormente il file di training

11 DIAGRAMMA DI VORONOI Permette di dividere il piano assegnando a ciascun punto il seme più vicino

12 PROVE EFFETTUATE Utilizzo di un database di registrazioni composto da parole pronunciate da differenti parlatori in più sessioni Addestramento con files di training completi e ridotti Riconoscimento di parole dello stesso o di altri parlatori nelle varie sessioni Università degli Studi di Genova – Facoltà di Ingegneria

13 RISULTATI Riduzione Lloyd e nessuna disattivazione ulteriore (X V) Ancos01Ancos01.10Ancos ParlatoreParolaR % Ancos010#1S 100S 83.5S 68.5 Ancos012#3S 100S 78.8S 59 Ancos020#1S 60 S 38.6 Ancos022#3S 70.4 Lucas015#3S 52S 50S 54.6 Lucas019#4S 47 S 39.4 Cabos036#1N 33.7N 36.6S 31.1 Cabos030#3N 26.4S 22.9S 18.4 Università degli Studi di Genova – Facoltà di Ingegneria

14 RISULTATI Riduzione Lloyd e disattivazione ulteriore (X V V*) Ancos01Ancos01.10Ancos ParlatoreParolaR % Ancos010#1S 100S 57.5S 30.1 Ancos012#3S 100S 65S 28 Ancos020#1S 60S 54.6S 28 Ancos022#3S 70.4S 58.7S 62.1 Lucas015#3S 52S 50.2S 42.5 Lucas019#4S 47S 39.3S 29 Cabos036#1N 33.7N 24.5S 20.9 Cabos030#3N 26.4N 16.6N 14.2 Università degli Studi di Genova – Facoltà di Ingegneria

15 RISULTATI Riduzione Lloyd e disattivazione ulteriore (X X* V) Ancos01Ancos01.10Ancos ParlatoreParolaR % Ancos010#1S 100S 73.9S 68.4 Ancos012#3S 100S 72.3S 52.8 Ancos020#1S 60S 57.3S 61.3 Ancos022#3S 70.4S 66.1S 62.5 Lucas015#3S 52S 45.9S 49.1 Lucas019#4S 47S 45S 35.9 Cabos036#1N 33.7N 32.7S 28.5 Cabos030#3N 26.4S 18.3S 16.5 Università degli Studi di Genova – Facoltà di Ingegneria

16 CONCLUSIONI Significativa riduzione dei file di training Diminuzione dei tempi di esecuzione del programma di riconoscimento Spear Pochi errori nel riconoscimento delle parole Università degli Studi di Genova – Facoltà di Ingegneria


Scaricare ppt "UNIVERSITA DEGLI STUDI DI GENOVA Corso di Laurea in Ingegneria Elettronica STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof."

Presentazioni simili


Annunci Google