Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
1
UNIVERSITA’ DEGLI STUDI DI GENOVA
Corso di Laurea in Ingegneria Elettronica STUDIO E REALIZZAZIONE DI TECNICHE PER IL RICONOSCIMENTO VOCALE Relatore : Prof. Francesco Curatelli Studente : Lorenzo Banderali
2
MOTIVAZIONI I sistemi di riconoscimento vocale sono sempre più diffusi ed importanti. Possono essere impiegati in: - Telefonia mobile - Stazioni telefoniche - Refertazione automatica - Interazione facilitata uomo-macchina Università degli Studi di Genova – Facoltà di Ingegneria
3
ACQUISIZIONE E’ necessario acquisire il segnale vocale e trasformarlo in un segnale tempo discreto tramite un appropriato campionamento Università degli Studi di Genova – Facoltà di Ingegneria
4
MODELLO PLP Il modello PLP simula la percezione dell’udito umano e stima con accuratezza i parametri del parlato in modo veloce
5
MEMORIA ASSOCIATIVA Associa i parametri del parlato ottenuti con il modello PLP ad un set predefinito di caratteristiche Adatta per una rappresentazione vettoriale dei dati Rende possibile il riconoscimento della forma d’onda Università degli Studi di Genova – Facoltà di Ingegneria
6
SISTEMA DI RICONOSCIMENTO
Fase di Apprendimento (training) Analisi del segnale vocale per ogni frame Costruzione database con i vettori PLP Fase di riconoscimento Analisi del segnale vocale (PLP) Calcolo score rispetto al database di training Stima parola con algoritmo DTW Università degli Studi di Genova – Facoltà di Ingegneria
7
OBIETTIVI Rendere il sistema di riconoscimento più rapido e meno costoso Mettere a punto un sistema software che permetta di minimizzare i tempi di calcolo senza provocare un significativo peggioramento del risultato finale Università degli Studi di Genova – Facoltà di Ingegneria
8
OTTIMIZZAZIONE Riduzione del file di training - Algoritmo di Lloyd
- Algoritmo K-Means - Disattivazione Università degli Studi di Genova – Facoltà di Ingegneria
9
Lloyd & K-Means Si muovono ripetitivamente tutti i valori di riferimento alla media del loro Voronoi set (L) o considerando il punto vincitore (K) Il riferimento si posiziona come un centroide per un insieme di punti
10
DISATTIVAZIONE Elimina i punti “sparsi” attratti più da altre classi che da quella di appartenenza Può essere effettuata prima o dopo la riduzione tramite Lloyd & K-Means Riduce ulteriormente il file di training
11
DIAGRAMMA DI VORONOI Permette di dividere il piano assegnando a ciascun punto il seme più vicino
12
PROVE EFFETTUATE Utilizzo di un database di registrazioni composto da parole pronunciate da differenti parlatori in più sessioni Addestramento con files di training completi e ridotti Riconoscimento di parole dello stesso o di altri parlatori nelle varie sessioni Università degli Studi di Genova – Facoltà di Ingegneria
13
Riduzione Lloyd e nessuna disattivazione ulteriore (XV)
RISULTATI Riduzione Lloyd e nessuna disattivazione ulteriore (XV) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N S S Università degli Studi di Genova – Facoltà di Ingegneria
14
Riduzione Lloyd e disattivazione ulteriore (XV V*)
RISULTATI Riduzione Lloyd e disattivazione ulteriore (XV V*) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N N N Università degli Studi di Genova – Facoltà di Ingegneria
15
Riduzione Lloyd e disattivazione ulteriore (XX* V)
RISULTATI Riduzione Lloyd e disattivazione ulteriore (XX* V) Ancos01 Ancos01.10 Ancos01.100 Parlatore Parola R % R % R % 0#1 S S S 2#3 S S Ancos02 S S S S S S Lucas01 5#3 S S S 9#4 S S S Cabos03 6#1 N N S 0#3 N S S Università degli Studi di Genova – Facoltà di Ingegneria
16
CONCLUSIONI Significativa riduzione dei file di training
Diminuzione dei tempi di esecuzione del programma di riconoscimento “Spear” Pochi errori nel riconoscimento delle parole Università degli Studi di Genova – Facoltà di Ingegneria
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.