Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoGiuseppa Adamo Modificato 8 anni fa
1
Nuove tecnologie e disabilità Il riconoscimento vocale Relatore: Dr Angelo Paglino
2
Utilizzare il computer con la voce 1992 Prodotto: Dragon Dictate Vocabolario italiano di 7.000 parole Parlato discreto
3
Scheda audio / USB 01101011101... Segnale vocaleConversione analogico/digitaleStringa di bit Come funziona un sistema di riconoscimento vocale
4
01101011101... … 11010110110 01101011101 10101011101... kw 11101010101... … 11110110110 11101010101 10101000101... re CARATTERISTICHE FONETICHE INDIVIDUALI Fonema: unità minima distintiva di suono nell’ambito di una lingua
5
Come funziona un sistema di riconoscimento vocale kw re … OCCORRENZE CURE5 CUORE57 CURIE9... Cuore n i’limiti … OCCORRENZE NE’ LIME A T1 NEI LIMITI102 NEL LIMITE85... nei limiti CARATTERISTICHE LINGUISTICHE INDIVIDUALI
6
Come funziona un sistema di riconoscimento vocale Ogni persona possiede caratteristiche fonetiche e linguistiche particolari L’unico modo di ottimizzare le prestazioni di un riconoscitore vocale è quello di “insegnargli” le caratteristiche fonetiche e linguistiche peculiari della persona
7
Come funziona un sistema di riconoscimento vocale La manutenzione è obbligatoria e continua –Profilo fonetico –Modello del linguaggio Atteggiamento collaborativo dell’utente Formazione Ottimizzazione del segnale acustico –Scheda audio / USB –Microfono utilizzato
8
Miglioramento dell’accuratezza
9
Come funziona un sistema di riconoscimento vocale Costo % Accuratezza9095100 0
10
Previsioni Ogni anno il margine d’errore scende del 10% relativo Entro il 2017 il riconoscimento vocale dovrebbe essere competitivo con la comprensione umana Doc. Microsoft a Speechtek 2004
11
Utilizzare il computer con la voce 2006 Prodotto: Dragon NaturallySpeaking Vocabolario italiano di 120.000 parole Vocabolari personali Parlato continuo 140 parole minuto
13
Riconoscimento vocale: applicazioni Dragon NaturallySpeaking 8 Professional
14
Riconoscimento vocale: applicazioni Modalità normale: dettatura + comandi Modalità dettatura: comporre un testo Modalità comandi: navigazione
15
Il disabile motorio I disabili motori utilizzano la modalità “comandi” per muoversi in MS Windows, sostituendo la voce al mouse. I disabili motori utilizzano la modalità “normale” o la modalità “dettatura” per creare i testi sostituendo la voce alla tastiera.
16
Filmato: navigare a voce in internet, e-mail, giocare.
17
Il disabile sordo Il progetto Voice della Commissione Europea Sottotitolare una lezione in classe Creare i sottotitoli di una video cassetta
18
Il progetto VOICE
19
Coordinamento: Centro Comune di Ricerca (CCR) della Commissione Europea sito di Ispra – Italia User needs: Università di Linz (Austria) Sviluppo: FBL S.r.l. società di Informatica sede di Mortara (PV) Italia Responsabile del progetto: ing. Giuliano Pirelli – CCR Ispra
20
Il progetto VOICE Obiettivo: inserimento dell’alunno audioleso nel gruppo-classe “trasmettere a tutti gli alunni di una classe le stesse informazioni, con le stesse parole, nello stesso istante” (Dr Dionigi Ioghà)
21
Il progetto VOICE Un incontro fortunato Una dimostrazione di riconoscimento vocale “senza rete”. L’interesse della “Commissione” Una fase di sperimentazione. Il progetto (finanziato) La disseminazione dei risultati Il sito voice.jrc.it
22
Dopo il progetto …. Adeguamento alla tecnologia corrente Un prodotto per il mercato Dragon NaturallySpeaking + VoiceMeeting
23
Il prodotto di sottotitolazione Il motore di riconoscimento: Nuance Dragon NaturallySpeaking. Gestione del sottotitolo e multimedialità: FBL VoiceMeeting
24
Dragon NaturallySpeaking Un prodotto industriale offerto in più versioni e in più lingue. Noi utilizzeremo la versione Professional. Permette di salvare il testo e la voce che lo generato. Permette di creare vocabolari personalizzati. Dispone di SDK per lo sviluppo applicativo
25
Dragon NaturallySpeaking Creazione e manutenzione dei profili vocali. Creazione e gestione dei vocabolari utente.
26
VoiceMeeting Presentazione grafica dei sottotitoli. Gestione delle pause. Multimedialità (parole chiave per richiamare immagini, filmati..). Report.
27
Laboratorio Presentazione dei prodotti Dragon NaturallySpeaking e VoiceMeeting Creazione di un profilo vocale Prove di dettatura al computer. Costruire una lezione con VoiceMeeting. La gestione delle pause. Controllare i risultati.
28
Sottotitolare una video cassetta Creazione automatica dei sottotitoli e dei time-code. Limiti: Un solo parlatore. Vantaggi: tempio ridotti, contenimento dei costi, disponibilità del testo in formato digitale.
29
Filmato iniziale
30
Creazione sottotitoli e time-code
31
Filmato finale
32
Grazie. Angelo Paglino Riferimenti: FBL S.r.l. contrada della torre 16 27036 Mortara (PV) fbl@lomellina.it
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.