Relatore: Dott. F. Avanzini Correlatore: Dott. C. Drioli

Slides:



Advertisements
Presentazioni simili
Master Bioinformatica 2002: Grafi Problema: cammini minimi da tutti i vertici a tutti i vertici Dato un grafo pesato G =(V,E,w), trovare un cammino minimo.
Advertisements

FACOLTA’ DI INGEGNERIA Corso di Laurea in Ingegneria Elettronica
Processi Aleatori : Introduzione – Parte II
2 dicembre 2005 AISV 2005 MODELLIZZAZIONE DELLA PROSODIA E DEL TIMBRO PER LA SINTESI DEL PARLATO EMOTIVO Mauro Nicolao, Carlo Drioli, Piero Cosi Copyright,
Elaborazione numerica del suono
L’oscillatore digitale
COFIN Presentazione Linee di Ricerca
Spazio dei giunti e spazio operativo
Tesi di Laurea Triennale in Ingegneria Elettronica Applicata
Copyright, 2005 © ISTC-SPFD-CNR ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE Viale Marx, Roma (Italy) www:
Luca Pizzamiglio Dipartimento di Elettronica ed Informazione Corso di Laurea in Ingegneria Informatica 17 Giugno 2003 Stimatori d'area per descrizioni.
Erbium Doped Fiber Amplifier EDFA
Controllo remoto di un robot mobile realizzato con Lego Mindstorms
ALGORITMI DI OTTIMIZZAZIONE PER L'ADDESTRAMENTO DI RETI NEURALI
1 Corso di Laurea in Biotecnologie Informatica (Programmazione) Problemi e algoritmi Anno Accademico 2009/2010.
Esercizi di riepilogo Gabriella Puppo.
Università di Padova Dipartimento di Ingegneria dellInformazione Analisi della Qualità del Servizio in Reti Radio Ad Hoc Special Interest Group on NEtworking.
Stima ed algoritmi di consensus distribuito: considerazioni su IKF
BIOINGEGNERIA S. Salinari Lezione 4.
Scene Modelling, Recognition and Tracking
Università degli Studi di Roma La Sapienza
Modelli e Algoritmi per la Logistica
Apprendimento di movimenti della testa tramite Hidden Markov Model
Antonello DAguanno Music Information Retrieval - TOOLS.
Università degli Studi di Roma La Sapienza
Filtri adattativi.
UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI AGRARIA DIPARTIMENTO DI SCIENZE ANIMALI TESI DI LAUREA TRIENNALE IN SCIENZE E TECNOLOGIE AGRARIE Determinazione.
Determinazione Orbitale di Satelliti Artificiali Lezione 5
Intelligenza Artificiale Algoritmi Genetici
Intelligenza Artificiale
Parte I (introduzione) Taratura degli strumenti (cfr: UNI 4546) Si parla di taratura in regime statico se lo strumento verrà utilizzato soltanto per misurare.
ADSL VOIP Voice Over IP.
Candidato : Giuseppe Circhetta Relatori :
UN SISTEMA DI SUPPORTO ALLA DETERMINAZIONE DI ANOMALIE NEL TRAFFICO DI RETE Tesi di Laurea di: Luca VESCOVI Correlatori: Ing. Aldo Franco DRAGONI Ing.
Università degli Studi di Cagliari
Allineamento di Superfici Celebrali :
UNIVERSITA’ DEGLI STUDI DI GENOVA
Parte 1 Introduzione alla Teoria dei Circuiti
Analisi dell’interferenza elettromagnetica tra linee ad alta tensione e metanodotti Emiliano D’Alessandro Giovanni Falcitelli*
Tesi di Laurea in Ingegneria Meccanica
Laureando: Enrico Masini
Modelli predittivi delle agenzie di rating internazionali: il modello MEU evoluto (maximum expected utility) Mattia Ciprian*, Daria Marassi°, Valentino.
UNIVERSITÀ DI PISA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA SPECIALISTICA IN INGEGNERIA INFORMATICA PER LA GESTIONE D’AZIENDA Tesi di laurea: Progettazione.
Università degli Studi di Cagliari
Complessità degli algoritmi (cenni) CORDA – Informatica A. Ferrari.
Lezione 2 Matlab: Control System Toolbox
POLITECNICO DI MILANO Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica STUDIO E REALIZZAZIONE DI UN BRACCIO ROBOTICO ANTROPOMORFO E SOLUZIONE.
GENERAZIONE DI FORME D’ONDA TRAMITE CONVERSIONE DI FREQUENZA
PROGETTO E REALIZZAZIONE DI UN COMPONENTE SOFTWARE PROGRAMMABILE PER LA PIANIFICAZIONE DI COMMISSIONI DI LAUREA FACOLTA’ DI INGEGNERIA Corso di Laurea.
Informatica 3 V anno.
Iterative Learning Control per un manipolatore robotico
Università degli studi di Parma Dipartimento di Ingegneria dell’Informazione Politecnico di Milano © 2001/02 - William Fornaciari Sintesi di reti a più.
Controllo ottimo delle superfici di commutazione nei sistemi ibridi autonomi Mauro Boccadoro *, Magnus Egerstedt y e Yorai Wardi y *DIEI - Università di.
Algoritmi euristici per l’ottimizzazione dell’offerta nella raccolta di rifiuti Tesi di laurea di Nicola Bindini Relatore: Chiar.mo Prof. Ing. DANIELE.
Relatore: Bianchi Nicola Laureando: Galzenati Fabio A.A. 2011/2012
D.I.Me.Ca. – D.I.Me.Ca. – Università degli Studi di Cagliari Facoltà di Ingegneria Dipartimento di Ingegneria.
REL. :PERONI PAOLO DOTTORATO XXI CICLO PRIMO ANNO 23/10/06
Vincenza Ferrara Novembre 2007 Fondamenti di Matematica e Informatica Laboratorio Informatica I anno a.a
APPROSSIMAZIONE DI FUNZIONI
I modelli di valutazione delle opzioni su tassi
Controllo dei manipolatori in contatto con l'ambiente Relazione sul A.A Giacomo Ziliani Dottorato di ricerca in Meccanica Applicata XIX ciclo.
Relatore: Prof. Vittorio Murino Correlatore: Dott. Andrea Fusiello Università degli Studi di Verona Facoltà di Scienze MM.FF.NN. Corso di Laurea in Informatica.
Reti Logiche A Lezione 2.1 Sintesi di reti combinatorie a due livelli
A.A. 2005/2006Sintesi di volti virtuali da foto ortogonali 1 Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Informatica Università.
Valutazione di scenari alternativi di gestione dei rifiuti urbani per un territorio provinciale Antonio Scipioni Tania Boatto
Esempio di riconoscimento biometrico
Perdite istantanee e Cadute lente in travi di CAP
UNIVERSITA’ DI GENOVA SCUOLA POLITECNICA
Esercitazione N°5 Approssimazione di Funzioni. Esercizio 1 Costruzione di una rete RBF Il metodo più semplice per approssimare una funzione mediante reti.
Transcript della presentazione:

Relatore: Dott. F. Avanzini Correlatore: Dott. C. Drioli Università degli Studi di Padova Dipartimento di Ingegneria dell’Informazione TESI DI LAUREA INVERSIONE DI UN MODELLO FISICO DELL’APPARATO FONATORIO MEDIANTE PROGRAMMAZIONE DINAMICA E RETI RBF Relatore: Dott. F. Avanzini Correlatore: Dott. C. Drioli Laureando: Enrico Marchetto A.A. 785 – 2006/2007

Sommario Sintesi della voce mediante il calcolatore Modello fisico della glottide L’impulso glottale ed il codebook diretto Il problema inverso La programmazione dinamica Le Radial Basis Function Networks Realizzazione e risultati

La sintesi vocale Produzione di un segnale vocale mediante il calcolatore a partire da un testo scritto Obiettivi Parlato intelligibile Presenza di emotività nel parlato sintetico Sintesi per modelli fisici Usa esclusivamente segnali sintetici e non fa ricorso ad alcun tipo di sorgente registrata Synthesis-by-analysis Sintetizza un parlato il più simile possibile ad una registrazione di partenza

Il modello fisico Modellazione mediante equazioni del comportamento fisico di tutti gli organi legati al processo di fonazione Pro: Controllo accurato della sintesi Possibilità di riprodurre voice quality, identità del parlatore, ecc. Codifica efficiente del parlato Contro: Modelli ancora non del tutto soddisfacenti Costi computazionali più elevati Assenza di efficaci tecniche di controllo Complessità delle tecniche di inversione Motivazione al lavoro di tesi Contributo al problema aperto di inversione del modello

Il modello fisico Due parti principali: Il tratto vocale Sequenza di tubi acustici La glottide; sistema non lineare tempovariante Modello meccanico del moto delle corde vocali Descrizione fluidodinamica della colonna d’aria Lavoro incentrato sul solo modello della glottide No tratto vocale No consonanti Riferimento soli suoni vocalici Contengono la maggior parte dell’informazione sul parlatore e sulla voice quality/emotività

Il controllo del modello Attivazioni muscolari Crico-tiroideo Tiro-aritenoideo Crico-aritenoideo laterale Pressione subglottale Conversioni di dominio Attivazioni muscolari in parametri geometrici Par. geometrici in par. meccanici Parametri acustici misurati negli istanti critici dell’impulso f0, OQ, SQ, OingQ, CingQ, RQ Costruzione di un Codebook Vettori di attivazione muscolare Vettori di par. acustici misurati Coppie <attivazione, v. acustico> Spiegare a voce i parametri acustici: significato fondamentale, almeno di alcuni.

Il problema inverso E’ dato un impulso glottale i cui parametri acustici sono noti Stimare le attivazioni muscolari che portano alla sintesi di un impulso con parametri acustici “simili” a quelli dati Non-univocità del problema E’ noto che diverse impostazioni muscolari comportano la produzione del medesimo flusso glottale Approccio al problema proposto nel presente lavoro: Impiego di sequenze di impulsi glottali: il frame acustico Minimizzazione dello sforzo articolatorio mediante opportune funzioni di costo Simile a quanto accade fisiologicamente Applicazione delle funzioni di costo al frame acustico E’ possibile imporre la continuità delle attivazioni muscolari durante il frame e nella transizione tra frame adiacenti

La programmazione dinamica Costruzione di un codebook inverso Coppie <v. acustico, attivazione> Ciascun vettore acustico può essere associato a diverse attivazioni elevato numero di non-univocità Funzione di costo: Ricerca dell’ottimo globale della funzione di costo Problema con sottostruttura ottima Presenza di sottoproblemi ripetuti Programmazione dinamica Fase forward: calcolo della f. di costo Backtracking: minimizzazione Ascissa: sequenza di v. acustici Ordinata: vettori di attivazione associati a ciascun v. acustico ottenuti dalla ricerca nel codebook inverso Traccia: scelta ottima trovata con il backtracking Mettere la funzione esplicitamente

Le Radial Basis Function Networks Si tratta di reti neurali adatte a risolvere problemi di interpolazione Basate sulla pesatura di funzioni gaussiane radiali Teoria della regolarizzazione Il codebook inverso ha cardinalità finita e presenta problemi dovuti alla discretizzazione Le reti RBF permettono di interpolare lo spazio delle attivazioni del codebook inverso; interpolazione Necessità di preparare il codebook inverso per l’interpolazione Reti RBF efficaci solo con funzioni Presenza di non univocità il codebook non è descrivibile come funzione

Il codebook interpolato Per applicare le RBF al codebook inverso è essenziale che in ogni subcluster non ci siano non univocità Suddivisione dello spazio acustico (vettori acustici) in cluster e sottocluster Suddivisione dello spazio delle attivazioni in subcluster privi di non-univocità Realizzazione di un algoritmo ad-hoc per l’individuazione delle ipersuperfici in R4 Sottocluster Cluster Spazio acustico Subcluster attivazioni Spazio delle Inserire figura ipersuperfici e “insiemi”; ridurre il testo… Sequenza data di vettori acustici Sequenza ottima di vettori di attivazione N vett. di attivazione N vett. acustici Interpolazione con reti RBF Ottimizzazione con Prog. Dinamica NxM vett. di attivazione

Realizzazione e risultati Realizzazione di tutto il software in ambiente Matlab Creazione dei codebook diretto, inverso e con pesi delle RBF Inseguimento di un segnale fittizio per la taratura della f. di costo Lookup inverso con ottimizzazione mediante pro-grammazione dinamica Lookup nel codebook diretto per verificare le attivazioni trovate

Realizzazione e risultati Identico processo della precedente diapositiva, ma usando reti RBF Si noti la maggior continuità delle attivazioni muscolari Lookup inverso con ottimizzazione mediante pro-grammazione dinamica Lookup nel codebook diretto per verificare le attivazioni trovate

Realizzazione e risultati Risintesi di un segnale vocale registrato Procedura utilizzata Filtraggio inverso del segnale con estrazione formanti e flusso glottale Traslazione vettori acustici entro il range del codebook inverso Lookup inverso per ottenere i vettori di attivazione Risintesi del flusso glottale Convoluzione del flusso glottale sintetico con i formanti Vettori acustici: originali e della risintesi

Conclusioni L’approccio al problema si è rivelato corretto Le funzioni di costo portano ad un opportuno inseguimento dei vettori di ingresso, garantendo nel contempo buona continuità delle attivazioni Le programmazione dinamica riduce la complessità esponenziale del problema di minimizzazione ed evita i sottoproblemi ripetuti Le reti neurali portano ad interpolazioni corrette che, pur in misura minore rispetto alle aspettative, migliorano le prestazioni del codebook Corretto inseguimento del segnale fittizio di riferimento Risintesi di buona qualità di un suono vocalico registrato con variazioni di pitch e voice quality Realizzazione del pacchetto di algoritmi necessari Interfaccia utente grafica per l’inversione e per l’impiego del codebook Futuri sviluppi Procedure analiticamente corrette per tarare le reti neurali Necessità di un modello fisico di qualità migliore Introduzione del modello del tratto vocale ed ottimizzazione congiunta