SOFTWARE E METODOLOGIE per l’analisi e l’annotazione linguistica

Slides:



Advertisements
Presentazioni simili
Prof. Raimondo Schettini
Advertisements

Survey su ADL XML-Based
Linguaggio R Raffaele Miele Dipartimento di Matematica e Statistica Università degli Studi di Napoli Federico II
2 dicembre 2005 AISV 2005 MODELLIZZAZIONE DELLA PROSODIA E DEL TIMBRO PER LA SINTESI DEL PARLATO EMOTIVO Mauro Nicolao, Carlo Drioli, Piero Cosi Copyright,
Code::Blocks Ambiente di sviluppo.
Microsoft Office Project 2003 Standard La Gestione per Progetti nella Piccola e Media Impresa Ettore dAmico Microsoft Italia.
L’Informatica dal Problema alla Soluzione
SCUOLA E SOFTWARE LIBERO LinuxDay, Udine, 23 novembre 2002 Loris Tissino Presentazione parzialmente adattata da un lavoro di Alessandro Rubini, per gentile.
VERSO UN CURRICOLO PLURILINGUE, il “P. E. L
Progetto Campus One: Azione e-learningGenova, 9 aprile 2002 Giancarlo Parodi DIBE Esperienze dal progetto Ingegneria On Line.
5 novembre 2010 Tecnologie per la promozione e la valorizzazione del patrimonio culturale - Vincenza Ferrara Musei e nuove tecnologie Attenzione alla Disabilità
Metodologie di Programmazione = decomposizione basata su astrazioni
Connessione con MySQL.
LIM lavagna interattiva multimediale
Dr. Giovanni Stracquadanio
Copyright, 2006 © ISTC-SPFD-CNR ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE Piero Cosi SEZIONE DI PADOVA - FONETICA E DIALETTOLOGIA Via G. Anghinoni,
Uno strumento per lannotazione e la modellizzazione prosodica di enunciati marcati per un sistema di sintesi vocale Andrea Panizza Francesca Tini Brunozzi.
Copyright, 2005 © ISTC-SPFD-CNR ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE Viale Marx, Roma (Italy) www:
Introduzione a Macromedia Flash
BASI DI DATI BIOLOGICHE - 1. Sommario Introduzione. La analisi biologiche e i dati che producono. Organizzazione dei dati. Esempi.
Introduzione allinformatica. Cosè linformatica ? Scienza della rappresentazione e dellelaborazione dellinformazione ovvero Studio degli algoritmi che.
Istituzioni di linguistica
UNIVERSITA DEGLI STUDI DI PAVIA Corso di Laurea Interfacoltà in Comunicazione Interculturale e Multimediale Usabilità dei Siti Flash: problemi e strategie.
ICT (Information and Communication Technology):
IL PATRIMONIO DI DATI - LE BASI DI DATI. Il patrimonio dei dati Il valore del patrimonio di dati: –Capacità di rispondere alle esigenze informative di.
Gli Apprendimenti nella Disabilità uditiva e le Nuove Tecnologie
Unalternativa a Microsoft Office OpenOffice Author Kristian Reale Rev by Kristian Reale Liberamente distribuibile secondo i termini della licenza.
Author Kristian Reale Rev by Kristian Reale Liberamente distribuibile secondo i termini della licenza GNU Free Document Author Kristian Reale Rev.
Un approccio costruttivista alla geometria
Dalla biblioteca-catalogo alla biblioteca-nodo di rete*
Cos’è un CMS? Content Management System
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dellInformazione Applicazione.
Ufficio Studi Metodologia per lidentificazione delle imprese ICT operanti in Toscana e per la creazione del database BI4IT Contributo di Unioncamere Toscana.
DBMS ( Database Management System)
Le nuove frontiere della Resocontazione
Introduzione alla modellazione di sistemi interattivi
GEOFFREY LEECH A GUIDE TO GOOD PRACTICE ADDING LINGUISTIC ANNOTATION Federica Chierici.
Che cos’è l’annotazione di un corpus?
iDoctorPad – The Doctor’s Companion
ARCHITECTURAL TOOLS FOR RHINO
CampusBlog - Campuswin Sistema Informativo di Ateneo CampusBlog.
Strumenti tecnologici per compensare la disabilità
Cos’è Internet Una rete globale di reti basata sul protocollo TCP/IP.
Digital Cemetery Il programma per la Gestione Cimiteri
L’ingegneria del software
Introduzione a XI Conferenza nazionale di Statistica febbraio 2013 Pillole formative di statistica.
Sviluppo Web Agile con Castle MonoRail Diego Guidi DotNetMarche.Start() 12 ottobre 2006.
PORTALE CISCO PROJECT WORK: PORTALE CISCO A cura di: Bellifemine Davide DAlonzo Salvatore Trombino Angelo Zappacosta Luca.
Corso di Web Services A A Domenico Rosaci 1. Introduzione
OJS - Open Journal Systems a Messina Seminario residenziale CIBER Amalfi giugno 2008 Nunzio Femminò CAB Università di Messina
Lettura e analisi statistiche dei dati e computer analysis
Realizzazione Sito Web
INTERFACCE Schede elettroniche che permettono al calcolatore di comunicare con le periferiche, che possono essere progettate e costruite in modo molto.
La piattaforma didattica
RALLENTATORE VOCALE (1)
Star Office è una suite di software di produttività personale commercializzata da Sun Microsystems. StarOffice nasce come software commerciale sviluppato.
Software Libero e Open Source. Open Source Open Source è un termine inglese che significa sorgente aperto, e indica un programma per computer (software)
Copyright, 2005 © ISTC-SPFD-CNR Salerno 1 Dicembre 2005 Università degli Studi di Salerno Campus di Fisciano - "Aula delle Lauree di Ingegneria"
Tecnologie Informatiche ed Elettroniche per le Produzioni Animali (corso TIE) CORSO LAUREA MAGISTRALE IN SCIENZE E TECNOLOGIE DELLE PRODUZIONI ANIMALI.
TECNOLOGIE PER LA DISABILITA’ UDITIVA
TW Asp - Active Server Pages Nicola Gessa. TW Nicola Gessa Introduzione n Con l’acronimo ASP (Active Server Pages) si identifica NON un linguaggio di.
LINGUAGGI DI PROGRAMMAZIONE Per comunicare comandi e dati ad un computer occorre un particolare linguaggio detto LINGUAGGIO MACCHINA, che è un insieme.
Esperienze didattiche con la LIM
1 Metodologie di Programmazione = decomposizione basata su astrazioni.
Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.
Eprogram SIA V anno.
Sistemi distribuiti Sistema distribuito indica una tipologia di sistema informatico costituito da un insieme di processi interconnessi tra loro in cui.
… una soluzione per l’eLearning e la condivisione delle informazioni cos’è la piattaforma Moodle le caratteristiche di Moodle come viene implementata dal.
COMPONENTI DI UN SISTEMA INFORMATICO HardwareSoftware Parte fisicaComponenti logiche Componenti fisiche (elettroniche e meccaniche) di un computer Istruzioni.
REGIONE TOSCANA Regione Toscana ART
Transcript della presentazione:

SOFTWARE E METODOLOGIE per l’analisi e l’annotazione linguistica Piero Cosi ISTITUTO DI SCIENZE E TECNOLOGIE DELLA COGNIZIONE SEZIONE DI PADOVA - “FONETICA E DIALETTOLOGIA” Via G. Anghinoni, 10 - 35121 Padova (Italy) e-mail: cosi@pd.istc.cnr.it www: http://www.pd.istc.cnr.it Copyright, 2006 © ISTC-SPFD-CNR

sommario Introduzione metodologie hardware e software Descrizione di alcuni sistemi pro & contro Considerazioni finali Dimostrazioni Interattive

“Annotazione Linguistica” Con il termine “Annotazione Linguistica" ci si riferisce ad ogni notazione descrittiva o analitica che possa essere applicata a dati linguistici raccolti sotto forma di dati testuali o di dati espressi come funzioni temporali (registrazioni audio, video e/o di dati articolatori o fisiologici). Le notazioni possono includere le trascrizioni di ogni tipo (dalle caratteristiche fonetiche o prosodiche alle strutture della frase, del discorso o del dialogo), “part-of-speech” e altre specifiche annotazioni, analisi sintattiche, annotazioni incrociate con multi-riferimenti, e così via.

Metodologia manuale toni fonemi parole energia f0 formanti

Metodologia automatica trascrizione fonetica # i s t i t u1 t o # allineamento forzato sistema di riconoscimento automatico # i s t i t u1 t o # segmentazione automatica

Emu

Emu EMU è una collezione di strumenti software per la creazione, la manipolazione e l’analisi di database vocali. Il cuore di EMU e rappresentato da un sistema di ricerca nel database che consente di trovare vari segmenti vocali a seconda della loro struttura sequenziale e/o gerarchica all’interno della frase in cui occorrono. EMU include un sistema interattivo per l’etichettatura su vari livelli (parola, fonemi, toni…) che può visualizzare, oltre alla forma d’onda, anche spettrogrammi, formanti e andamenti di f0, e consente la creazione di etichette sequenziali e/o gerarchicamente organizzate. Emu - SourceForge free service to Open Source http://emu.sourceforge.net/ Steve Cassidy (Steve.Cassidy@mq.edu.au) SHLRC Speech Hearing and Language Research Centre, Macquarie University, Sydney, Australia

WaveSurfer

WaveSurfer WaveSurfer è uno strumento Open Source per la visualizzazione e la manipolazione del segnale. E’ adatto a qualsiasi tipo di utenti specializzati o meno, infatti, ha un’interfaccia semplicissima e funzionale Può essere usato in modalità stand-alone ma può anche essere integrato in altre applicazioni ed è estendibile medianti opportuni plug-ins. Consente l’etichettatura e la segmentazione su multilivelli WaveSurfer: http://www.speech.kth.se/wavesurfer/ Jonas Beskow (beskow@speech.kth.se), Kåre Sjölander (kare@speech.kth.se) Centre for Speech Technology (CTT) at KTH in Stockholm, Sweden WaveSurfer per CLIPS Massimo Petrillo (massimo.petrillo@unina.it), Francesco Cutugno (cutugno@unina.it) CIRASS

Aneto

Aneto Aneto è uno strumento per l’analisi prosodica oltre che per la visualizzazione e la manipolazione del segnale E’ adatto a qualsiasi tipo di utenti specializzati o meno Si puo modificare il contorno stilizzato di f0 e risintetizzare il segnale con la nuova prosodia Consente l’etichettatura e la segmentazione Aneto funziona su Windows 9x e NT ed è disponibile liberamente a scopi di ricerca e su licenza per scopi commerciali Aneto: http://gps-tsc.upc.es/veu/soft/soft/index.php3 Miquel Febrer, Albert Febrer, Antonio Bonafonte (antonio@gps.tsc.upc.es) e Ignasi Esquerra Department of Signal Theory and Communications Universitat Politècnica de Catalunya Signal Processing Group

SFSWin &WASP

SFSWin SFSWin (WASP) è simile a WaveSurfer, con la differenza che può essere usato solo in modalità stand-alone, anche se c’è la possibilità di utilizzare degli script per automatizzare le procedure. Consente l’etichettatura e la segmentazione su multilivelli SFSWin: http://www.phon.ucl.ac.uk/resource/sfs/ Mark Huckvale (M.Huckvale@ucl.ac.uk) University College London: http://www.phon.ucl.ac.uk/

SpeechAnalyzer

SpeechAnalyzer SpeechAnalyzer è simile a WaveSurfer, con la differenza che può essere usato solo in modalità stand-alone. E’ possibile utilizzarlo assieme a Speech Manager, un programma per la gestione di database vocali, specificatamente progettato per consentire ai linguisti l’analisi di più linguaggi parlati. Consente l’etichettatura (anche IPA da tastiera ) e la segmentazione su più livelli SpeechAnalyzer: http://www.sil.org/computing/speechtools/speechanalyzer.htm SIL International (Summer Institute of Linguistics): http://www.sil.org/

SpeechViewer

SpeechViewer SpeechViewer è uno strumento Open Source integrato nel software Cslu Speech Toolkit (http://www.cse.ogi.edu/CSLU/toolkit/supported.html ) per la visualizzazione e la manipolazione del segnale. Come WaveSurfer è adatto a qualsiasi tipo di utenti specializzati o meno, infatti, ha un’interfaccia semplicissima e funzionale E’ disponibile il sorgente, quindi, oltre a poter essere usato in modalità stand-alone può anche essere integrato in altre applicazioni. Consente l’etichettatura e la segmentazione su multilivelli SpeechViewer, Cslu Speech Toolkit: http://cslu.cse.ogi.edu/ Centre for Spoken Language Understanding @ OGI, Portland OR, USA

Praat

Praat PRAAT è un potentissimo strumento per l’analisi, la sintesi, la visualizzazione e la manipolazione del segnale. E’ ottimo soprattutto per l’analisi e la sintesi del segnale, ma è principalmente adatto ad utenti specializzati, infatti, l’interfaccia non è semplicissima. È disponibile il sorgente, quindi può essere “personalizzato” e si possono inoltre creare utilissimi script di lavoro per automatizzare le procedure di analisi Consente l’etichettatura e la segmentazione su più livelli PRAAT: http://www.fon.hum.uva.nl/praat/ Paul Boersma (Paul.Boersma@hum.uva.nl) Institute of Phonetic Sciences of the University of Amsterdam: http://www.fon.hum.uva.nl/

SegWin

SegWin SegWin è uno software di ausilio alla costruzione della base di dati ed alla segmentazione del corpus AVIP La sequenza di etichettatura è particolarmente rigida essendo le dipendenze dei livelli di etichettatura automaticamente determinate Consente l’etichettatura e la segmentazione su multilivelli PHN: “fonetico stretto”, PHB: “fonetico largo” o “fonologico della varietà”, WRD: ortografico, PHM: “citation form” (conversione automatica grafema-fonema), TON: “intonativo” Attualmente è specifico al corpus AVIP ma è adattabile anche ad altre basi di dati SegWin M. Refice (refice@poliba.it) , M. Savino, M. Altieri, R. Altieri e A. Enriquez - DEE - Politecnico di Bari

Transcriber

Transcriber Transcriber è uno strumento distribuito come “free software”, su licenza GNU General Public License, che consente la creazione, l’organizzazione ed il mantenimento di corpora vocali. Transcriber è uno strumento rivolto principalmente alla trascrizione di registrazioni di lunga durata, come quelle, ad esempio, relative alle notizie radio televisive. Consente l’etichettatura di parlanti diversi e l’indicazione degli argomenti del dialogo. E’ stato progettato per essere il più semplice possibile ed è facilmente configurabile dall’utente. Transcriber è sviluppato in Tcl/Tk con estensioni in C++ e si basa sul software Snack/WaveSurfer (KTH) Transcriber - Copyright (C) 1998-2000, DGA http://trans.sourceforge.net/en/presentation.php Mathieu Manta, Fabien Antoine, Sylvain Galliano, DGA/CEP/GIP Claude Barras, CNRS/LIMSI (Claude.Barras@limsi.fr)

MultiSpeech

MultiSpeech Multi-Speech (Model 3700), è un programma di analisi del segnale low-cost per Windows®. Utilizza gli hardware multimediali standard (Sound Blaster™) per acquisire, analizzare e riprodurre il segnale. Validissimo per l’analisi non altrettanto per l’etichettatura e la segmentazione Kay Elemetrics http://www.kayelemetrics.com/Product%20Info/3700/3700.htm

Scicon: Pc/MacQuirer,PitchWorks

Scicon: Pc/MacQuirer,PitchWorks Programmi di analisi (Pc/MacQuirer) ed etichettatura (PitchWorks) del segnale low-cost per Windows®. Utilizza gli hardware multimediali standard (Sound Blaster™) per acquisire, analizzare e riprodurre il segnale. Utilizza le ultime convenzioni in fatto di etichettatura su multilivelli, soprattutto per quanto riguarda l’intonazione (TOBI) e dispone di un’ottimo algoritmo per l’estrazione di f0 Scicon http://www.sciconrd.com/

ANVIL: Annotation of Video and Language Data

ANVIL: “ANnotation of VIdeo and Language data” Anvil è uno strumento per l’annotazione di dati audio/video. Anvil consente un’annotazione gerarchica multi-livello con “oggetti” definibili dall’utente e, di conseguenza, di natura arbitraria. La visualizzazione sincronizzata delle immagini video con le annotazioni rendono la codifica assai intuitiva. Sono consentiti legami fra livelli ed è stato realizzato un “project manager” di ausilio alle procedure di ricerca. Anvil è scritto in Java e utilizza il linguaggio XML per la memorizazione dei dati . Anvil: http://www.dfki.de/~kipp/anvil/ Michael Oliver Kipp (kipp@dfki.de) German Research Center for Artificial Intelligence GmbH DFKI GmbH, Stuhlsatzenhausweg 3, D-66123 Saarbrücken Phone: +49 (0) 681 302 5232, Fax: +49 (0) 681 302 5341, Email: info@dfki.de

considerazioni finali sono ormai disponibili molti “buoni” sistemi per l’annotazione linguistica vi sono, per ognuno, pro e contro visto che, non sempre rispondono a tutte le esigenze, sono da preferirsi “sistemi aperti”, (basati su Tcl/tk, Java, ecc.) per consentire una facile interazione qualora sia necessaria una qualche modifica scelte IFD (…………..da prendersi con le pinze!) EMU (etichettatura) o allineamento automatico (mediante ASR allenato su APASCI) PRAAT (analisi) buona annotazione!

WWW Annotazione Linguistica http://www.ldc.upenn.edu/annotation/ (Steven Bird, Mark Liberman, LDC) versione italiana (P. Cosi) http://www.pd.istc.cnr.it/biblos/annotazione-linguistica.htm