Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua: MultiWordNet ed EuroWordNet Relatore: Chiar.mo Prof. Sonia Bergamaschi Correlatore: Ing. Daniele Miselli Elaborato di Laurea di: Roberto Rasi
2 Ontologie Lessicali: evoluzione Rappresentazione sistematica di una lingua Parte lessicale + parte semantica Significati generici Non modificabilità Ontologie Lessicali (monolingua): WordNet… meccanismi di estensione (integrati nelle applicazioni) Ontologie Lessicali Multilingua Rappresentazione domini semantici specifici Rappresentazione di più lingue (unontologia, o wordnet, per ogni lingua) Relazioni interlinguistiche Integrazione delle ontologie Expand-model (MultiWordNet) Merge-model (EuroWordNet)
3 MultiWordNet Progetto in corso allistituto ITC-Irst di Trento Obiettivo: costruire un Italian WordNet strettamente allineato con il WordNet di Princeton Implementa il modello teorico denominato Expand-model, cercando di risolverne i problemi: consente ai singoli wordnet di divergere dalla struttura comune sperimentazione di due procedure (semi)automatiche per lacquisizione dei dati (Assign-procedure, LG-procedure) Basato sulla struttura WordNet: Matrice lessicale multilingua, dal synset al multisynset Architettura del database ad add-on (nuovi concetti, differenze linguistiche, lexical gap)
4 EuroWordNet Progetto finanziato dalla Comunità Europea e coordinato dallUniversità di Amsterdam, al quale hanno partecipato diversi stati membri ( ) Obiettivo: costruire database lessicale multilingua europeo, in grado di conservare la ricchezza e la diversità delle lingue rappresentate Implementa il modello teorico denominato Merge-model: necessità di assicurare sufficiente sovrapposizione tra i wordnet (processo di costruzione incrementale a partire da un subset delle risorse di partenza) tecniche di controllo interlinguistiche per la ricerca di errori Un wordnet per ogni lingua rappresentata, simile a WordNet Un Interlingual Index per collegare tra loro i singoli wordnet: possibilità di istanziare diversi tipi di relazioni interlinguistiche (sinonimia, iponimia e ipernimia)
5 Schemi E/R a confronto: parte I
6 Schemi E/R a confronto: parte II
7 Integrazione delle ontologie Dal confronto è emerso: Struttura di EuroWordNet più generale e complessa Tutti gli elementi di MultiWordNet compresi in EuroWordNet Integrazione nello schema concettuale di EuroWordNet Mapping dello schema E/R di MultiWordNet Vantaggi: Schema E/R già disponile Possibilità di estensione con nuovi concetti Struttura compatibile allintegrazione di altre lingue
8 Conclusioni MultiWordNet Modello e implementazione più semplice Struttura dei wordnet forzata da quella WordNet: minore indipendenza nelle relazioni semantiche vs. maggiore compatibilità e facilità di navigazione per le relazioni EuroWordNet Progetto più ambizioso Ricchezza strutturale = maggiore espressività nella rappresentazione Miglior bilanciamento, nellarchitettura, tra parti language dipendent e language indipendent Maggior grado di indipendenza per le lingue rappresentate Migliore predisposizione allintegrazione di nuove ontologie Rischio maggiore di inconsistenze tra diversi wordnet