La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico.

Presentazioni simili


Presentazione sul tema: "Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico."— Transcript della presentazione:

1 Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico TESI DI LAUREA DI PRIMO LIVELLO Anno accademico 2003 – 2004 Sistema Momis: analisi sperimentale dell integrazione di una nuova sorgente materiale disponibile allurl Candidato: Matteo Generali Relatore: Prof. Sonia Bergamaschi

2 SYNSET 2 SYNSET # SYNSET 4 SYNSET 1 MANUAL ANNOTATION SEMI-AUTOMATIC ANNOTATION INFERRED RELATIONSHIPS LEXICON DERIVED RELATIONSHIPS SCHEMA DERIVED RELATIONSHIPS Common Thesaurus COMMON THESAURUS GENERATION USER SUPPLIED RELATIONSHIPS ODLI3 LOCAL SCHEMA N WRAPPING ODLI3 LOCAL SCHEMA 1 … GVV GENERATION MAPPING TABLES GLOBAL CLASSES clusters generation Structured source RDB Semi-Structured Source Sistema MOMIS: Mediator envirOnment for Multiple Information Sources

3 Estrazione delle sorgenti locali Sorgente relazionale Sorgente relazionale Wrapper relazionale Wrapper relazionale ODL i3 Sorgente XML DTD Sorgente XML DTD Wrapper DTD Wrapper DTD ODL i3 Sorgente HTML Sorgente HTML Wrapper HTML (Lixto) Wrapper HTML (Lixto)

4 Annotazione delle sorgenti locali Elemento (Classe o Attributo) Elemento (Classe o Attributo) WordNet Annotazione: Word form Significato Annotazione: Word form Significato

5 Generazione del Common Thesaurus SYN (Synonim) BT (Broader Term) NT (Narrower Term) RT (Related Term) Tipi di relazioneOrigini delle relazioni Schema Lessico Aggiunte del progettista ODB-Tools (chiusura transitiva)

6 Generazione della GVV Naming Affinity Coefficient (NA) Calcolato considerando i cammini che legano i nomi di due classi Global Affinity Coefficient (GA) GA = (NA x w NA ) + (SA x w SA ) Valori suggeriti w NA = 0,5 w SA = 0,5 Soglia = 0,5 Structural Affinity Coefficient (SA) Affinità strutturale fra le descrizioni di due classi negli altri casi

7 Annotazione della GVV G = G = Classe Globale annotata CS.Class= UNI.Course= UNI.Teaching= CS.Class= UNI.Course= UNI.Teaching= Classi Locali annotate class#3 = course#1 = education imparted in a series of lessons or class meetings teaching#3 = activities that impart knowledge class#3 = course#1 = education imparted in a series of lessons or class meetings teaching#3 = activities that impart knowledge SignificatiWordNet G= {CS.Class, UNI.Course, UNI.Teaching} significati nomi nome più generale significato più generale Relazioni del Common Thesaurus

8 Integrazione di una nuova sorgente oldSource1 oldSource2 oldSource3 newSource newGVV oldSource1 oldSource2 oldSource3 newSource Primo approccio GVVold oldSource1 oldSource2 oldSource3 newSource Secondo approccio

9 Ricalcolo della GVV sfruttando la GVV precedente GCnew GColdLCnew GCnew LCnew GCnew GCold LCnew Caso 1 Caso 2 Caso 3

10 Sperimentazione Esperimento 1 Sperimentazione Caso 1 e Caso 2 Confronto tra le GVV ottenute Esperimento 2 Sperimentazione Caso 3 Analisi teorica del Caso 3

11 Esperimento 1: esempio + = GVVold.Indirizzo subfor.Indirizzo GVVnew.Indirizzo

12 Confronto tra i due approcci Risultati finali confrontabili Il primo approccio è più oneroso nel numero delle relazioni Il secondo approccio ha un potere espressivo inferiore Il secondo approccio si presta a procedure con intervento minimo del progettista, il primo approccio consente maggiore interazione

13 Esperimento 2 La sua presenza può compromettere la struttura della GVV come vista da applicazioni che svolgono query su di essa Il terzo caso di integrazione è più complesso:

14 Esperimento 2: esempio Riepilogo AB C NT NA = 0,4 SA 0,1 NT NA = 0,4 SA 0,1 RT NA = 0,32 SA < 0,25

15 Esperimento 2: conclusioni Il terzo caso di integrazione introduce una possibile inefficacia della GVV Solamente casi limite sono impossibili, molti altri sono realizzabili in teoria Talvolta è conveniente affrontare il terzo caso come estensione di uno degli altri due


Scaricare ppt "Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico."

Presentazioni simili


Annunci Google