La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Controrelatore Chiar.mo Prof. Flavio Bonfatti UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Corso di Laurea in Ingegneria Informatica Tesi di laurea.

Presentazioni simili


Presentazione sul tema: "Controrelatore Chiar.mo Prof. Flavio Bonfatti UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Corso di Laurea in Ingegneria Informatica Tesi di laurea."— Transcript della presentazione:

1 Controrelatore Chiar.mo Prof. Flavio Bonfatti UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Corso di Laurea in Ingegneria Informatica Tesi di laurea di Guidetti Rossano Relatore Chiar.mo Prof. Sonia Bergamaschi SI-Designer: un tool per lintegrazione di sorgenti distribuite ed eterogenee

2 MOMIS Mediator envirOnment for Multiple Information Sources Sistema di integrazione di sorgenti eterogenee e distribuite. 1) costruzione di una vista globlale sulle sorgenti: lo schema globale 2) lutente formula le richieste di informazioni sullo schema globale ricevendo una risposta unificata Un modello di dati comune, ODL I 3 (derivato dallODL, ODMG) Integrazione in due fasi:

3 Datalevel Wrapper Relational Source Relational Source Wrapper XML Source XML Source Wrapper Object Source Object Source Wrapper generic Source generic Source legenda CORBAObject User GUI Software tools CORBA interaction User interaction WordNet Service level ODB-Tools ODB-Tools Global Schema METADATA REPOSITORY Global Schema METADATA REPOSITORY Global Schema Builder QueryManager SLIMWordNet interaction SIMODB-Tools validation ARTEMISClustering TUNIMMap. table tuning SLIMWordNet interaction SIMODB-Tools validation ARTEMISClustering TUNIMMap. table tuning SI-Designer MOMISmediator creates User Application Integration Designer Integration Designer USERlevel Architettura di MOMIS

4 La costruzione dello schema globale Schemi Sorgenti ODL I 3 Generazione di un Thesaurus Comune

5 Insieme di relazionali intensionali ed estensionali tra nomi di attributi e classi degli schemi sorgenti Le relazioni aggiunte al Thesaurus hanno origini diverse: conoscenza semantica intra-schema ed inter-schema (1)derivate dagli schemi (ODB-Tools) (2)derivate dal lessico (WordNet) (3)fornite dal progettista (4)inferite (ODB-Tools)

6 Relazioni intensionali/terminologiche: esprimono la conoscenza deducibile dalla struttura delle classi e dal significato dei termini (nomi di classi e di attributi) Relazioni estensionali: esprimono la conoscenza deducibile dalle istanze delle classi Sinonimia (stesso concetto) Specializzazione (Broader Terms - BT, Narrower Terms - NT) (le istanze di C1 e C2 sono le stesse) (listanza di C1 contiene quella di C2) Associazione (Related Terms - RT) Tipi di relazioni:

7 Validazione delle relazioni : –relazioni intensionali tra attributi: basata sulla compatibilità dei domini Inferenza di nuove relazioni intensionali ed estensionali usando le tecniche DL (i.e. ODB-Tools) –relazioni estensionali tra classi: basata sulla compatibilità della loro struttura

8 La costruzione dello schema globale Generazione di un Thesaurus Comune Generazione dei Cluster Schemi Sorgenti ODL I 3

9 Generazione dei cluster 1) Calcolo di Coefficienti di affinità per ogni coppia di classi ODL I 3 Room SectionCourseUniversity_Student School_Member Student ProfessorCS_Person Research_Staff DivisionDepartment 0.6 Cl Location Cl ) Algoritmo di clustering: creazione dei gruppi di classi (cluster) che presentano coefficienti di affinità superiori ad una certa soglia Soglia=0.5

10 La costruzione dello schema globale Generazione di un Thesaurus Comune Generazione di Cluster Schemi Sorgenti ODL I 3 Creazione classi globali e Mapping

11 Creazione delle classi globali e Mapping –nome –insieme di attributi globali costruito sulla base di una unione ragionata degli attributi che caratterizzano le classi del cluster C: Per ogni cluster C viene generata una glasse globale G caratterizzata da: 1) unione di tutti gli attributi locali 2) unificazione (o fusione) degli attributi simili: A SYN B A oppure B come attributo globale A NT B B come attributo globale

12 –mapping-table: rappresentazione tabellare delle mapping rules, regole che esprimono il legame tra attributi globali e locali (corrispondenze and / union, valori default / null) name first_name AND last_name Student first_name AND last_name UNI.School_Member University_Person UNI.Research_Staff CS.CS_Personname Null Professor Null dept_code rankworks CS.Professorname rankbelongs_to CS.StudentnameNull Null case rank of course: home_ phd:phd_ TP.University_StudentnameStudentNull

13 La costruzione dello schema globale Generazione di un Thesaurus Comune Generazione di Cluster Schemi Sorgenti ODL I 3 Creazione classi globali e Mapping Schema Globale Mediatore Schema Globale Mediatore

14 SI-Designer

15 Architettura di SI-Designer SI_Designer GlobalSchemaProxy SIMSAMSLIM ARTEMTUNIM GlobalSchema (CORBA) Integration Designer

16 Modularità di SI-Designer I moduli che realizzano le fasi dellintegrazione sono indipendenti gli uni dagli altri. SIDPhase SAMSLIMTUNIM... Per aggiungere una nuova fase è sufficiente creare una classe Java figlia di SIDPhase. Essi sono stati implementati in classi Java figlie di una medesima classe Java astratta SIDPhase, che implementa i metodi di base per linterazione con il modulo principale.

17 Architettura di SI-Designer SI_Designer GlobalSchemaProxy SIMSAMSLIM ARTEMTUNIM GlobalSchema (CORBA) SAM TUNIM SAM: Sources Acquisiton Module SIM: Sources Integrator Module SLIM: Souces Lessical Integrator Module ARTEM: clustering TUNIM: TUNIng of mapping-tables Module

18 SAM Sources Acquisition Module Acquisizione degli schemi ODL I 3 delle sorgenti

19 Acquisizione di uno schema SAM Integration Designer -wrapper name -host name -port# CORBA engine CORBA engine Wrapper (CORBA) Parser ODL I 3 GlobalSchemaProxy Struttura dati ODL I 3 Schemi ODL I 3

20 TUNIM TUNIng of mapping-table Module Aiuta il progettista nella creazione delle classi globali e delle relative mapping-table.

21 Caratteristiche delle classi globali La creazione delle classi globali è una operazione delicata perché è proprio su di esse che lutente formulerà le interrrogazioni. Ogni classe globale deve: –avere un insieme di attributi che rappresenta tutte le informazioni del cluster da cui è stata costruita –permettere la formulazione di interrogazioni semplici ed espressive –tutti gli attributi locali devono essere mappati sugli attributi globali –non ci devono essere, per quanto possibile, attributi globali che rappresentano informazioni concettualmente simili

22 Funzionalità di TUNIM Creazione di una mapping-table iniziale, ottenuta dallunione si tutti gli attributi delle classi appartenenti al cluster in esame Individuazione degli attributi globali simili, vale a dire attributi che rappresentano informazioni concettualmente simili Fusione degli attributi simili (semi-automatica)

23 Creazione automatica della mapping-table iniziale Per ogni attributo locale viene creato un nuovo attributo globale aggiungendo una colonna alla mapping-table. Lattributo locale viene mappato sullattributo globale aggiunto. UNI.School_Member University_Person name UNI.Research_Staff CS.CS_PersonNull name Null faculty Null year Null first_name Null last_name Null facultyyearfirst_namelast_name

24 Individuazione degli attributi globali simili Il modulo costruisce dei grafi –i nodi sono gli attributi –gli archi sono relazioni del Thesaurus Comune in cui:

25 Tra tutte le possibili fusioni individuate, il tool esegue per prima le fusioni eseguibili automaticamente. –attributi legati solamente da relazioni validate di sinonimia (SYN) e non partecipanti a nessun altro tipo di relazione –due attributi legati da una relazione validata di specializzazione name last_name NT last_namesurname SYN SÍ

26 Il tool propone al progettista di risolvere le fusione individuate ma che non possono essere risolte automaticamente. –situazioni ambigue di attributi legati da relazioni validate name last_namefirst_namesurname NT SYN name last_namefirst_name NT

27 –attributi legati da relazioni non validate dept_code (string) belongs_to (object) NT

28 name first_name AND last_name Student first_name AND last_name UNI.School_Member University_Person UNI.Research_Staff CS.CS_Personname Null Professor Null dept_code rankworks CS.Professorname rankbelongs_to CS.StudentnameNull Null case rank of course: home_ phd:phd_ TP.University_StudentnameStudentNull mapping-table finale (dopo le fusioni) mapping-table iniziale (unione degli attributi) UNI.School_Member University_Person name UNI.Research_Staff CS.CS_PersonNull name Null faculty Null year Null first_name Null last_name Null facultyyearfirst_namelast_name

29 Linterfaccia grafica di SAM

30 Linterfaccia grafica di TUNIM

31 Conclusioni Il sistema MOMIS è un sistema di integrazione delle informazioni che introduce: –approccio semantico –intelligenza artificiale SI-Designer offre un reale supporto al progettista dello schema globale: –automazione –interfaccia semplice

32 Sviluppi futuri: –integrazione delle risposte –maggior automazione –sorgenti multimediali Piattaforma di sviluppo: Sun Ultra10 Sistema operativo Solaris 2.7 Java Righe di codice prodotte: 4900

33 Il lavoro svolto nella presente tesi ha ottenuto un riconoscimento nazionale ed internazionale. I risultati della tesi sono contenuti in un articolo presentato all'Ottavo Convegno Nazionale su Sistemi Evoluti per Basi di Dati - {SEBD2000}, L'Aquila, giugno 2000, autori D. Beneventano, S. Bergamaschi, A. Corni, R. Guidetti e G. Malvezzi dal titolo ``SI-Designer: un tool di ausilio all'integrazione intelligente di sorgenti di informazione''. Il componente realizzato durante la tesi è parte importante del sistema MOMIS che verrà presentato alla prossima conferenza internazionale Very Large DataBase {VLDB2000}, Cairo (Egitto), settembre 2000, autori D. Beneventano, S. Bergamaschi, S. Castano, A. Corni, R. Guidetti, G. Malvezzi, M. Melchiori e M. Vincini dal titolo Information Integration: the MOMIS Project Demonstration''.


Scaricare ppt "Controrelatore Chiar.mo Prof. Flavio Bonfatti UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Corso di Laurea in Ingegneria Informatica Tesi di laurea."

Presentazioni simili


Annunci Google