Controrelatore Chiar.mo Prof. Flavio Bonfatti

Slides:



Advertisements
Presentazioni simili
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA
Advertisements

Linguaggi di Programmazione e compilatori
una interfaccia internet per il sistema Momis
di Architetture Peer to Peer per la Gestione di Database Distribuiti
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria - Sede di Modena Corso di Laurea in Ingegneria Informatica Elaborazione di interrogazioni.
Nana Mbinkeu Rodrigue Carlos 1 DB unimo OTTIMIZZAZIONE DI QUERY IN MOMIS Università degli studi di Modena e Reggio Emilia Relatore: Prof. Sonia.
INTEGRAZIONE MULTILINGUA DI PUBBLICA AMMINISTRAZIONE: SIAM
Query OQL e XQUERY a confronto
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Progetto e realizzazione di un wrapper XML Schema per il sistema MOMIS
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
Interoperabilità tra ontologie eterogenee: i traduttori ODLI3 - OWL
Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico.
UNIVERSITA DI MODENA E REGGIO EMILIA Facolta di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Tesi di laurea di Relatore Correlatore.
Obiettivo della tesi Percorso
WebProfessional Web Content Management System
a mediatore MOMIS nell’integrazione di
Università degli studi di Modena e Reggio Emilia
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Il sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente di.
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Relatore: Prof.ssa.
Integrazione di standard di classificazione per le-commerce: una nuova metodologia basata sul sistema MOMIS UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Re-engineering del wrapper XML Schema per il sistema MOMIS
DOCUMENTAZIONE DI SCHEMI E/R
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
U NIVERISTÀ DEGLI S TUDI DI M ODENA E R EGGIO E MILIA Facoltà di Ingegneria - Sede di Modena Corso di Laurea in Ingegneria Informatica Dinamica delle Ontologie:
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic.
Serializzazione di oggetti in formato XML nellambito del sistema MOMIS Davide Lenzi Chiar.mo Prof. Sonia Bergamaschi Chiar.mo Prof. Michele.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia Facoltà dIngegneria - sede di Modena Corso di Laurea in Ingegneria Informatica Interoperabilità di componenti.
Università degli Studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
Università degli studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e realizzazione.
Progetto e realizzazione del software "Solar Data Manager"
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua:
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Data warehousing con SQL Server
4 – Progettazione – Introduzione e Modello E-R
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Riccardo Torlone RM1, RM3, Polimi, IFAC, CEFRIEL, Engineering, ISUFI
Corso di Informatica (Basi di Dati)
Tema 1: Integrazione di dati provenienti da sorgenti eterogenee
Rassegna sui metodi per query rewriting e il query answering using views.
D2I: Integrazione,Warehousing e Mining di Sorgenti Eterogenee Prototipo per la traduzione di informazioni da modelli di dati sorgenti a modelli di dati.
UML: Extension Mechanism Corso IS I /03 Gianna Reggio Versione 0.0.
Modello Relazionale Definisce tipi attraverso il costruttore relazione, che organizza i dati secondo record a struttura fissa, rappresentabili attraverso.
Approssimazione semantica per routing di interrogazioni in un PDMS Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Corso di Laurea.
Esercizio 1 Convertire il seguente DTD (esercizio 1 sui DTD) in XML Schema:
KAPPAELLE 2008 Roberto Pirrone Università degli Studi Palermo
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Il componente Query Manager del sistema MOMIS: testing ed analisi delle performance UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA _____________________________________________________.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria “Enzo Ferrari” – Sede di Modena Corso di Laurea Specialistica in Ingegneria Informatica.
MODELLO LOGICO DEI DATI
1 Titolo Presentazione / Data / Confidenziale / Elaborazione di... Data Access Layer.
Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Programma del Corso.
 La tesi si inquadra nell’ambito del Sistema MOMIS, realizzato da DataRiver, rilasciato giovedì15 aprile in una prima versione Open Source, ed è stata.
Dati e DBMS DBMS relazionali SQL Progettazione di un DBMS Normalizzazione Programma del Corso di Basi di Dati.
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTA’ DI INGEGNERIA – SEDE DI MODENA CORSO DI LAUREA IN INGEGNERIA INFORMATICA Anno Accademico 2002/2003.
Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
MOMIS WordNet Service level legenda ODB-Tools Global Schema METADATA REPOSITORY Global Schema METADATA REPOSITORY CORBA Object User GUI Data level Global.
Software per la creazione di un file XML di test del sistema MOMIS 10 December 2002 Alain Fergnani.
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
1 DB unimo CROSS LAB Integrazione framework MOMIS - BCI Parma, 18/09/2007 Sonia Bergamaschi, Maurizio Vincini, Mirko Orsini
Introduzione alle Classi e agli Oggetti in Java 1.
Transcript della presentazione:

Controrelatore Chiar.mo Prof. Flavio Bonfatti UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Corso di Laurea in Ingegneria Informatica Tesi di laurea di Guidetti Rossano Relatore Chiar.mo Prof. Sonia Bergamaschi SI-Designer: un tool per l’integrazione di sorgenti distribuite ed eterogenee

Mediator envirOnment for Multiple Information Sources MOMIS Mediator envirOnment for Multiple Information Sources Sistema di integrazione di sorgenti eterogenee e distribuite. Integrazione in due fasi: 1) costruzione di una vista globlale sulle sorgenti: lo schema globale 2) l’utente formula le richieste di informazioni sullo schema globale ricevendo una risposta unificata Un modello di dati comune, ODLI3 (derivato dall’ODL, ODMG)

Architettura di MOMIS SI-Designer Global Schema QueryManager Wrapper Data level Wrapper Relational Source XML Object generic legenda CORBA User GUI Software tools CORBA interaction User interaction WordNet Service level ODB- Tools Global Schema METADATA REPOSITORY Global Schema Builder QueryManager • SLIM WordNet interaction SIM ODB-Tools validation ARTEMIS Clustering TUNIM Map. table tuning SI-Designer MOMIS mediator creates Application Integration Designer USER

La costruzione dello schema globale Schemi Sorgenti ODLI3 Generazione di un Thesaurus Comune

Thesaurus Comune Insieme di relazionali intensionali ed estensionali tra nomi di attributi e classi degli schemi sorgenti conoscenza semantica intra-schema ed inter-schema Le relazioni aggiunte al Thesaurus hanno origini diverse: (1) derivate dagli schemi (ODB-Tools) (2) derivate dal lessico (WordNet) (3) fornite dal progettista (4) inferite (ODB-Tools)

Tipi di relazioni: Relazioni intensionali/terminologiche: esprimono la conoscenza deducibile dalla struttura delle classi e dal significato dei termini (nomi di classi e di attributi) <t1 SYN t2> Sinonimia (stesso concetto) <t1 BT t2> Specializzazione (Broader Terms - BT, Narrower Terms - NT) <t1 RT t2> Associazione (Related Terms - RT) Relazioni estensionali: esprimono la conoscenza deducibile dalle istanze delle classi <C1 SYNext C2> (le istanze di C1 e C2 sono le stesse) <C1 BText C2> (l’istanza di C1 contiene quella di C2)

Validazione delle relazioni: relazioni intensionali tra attributi: basata sulla compatibilità dei domini relazioni estensionali tra classi: basata sulla compatibilità della loro struttura Inferenza di nuove relazioni intensionali ed estensionali usando le tecniche DL (i.e. ODB-Tools)

La costruzione dello schema globale Schemi Sorgenti ODLI3 Generazione di un Thesaurus Comune Generazione dei Cluster

Generazione dei cluster 1) Calcolo di Coefficienti di affinità per ogni coppia di classi ODLI3 2) Algoritmo di clustering: creazione dei gruppi di classi (cluster) che presentano coefficienti di affinità superiori ad una certa soglia Room Section Course University_Student School_Member Student Professor CS_Person Research_Staff 0.375 0.39 0.66 0.54 0.6 0.65 0.68 Division Department Cl 1 2 3 4 Location 5 0.25 Soglia=0.5

La costruzione dello schema globale Schemi Sorgenti ODLI3 Generazione di un Thesaurus Comune Creazione classi globali e Mapping Generazione di Cluster

Creazione delle classi globali e Mapping Per ogni cluster C viene generata una glasse globale G caratterizzata da: nome insieme di attributi globali costruito sulla base di una unione “ragionata” degli attributi che caratterizzano le classi del cluster C: 1) unione di tutti gli attributi locali 2) unificazione (o fusione) degli attributi simili: A SYN B  A oppure B come attributo globale A NT B  B come attributo globale

mapping-table: rappresentazione tabellare delle mapping rules, regole che esprimono il legame tra attributi globali e locali (corrispondenze and / union, valori default / null) name first_name AND last_name ‘Student’ UNI.School_Member University_Person UNI.Research_Staff CS.CS_Person Null ‘Professor’ dept_code rank works CS.Professor belongs_to CS.Student email case rank of ‘course’: home_email ‘phd’:phd_email TP.University_Student

La costruzione dello schema globale Schemi Sorgenti ODLI3 Generazione di un Thesaurus Comune Schema Globale Mediatore Creazione classi globali e Mapping Generazione di Cluster

SI-Designer

Architettura di SI-Designer Integration Designer SI_Designer GlobalSchemaProxy SIM SAM SLIM ARTEM TUNIM GlobalSchema (CORBA)

Modularità di SI-Designer I moduli che realizzano le fasi dell’integrazione sono indipendenti gli uni dagli altri. SIDPhase SAM SLIM TUNIM ... Per aggiungere una nuova fase è sufficiente creare una classe Java figlia di SIDPhase. Essi sono stati implementati in classi Java figlie di una medesima classe Java astratta SIDPhase, che implementa i metodi di base per l’interazione con il modulo principale.

Architettura di SI-Designer GlobalSchemaProxy SIM SAM SLIM ARTEM TUNIM SAM TUNIM GlobalSchema (CORBA) SAM: Sources Acquisiton Module SIM: Sources Integrator Module SLIM: Souces Lessical Integrator Module ARTEM: clustering TUNIM: TUNIng of mapping-tables Module

SAM Sources Acquisition Module Acquisizione degli schemi ODLI3 delle sorgenti

Acquisizione di uno schema CORBA engine Integration Designer SAM -wrapper name -host name -port# Struttura dati ODLI3 Parser ODLI3 Wrapper (CORBA) Schemi ODLI3 GlobalSchemaProxy

TUNIM TUNIng of mapping-table Module Aiuta il progettista nella creazione delle classi globali e delle relative mapping-table.

Caratteristiche delle classi globali La creazione delle classi globali è una operazione delicata perché è proprio su di esse che l’utente formulerà le interrrogazioni. Ogni classe globale deve: avere un insieme di attributi che rappresenta tutte le informazioni del cluster da cui è stata costruita permettere la formulazione di interrogazioni semplici ed espressive tutti gli attributi locali devono essere mappati sugli attributi globali non ci devono essere, per quanto possibile, attributi globali che rappresentano informazioni concettualmente simili

Funzionalità di TUNIM Creazione di una mapping-table iniziale, ottenuta dall’unione si tutti gli attributi delle classi appartenenti al cluster in esame Individuazione degli attributi globali simili, vale a dire attributi che rappresentano informazioni concettualmente simili Fusione degli attributi simili (semi-automatica)

Creazione automatica della mapping-table iniziale Per ogni attributo locale viene creato un nuovo attributo globale aggiungendo una colonna alla mapping-table. L’attributo locale viene mappato sull’attributo globale aggiunto. UNI.School_Member University_Person name UNI.Research_Staff CS.CS_Person Null faculty year first_name last_name

Individuazione degli attributi globali simili Il modulo costruisce dei grafi i nodi sono gli attributi gli archi sono relazioni del Thesaurus Comune in cui:

Tra tutte le possibili fusioni individuate, il tool esegue per prima le fusioni eseguibili automaticamente. attributi legati solamente da relazioni validate di sinonimia (SYN) e non partecipanti a nessun altro tipo di relazione last_name surname SYN SÍ due attributi legati da una relazione validata di specializzazione name last_name NT

Il tool propone al progettista di risolvere le fusione individuate ma che non possono essere risolte automaticamente. situazioni ambigue di attributi legati da relazioni validate name last_name first_name surname NT SYN name last_name first_name NT

attributi legati da relazioni non validate dept_code (string) belongs_to (object) NT

mapping-table iniziale (unione degli attributi) UNI.School_Member University_Person name UNI.Research_Staff CS.CS_Person Null faculty year first_name last_name name first_name AND last_name ‘Student’ UNI.School_Member University_Person UNI.Research_Staff CS.CS_Person Null ‘Professor’ dept_code rank works CS.Professor belongs_to CS.Student email case rank of ‘course’: home_email ‘phd’:phd_email TP.University_Student mapping-table finale (dopo le fusioni)

L’interfaccia grafica di SAM

L’interfaccia grafica di TUNIM

Conclusioni Il sistema MOMIS è un sistema di integrazione delle informazioni che introduce: intelligenza artificiale approccio semantico SI-Designer offre un reale supporto al progettista dello schema globale: interfaccia semplice automazione

integrazione delle risposte sorgenti multimediali maggior automazione Sviluppi futuri: integrazione delle risposte sorgenti multimediali maggior automazione Piattaforma di sviluppo: Sun Ultra10 Sistema operativo Solaris 2.7 Java 1.2.2 Righe di codice prodotte: 4900

Il lavoro svolto nella presente tesi ha ottenuto un riconoscimento nazionale ed internazionale. I risultati della tesi sono contenuti in un articolo presentato all'Ottavo Convegno Nazionale su Sistemi Evoluti per Basi di Dati - {SEBD2000}, L'Aquila, 26-28 giugno 2000, autori D. Beneventano, S. Bergamaschi, A. Corni, R. Guidetti e G. Malvezzi dal titolo ``SI-Designer: un tool di ausilio all'integrazione intelligente di sorgenti di informazione''. Il componente realizzato durante la tesi è parte importante del sistema MOMIS che verrà presentato alla prossima conferenza internazionale Very Large DataBase {VLDB2000}, Cairo (Egitto), 10-14 settembre 2000, autori D. Beneventano, S. Bergamaschi, S. Castano, A. Corni, R. Guidetti, G. Malvezzi, M. Melchiori e M. Vincini dal titolo “Information Integration: the MOMIS Project Demonstration''.