UNIVERSITA DI MODENA E REGGIO EMILIA Facolta di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Tesi di laurea di Relatore Correlatore.

Slides:



Advertisements
Presentazioni simili
DBMS (DataBase Management System)
Advertisements

Informatica Recupero debito quarto anno Terzo incontro.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità C1 Il linguaggio SQL.
Analizzatori Lessicali con JLex
una interfaccia internet per il sistema Momis
di Architetture Peer to Peer per la Gestione di Database Distribuiti
Nana Mbinkeu Rodrigue Carlos 1 DB unimo OTTIMIZZAZIONE DI QUERY IN MOMIS Università degli studi di Modena e Reggio Emilia Relatore: Prof. Sonia.
INTEGRAZIONE MULTILINGUA DI PUBBLICA AMMINISTRAZIONE: SIAM
Query OQL e XQUERY a confronto
DOCUMENTAZIONE DI SCHEMI E/R
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Progetto e realizzazione di un wrapper XML Schema per il sistema MOMIS
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
Interoperabilità tra ontologie eterogenee: i traduttori ODLI3 - OWL
Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico.
a mediatore MOMIS nell’integrazione di
Università degli studi di Modena e Reggio Emilia
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Il sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente di.
Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Relatore: Prof.ssa.
Integrazione di standard di classificazione per le-commerce: una nuova metodologia basata sul sistema MOMIS UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Re-engineering del wrapper XML Schema per il sistema MOMIS
DOCUMENTAZIONE DI SCHEMI E/R
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
U NIVERISTÀ DEGLI S TUDI DI M ODENA E R EGGIO E MILIA Facoltà di Ingegneria - Sede di Modena Corso di Laurea in Ingegneria Informatica Dinamica delle Ontologie:
Controrelatore Chiar.mo Prof. Flavio Bonfatti
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Semantic.
Serializzazione di oggetti in formato XML nellambito del sistema MOMIS Davide Lenzi Chiar.mo Prof. Sonia Bergamaschi Chiar.mo Prof. Michele.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia Facoltà dIngegneria - sede di Modena Corso di Laurea in Ingegneria Informatica Interoperabilità di componenti.
Università degli Studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e realizzazione.
Progetto e realizzazione del software "Solar Data Manager"
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Ontologie Lessicali Multilingua:
Analisi e Contromisure di tecniche di Sql Injection
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Data warehousing con SQL Server
4 – Progettazione – Introduzione e Modello E-R
Basi di Dati prof. A. Longheu 4 – Progettazione – Introduzione e Modello E-R Cap. 5 Basi di dati Atzeni – Ceri – Paraboschi - Torlone.
Corso di Informatica (Basi di Dati)
Progetto e Sviluppo di un algoritmo per la gestione della Federazione Interdominio in unarchitettura di Service Discovery Candidato: XXX Roma, Febbraio.
Tema 1: Integrazione di dati provenienti da sorgenti eterogenee
CVM un modello concettuale per la gestione di versioni di schema in un contesto di integrazione Fabio Grandi DEIS - Università di Bologna.
Normalizzazione Le forme normali certificano che la base di dati soddisfa criteri di qualità che mirano ad evitare le ridondanze e i conseguenti effetti.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA INFORMATICA Relatore: Chiar.mo Prof. Paolo Tiberio.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA DI MODENA Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO E REALIZZAZIONE.
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Il componente Query Manager del sistema MOMIS: testing ed analisi delle performance UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA _____________________________________________________.
Corso di Basi di Dati Il Linguaggio SQL Home page del corso:
Basi di Dati e Sistemi Informativi Il Linguaggio SQL Home page del corso:
SQL.
Corso di Informatica Corso di Laurea in Conservazione e Restauro dei Beni Culturali Gianluca Torta Dipartimento di Informatica Tel: Mail:
 La tesi si inquadra nell’ambito del Sistema MOMIS, realizzato da DataRiver, rilasciato giovedì15 aprile in una prima versione Open Source, ed è stata.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO DI INGEGNERIA “Enzo Ferrari” Corso di Laurea in Ingegneria Informatica Anno Accademico 2013/2014.
Fondamenti di Informatica 2 Ingegneria Informatica Docente: Giovanni Macchia a.a
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTA’ DI INGEGNERIA – SEDE DI MODENA CORSO DI LAUREA IN INGEGNERIA INFORMATICA Anno Accademico 2002/2003.
Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
MOMIS WordNet Service level legenda ODB-Tools Global Schema METADATA REPOSITORY Global Schema METADATA REPOSITORY CORBA Object User GUI Data level Global.
Software per la creazione di un file XML di test del sistema MOMIS 10 December 2002 Alain Fergnani.
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
1 DB unimo CROSS LAB Integrazione framework MOMIS - BCI Parma, 18/09/2007 Sonia Bergamaschi, Maurizio Vincini, Mirko Orsini
Transcript della presentazione:

UNIVERSITA DI MODENA E REGGIO EMILIA Facolta di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Tesi di laurea di Relatore Correlatore Controrelatore Sviluppo di tecniche di estrazione ed inferenza di relazioni terminologiche nel sistema MOMIS Elisa Marri Chiar.ma Prof. ssa Sonia Bergamaschi Dott. Ing. Domenico Beneventano Chiar.mo Prof. Flavio Bonfatti

SIM ODB-Tools interaction SLIM WordNet interaction ARTEMIS Affinity & Clustering TUNIM Mapping table tuning SIM ODB-Tools interaction SLIM WordNet interaction ARTEMIS Affinity & Clustering TUNIM Mapping table tuning Integration Designer Integration Designer Global Schema Query Manager WordNet ODB-Tools Relational source XML source Object source generic source Wrapper Momis Mediator Service level Data level User Application User Application Corba Object Software tools User Architettura del sistema MOMIS SI-Designer Global Schema Builder creates GUI User interaction Corba interaction

S1S2S3 Generazione Thesaurus Generazione Thesaurus Analisi Affinità e Creazione Cluster Analisi Affinità e Creazione Cluster Generazione attributi globali e mapping-table Generazione attributi globali e mapping-table Common Thesaurus Cluster Schema Globale Processo di integrazione SIM SLIM ARTEMIS TUNIM

Relazioni del Common Thesaurus SYN, BT, NT, RT. SYN EXT, BT EXT, NT EXT.

Relazioni del Common Thesaurus SYN (SYNonym of): definita tra due termini che sono considerati sinonimi, ovvero che possono essere interscambiati poiché identificano lo stesso concetto del mondo reale. BT (Broader-Term) : definita tra due termini tali che il primo ha un significato più generale del secondo. La relazione NT (Narrower-Term) rappresenta la sua opposta. RT (Related-Term) : definita tra due termini che sono usati nello stesso contesto.

S1S2S3 Estrazione Integrazione Validazione Inferenza Relazioni Strutturali Relazioni Validate Relazioni Inferite Thesaurus Comune Relazioni Lessicali Relazioni Integrate Generazione Thesaurus Comune SIMA SIMB

Estrazione delle relazioni strutturali: modulo SIMA Analisi degli schemi delle sorgenti al fine di esplicitare un insieme di relazioni intra-schema già implicite nella struttura degli schemi stessi. Analisi degli schemi ad oggetti Analisi degli schemi relazionali Analisi degli schemi semistrutturati

Analisi degli schemi ad oggetti Si utilizzano le funzionalità del componente esterno ODB- Tools. ODB-Tools effettua lanalisi delle gerarchie di ereditarietà ed aggregazione che legano le classi, siano esse esplicitamente indicate negli schemi (ereditarietà dirette, attributi con domini complessi), o dedotte attraverso lalgoritmo di sussunzione ed espansione semantica.

Analisi degli schemi ad oggetti: Esempio Interface Professor : CS_Person (source object Computer_Science,...) {attribute Office belongs_to; attribute string rank;} sparc20.dsi.unimo.it

Analisi degli schemi relazionali relazione RT: si rileva ogni volta in cui una classe definisce una foreign key. relazione NT EXT : si rileva quando la foreign key è anche chiave (primaria o candidata) della classe che la definisce. relazione SYN EXT : si rileva quando tra due classi sono presenti due relazioni reciproche di NT (o equivalentemente BT). relazione RT partof : esprime un legame piu forte rispetto alla semplice relazione di aggregazione RT. Si rileva quando la foreign key e parte di una chiave (primaria o candidata) della classe che la definisce. Si basa sullo studio delle foreign key e delle chiavi (primarie o candidate) presenti negli schemi da esaminare

Analisi degli schemi relazionali: Esempi Interface Section (source relational University, key (section_code) foreign key (room_code) references Room) {attribute integer section_code; attribute integer room_code;} Interface Graduate_Student (source relational University, key (name) foreign key (name) references School_Member) {attribute string name...} sparc20.dsi.unimo.it

Analisi degli schemi relazionali: Esempio Interface Section (source relational University, extent Sections key (section_code) foreign key (room_code) references Room) {attribute integer section_code; attribute integer room_code; attribute int length; attribute char(30) section_name;} sparc20.dsi.unimo.it

Analisi degli schemi relazionali Affiancando allanalisi delle foreign key uno studio sulle chiavi (primarie e candidate) è possibile, talvolta, evidenziare ulteriori relazioni più forti della semplice RT: relazione NT: si rileva quando la foreign key è anche chiave (primaria o candidata) della classe che la definisce. relazione SYN: si rileva quando tra due classi sono presenti due relazioni reciproche di NT (o equivalentemente BT). relazione RT partof : esprime un legame di aggregazione più forte rispetto alla semplice RT. Si rileva ogni volta in cui la foreign key è parte di una chiave (primaria o candidata) della classe che la definisce.

Analisi degli schemi relazionali relazione RT partof : esprime un legame di aggregazione più forte rispetto alla semplice RT. Si rileva ogni volta in cui la foreign key è parte di una chiave (primaria o candidata) della classe che la definisce. relazioni RT derivate per estensione di relazionigià presenti nel Thesaurus: considerata una determinata classe e tutte le relazioni RT (o RT partof ) che la interessano al primo membro, si possono stabilire nuove relazioni RT tra ogni coppia di classi coinvolte al secondo membro nelle suddette relazioni. relazioni SYN tra attributi: si rileva quando la foreign key è formata da un attributo il cui nome non corrisponde a quello dello stesso attributo nella classe riferita.

Analisi degli schemi relazionali relazioni RT derivate per estensione di relazionigià presenti nel Thesaurus: considerata una determinata classe e tutte le relazioni RT (o RT partof ) che la interessano al primo membro, si possono stabilire nuove relazioni RT tra ogni coppia di classi coinvolte al secondo membro nelle suddette relazioni. relazioni SYN tra attributi: si rileva quando la foreign key è formata da un attributo il cui nome non corrisponde a quello dello stesso attributo nella classe riferita.

Analisi degli schemi semistrutturati Si effettua su tali schemi unanalisi delle eventuali foreign key in modo analogo a quanto avviene per gli schemi relazionali; ad essa si associa poi unanalisi delle eventuali gerarchie di aggregazione utilizzando il componente esterno ODB-Tools.

Analisi sorgenti semistrutturate: Esempio Interface Student (source semistructured tax_Position_xml key student_code) { attribute string name; attribute string faculty_name; attribute integer student_code; attribute integer tax_fee; }; Interface ListOfStudent (source semistructured tax_Position_xml ) { attribute set Student; };.sparc20.dsi.unimo.it

Relazioni ottenute da SIMA

Estrazione relazioni lessicali: modulo SLIM Estrae relazioni lessicali tra nomi di classi ed attributi sulla base dei significati associati dal progettista ai nomi stessi. Utilizza il Dizionario lessicale WordNet.

Relazioni estratte da SLIM

Integrazione del progettista Nuove relazioni possono essere fornite direttamente dal progettista per aggiungere al Common Thesaurus una conoscenza specifica non ricavata automaticamente nelle fasi precedenti. Le relazioni specificate dal progettista possono essere sia di tipo intensionale che estensionale.

Intervento del progettista: relazioni estensionali C1 SYN ext C2: le istanze della classe C1 sono le stesse della classe C2; implica la relazione intensionale C1 SYN C2. C1 NT ext C2: le istanze della classe C1 sono un sottoinsieme di quelle della classe C2; implica la relazione intensionale C1 NT C2. C1 BT ext C2: le istanze della classe C1 sono un sovrainsieme di quelle della classe C2; è equivalente ad una relazione intensionale C1 BT C2.

Validazione delle relazioni fra attributi Scopo di questa fase è verificare, per ogni relazione, che i domini degli attributi coinvolti siano compatibili col tipo di relazione esaminata. Tale procedimento è realizzato dal modulo SIMB interagendo con ODB-Tools, al cui interno sono presenti algoritmi in grado di valutare la compatibilità tra domini. SYN: è validata se i domini dei due attributi coinvolti sono equivalenti, oppure uno è più specializzato dellaltro. BT: è validata se il dominio del primo attributo è equivalente al dominio del secondo attributo, oppure lo contiene. NT: è validata se il dominio del primo attributo è equivalente al dominio del secondo attributo, oppure è in esso contenuto.

Regole per la validazione : Esempio interface Professor (source Object Computer_Science …) {attribute Office belongs_to; attribute string first_name; attribute string last_name; ….} interface Research_Staff (source relational University …) {attribute string name; attribute integer dept_code; attribute string e_mail; ….} [ 1 ] [ 0 ] sparc20.dsi.unimo.it

Validazione delle relazioni tra classi Fase realizzata dal modulo SIMB. Si crea uno schema virtuale nel quale è riportata tutta la conoscenza contenuta nel Common Thesaurus. Partendo dalle informazioni espresse negli schemi originali, ad esse si aggiungono informazioni di sinonimia, ereditarietà, aggregazione derivanti dalle relazioni inserite nel Common Thesaurus fino a quel momento. ODB_Tools è in grado di valutare la consistenza di tale schema: viene eseguita una fase di validazione delle relazioni tra classi che hanno contribuito a generare lo schema virtuale.

Esempio di inconsistenza interface Fast_Food (source semistructured ED …) {… attribute string category;...} interface Restaurant (source relational FD …) {… attribute integer category;...} interface Fast_Food : Restaurant (source semistructured ED …) {… attribute string category;...} ODB-Tools [ 0 ]

Inferenza di nuove relazioni Si utilizza ODB-Tools come motore inferenziale: sulla base delle informazioni contenute negli schemi originali e di quelle espresse dalle relazioni del Common Thesaurus, si deducono automaticamente nuove relazioni (intra-schema o inter-schema).

Risultati della validazione ed inferenza

Software realizzato Approssimativamente sono state prodotte 3000 righe di codice commentato, implementato utilizzando la versione 1.2 del Java Development Kit della Sun disponibile sul Web presso