Il sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente di.

Slides:



Advertisements
Presentazioni simili
Esame di Stato Prova scritta di Informatica
Advertisements

Introduzione ad XML Mario Arrigoni Neri.
INTRODUZIONE Il framework.NET. Un po di storia Sin dalla prima versione del sistema operativo Windows (1990 circa), nacque la necessità di far comunicare.
DBMS (DataBase Management System)
Commenti C#.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità C1 Il linguaggio SQL.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
XSLT UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico
1 Basi di Dati Semistrutturate e XML Carlo Sartiani Dipartimento di Informatica Università di Pisa Questo lavoro è stato in parte finanziato con i fondi.
una interfaccia internet per il sistema Momis
Nana Mbinkeu Rodrigue Carlos 1 DB unimo OTTIMIZZAZIONE DI QUERY IN MOMIS Università degli studi di Modena e Reggio Emilia Relatore: Prof. Sonia.
INTEGRAZIONE MULTILINGUA DI PUBBLICA AMMINISTRAZIONE: SIAM
Query OQL e XQUERY a confronto
Progetto e realizzazione di un wrapper XML Schema per il sistema MOMIS
Facoltà di Ingegneria di Modena ANALISI E SVILUPPO DI TECNICHE PER
Interoperabilità tra ontologie eterogenee: i traduttori ODLI3 - OWL
Universit à Degli Studi di Modena e Reggio Emilia Facolt à di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Nuovo Ordinamento Didattico.
UNIVERSITA DI MODENA E REGGIO EMILIA Facolta di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Tesi di laurea di Relatore Correlatore.
a mediatore MOMIS nell’integrazione di
Università degli studi di Modena e Reggio Emilia
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Relatore: Prof.ssa.
Integrazione di standard di classificazione per le-commerce: una nuova metodologia basata sul sistema MOMIS UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA.
SQL92 e XQuery1.0 a confronto1 SQL92 E XQUERY1.0 A CONFRONTO Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria - Sede di Modena Corso.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e sviluppo di.
Re-engineering del wrapper XML Schema per il sistema MOMIS
1 Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli Strumenti Esistenti Integrazione di Sorgenti HTML in MOMIS: Analisi Comparativa degli.
U NIVERISTÀ DEGLI S TUDI DI M ODENA E R EGGIO E MILIA Facoltà di Ingegneria - Sede di Modena Corso di Laurea in Ingegneria Informatica Dinamica delle Ontologie:
Controrelatore Chiar.mo Prof. Flavio Bonfatti
Serializzazione di oggetti in formato XML nellambito del sistema MOMIS Davide Lenzi Chiar.mo Prof. Sonia Bergamaschi Chiar.mo Prof. Michele.
Università degli Studi di Modena e Reggio Emilia
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica MOMIS: servizi di wrapping.
UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica Progetto e realizzazione.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
XML Prof. Barbara Pernici Politecnico di Milano aggiornato 10/12/2002.
Prototipo di uno strumento per la produzione di siti Web adattativi in grado di gestire varie coordinate di adattamento Riccardo Torlone Milano, novembre.
Basi di Dati II Sara Romano
Tema 1: Integrazione di dati provenienti da sorgenti eterogenee
CVM un modello concettuale per la gestione di versioni di schema in un contesto di integrazione Fabio Grandi DEIS - Università di Bologna.
Rassegna sui metodi per query rewriting e il query answering using views.
Perché.Net e non più COM/DCOM ? Superamento dei problemi di COM: Richiede una infrastruttura "non semplice" da ogni applicazione (ad esempio Class Factory.
Basi di dati. Vantaggi degli archivi digitali Risparmio di spazio: sono facilmente trasferibili e duplicabili Risparmio di tempo: si può accedere ai dati.
Basi di dati Università Degli Studi Parthenope di Napoli
Introduzione e nozioni fondamentali di sintassi
XML e la generazione di cataloghi multimediali F. Garzotto, L. Mainetti, P. Paolini Politecnico di Milano HOC - Hypermedia Open Center Dipartimento di.
XSLT Trasformazioni XSL Ing. Luca Sabatucci. XSLT Uno dei vantaggi principali nell'utilizzo dell'Extensible Markup Language è la facilità con cui si possono.
Introduzione alla modellazione di sistemi interattivi
Importanza DTD La DTD (Document Type Definition) consente di dichiarare in maniera univoca la struttura di markup mediante la definizione dello schema.
Documentazione automatica su un linguaggio schema di Alessandro Modica Relatore: Fabio Vitali.
Chinosi Michele – matr.: La seconda release di Virtuose basata su database XML La seconda release di Virtuose basata su.
Il componente Query Manager del sistema MOMIS: testing ed analisi delle performance UNIVERSITA DEGLI STUDI DI MODENA E REGGIO EMILIA _____________________________________________________.
Introduzione a Oracle 9i
Il metalinguaggio XML: la nuova frontiera per la codifica dellinformazione Relatore: Ing. Marco Porta Tesi di Laurea di: Andrea Mocchi ANNO ACCADEMICO.
Presentazione del problema Obiettivo: Lapplicazione di Search of Sematic Services permette di ricercare sevizi semantici, ossia servizi a cui sono associati.
 La tesi si inquadra nell’ambito del Sistema MOMIS, realizzato da DataRiver, rilasciato giovedì15 aprile in una prima versione Open Source, ed è stata.
ODMG. L’ODMG L’Object Data Management Group è un consorzio di produttori di ODBMS che ha proposto uno standard per: il modello a oggetti il linguaggio.
Fondamenti di Informatica 2 Ingegneria Informatica Docente: Giovanni Macchia a.a
Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.
Ingegneria del software Modulo 3 -Tecniche di implementazione Unità didattica 1 -Ingegneria dei componenti Ernesto Damiani Università degli Studi di Milano.
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Eprogram informatica V anno.
CORBA in MOMIS MOMIS: Mediator envirOnment for Multiple Information Sources.
Software per la creazione di un file XML di test del sistema MOMIS 10 December 2002 Alain Fergnani.
1 Lixto tools evaluations for HTML data Integration in Momis Lixto tools evaluations for HTML data Integration in Momis Università degli Studi di Modena.
Il linguaggio XML per la rappresentazione dei dati Lo Extensible Markup Language o XML è stato concepito da un gruppo di lavoro del World Wide Web Consortium.
1 Il linguaggio XML per la rappresentazione dei dati Lo Extensible Markup Language o XML è stato concepito da un gruppo di lavoro del World Wide Web Consortium.
Transcript della presentazione:

Il sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente di integrazione e interrogazione di informazioni da sorgenti di dati strutturati e semistrutturati. In particolare: si è adottato un approccio di integrazione delle sorgenti semantico e virtuale linterrogazione viene effettuata sulla vista integrata. Il query manager provvede automaticamente a generare delle query locali, a inviarle alle sorgenti e a integrare i risultati

La fase di integrazione La fase di integrazione, che avviene in maniera semi-automatica attraverso linterazione con il progettista che può agire con laiuto di tools specifici (Odb-Tools, Wordnet, Artemis,…), porta alla produzione di uno schema globale nel linguaggio ODL I3 In particolare: la fase di costruzione del Common Thesaurus, lontologia comune alle diverse sorgenti, è un processo incrementale durante il quale vengono introdotte: relazioni intensionali intra-schema relazioni intensionali inter-schema relazioni aggiunte dal progettista relazioni intensionali inferite Il fatto di pervenire a uno schema in ODL I3 comporta che il progettista debba conoscere un solo linguaggio e non ogni linguaggio di ogni singola sorgente collegata

Larchitettura di MOMIS

Il wrapper Costituisce linterfaccia tra il mediatore e la sorgente: ad ogni sorgente corrisponde un determinato wrapper e ogni wrapper è progettato esclusivamente per una tipologia di sorgenti. Ogni wrapper ha due compiti: in fase di integrazione deve fornire la descrizione della sorgente da integrare nel linguaggio ODL I3 in fase di query processing traduce la query ricevuta dal mediatore (espressa nel linguaggio comune di interrogazione OQL I3 ) in una interrogazione nel query language specifico della sorgente. Deve inoltre esportare i dati ricevuti in risposta, presentandoli al mediatore attraverso il modello comune di dati utilizzato dal sistema.

Le sorgenti XML Extensible Markup Language (XML1.0) è una W3C Recommendation 10-February Si pensa possa diventare un formato universale di scambio dati nel Web XML ha una visione orientata ai dati Lutente può definire i tag come preferisce (per quello che riguarda il nome e il numero) La struttura del documento è ad albero e può essere dotata di elementi innestati a qualsiasi livello di profondità Il documento può contenere una rappresentazione opzionale della propria grammatica, la DTD

DTD - esempio <!ATTLIST Student StudentId ID #REQUIRED tutor CDATA #REQUIRED> <!ATTLIST Professor Prof_code ID #REQUIRED Office_phone CDATA #IMPLIED> <!ATTLIST Division description CDATA #REQUIRED sector CDATA #REQUIRED> […]

I dati semistrutturati I dati semistrutturati sono quei dati dotati di una struttura irregolare, scarsamente definibile a priori e, anche se conosciuta, soggetta a cambiamenti frequenti e senza scadenze preordinate. Il modello OEM (Object Exchange Model) è uno dei modelli più utilizzati per rappresentare i dati semistrutturati. I dati sono visti come collezioni di oggetti che possono assumere un valore atomico o un valore complesso.

MOMIS - dati semistrutturati Anche il sistema MOMIS si basa su una rappresentazione OEM per rappresentare sorgenti semistrutturate. In particolare si definisce: Oggetto semistrutturato: Un oggetto semistrutturato, indicato con so, è una tripla nella forma dove : id è lidentificatore delloggetto label è una stringa che descrive ciò che loggetto rappresenta value è il valore delloggetto che può essere atomico o complesso Object pattern: Dato un insieme di oggetti set l definito sulla sorgente semistrutturata S. Lobject pattern dellinsieme set l è una coppia nella forma, dove l è letichetta degli oggetti correlati allinsieme set l, ed A= label (so) tale che esiste almento un oggetto so appartenente a set l con so so

Esempio

XML vs. OEM A livello di struttura concetto di ordine A livello di dato mancanza di tipizzazione del dato concetto di attributo concetto di riferimento concetto di link XML-Schema

Esempio Modello OEM-like <!ELEMENT Person (first_name, last_name, , Status)> <!ELEMENT Student (year, Course*, homeaddress, rank)> <!ATTLIST Student StudentId ID #REQUIRED tutor CDATA #REQUIRED> <!ATTLIST Professor Prof_code ID #REQUIRED Office_phone CDATA #IMPLIED> […]

Modello XML-GDM Esempio <!ELEMENT Person (first_name, last_name, , Status)> <!ELEMENT Student (year, Course*, homeaddress, rank)> <!ATTLIST Student StudentId ID #REQUIRED tutor CDATA #REQUIRED> <!ATTLIST Professor Prof_code ID #REQUIRED Office_phone CDATA #IMPLIED> […]

XML - sviluppi futuri Sviluppi futuri Integrazione di dati Misure di complessità XML -Schema

Query languages Analisi dei query language esistenti sulla base: 1) Desiderata per un query language 2) XML Query Requirements: working draft 31 January 2000 del W3C XML-QL LOREL XSL XQL XML-GL WEBL caratteristiche generali modello dati funzionalità del linguaggio

XML-QL WHERE $fn CONSTRUCT $fn

XML-GL

Il traduttore DTD-ODL I3 La traduzione di elementi critici Gestione degli attributi Chiavi primarie, esterne, candidate Tipi di dato Strutture dati Composizione di strutture

Il traduttore DTD-ODL I3 Lalgoritmo di traduzione 1. Parsing della DTD 2. Determinazione delle chiavi 3. Traduzione del documento A) Individuazione della DTD B) Risoluzione delle entità e delle sezioni condizionali C) Risoluzione di contenuti innestati Interazione attraverso uninterfaccia grafica con lutente per la scelta delle chiavi Traduzione seguendo le regole di conversione individuate

Il traduttore DTD-ODL I3 Le regole di traduzione Elementi di tipo semplice

Il traduttore DTD-ODL I3 Le regole di traduzione Elementi di tipo complesso

Il traduttore DTD-ODL I3 Le regole di traduzione Attributi

Il traduttore DTD-ODL I3 Le regole di traduzione Occorrenze

Il traduttore DTD-ODL I3 La procedura di traduzione 1. Lettura di un elemento di vectorElement 2. Controllo dellelemento selezionato 3. Creazione di una interfaccia ODL I3 4. Individuazione delle chiavi 5. Analisi delle specifiche di contenuto 6. Traduzione degli attributi dellinterface 7. Individuazione dellinterface successiva

Il software Il software è stato realizzato utilizzando il linguaggio java. In particolare sono state sviluppate circa 5500 righe di codice commentato. Sono state utilizzate le classi java javax.swing.text.html.parser, che nonostante siano state progettate per operare con HTML possono essere utili anche in questo contesto

DTD - esempio <!ATTLIST Student StudentId ID #REQUIRED tutor CDATA #REQUIRED> <!ATTLIST Professor Prof_code ID #REQUIRED Office_phone CDATA #IMPLIED> <!ATTLIST Division description CDATA #REQUIRED sector CDATA #REQUIRED> […]

interface university (source semistructured univers_xml extent university ) { attribute set person ; }; interface person (source semistructured univers_xml extent person key (person_code)) { attribute string person_code ; attribute string first_name ; attribute string last_name ; attribute string ; attribute status status ; }; interface status (source semistructured univers_xml extent status ) { attribute student student ; } union status1 { attribute professor professor ; }; ODL I3 - traduzione

interface student (source semistructured univers_xml extent student key (student_studentid) candidate_key cK0 (student_tutor)) { attribute string student _studentid ; attribute string student_tutor ; attribute string year ; attribute set course ; attribute string homeaddress ; attribute string rank ; }; interface professor (source semistructured univers_xml extent professor key (professor_prof_code)) { attribute string professor _prof_code ; attribute string professor _office_phone ?; attribute string ptitle ; attribute division division ; attribute string rank ; }; ODL I3 - traduzione

Conclusioni Attraverso questo wrapper si permette al sistema MOMIS di interagire con sorgenti semistrutturate Occorre attendere la standardizzazione di un query language per avere un wrapper completo