Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoSimona Grasso Modificato 6 anni fa
1
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio di MOMIS.
2
Sommario Il Web Semantico Le ontologie La dinamica delle ontologie
Il sistema MOMIS L’inserimento di nuove sorgenti Conclusioni
3
Conoscenze di base e conoscenza specifica del dominio
Il WWW oggi La ricerca di informazioni in rete… click Osservazioni Grande quantità di informazioni Difficoltà nel selezionare le informazioni interessanti Uso di HTML non comprensibile dai calcolatori Conoscenze di base e conoscenza specifica del dominio (interpretazione) Molte informazioni Difficoltà di reperire quelle appropriate Difficoltà dei fornitori di mantenere aggiornate e consistenti le informazioni presenti in rete
4
Il WWW domani La ricerca di informazioni in rete… Ontologia
annotazione Ontologia (interpretazione) annotazione (istruzioni) AGENTE (risultati) Il Web Semantico
5
Il Web Semantico “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” “The Semantic Web will bring structure to the meaningful content of Web pages, creating an environment where software agents, roaming from page to page, can readily carry out sophisticated tasks for users.” [Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001] Elementi chiave: Rappresentazione della conoscenza Agenti Ontologie Il Web Semantico è un nuovo modo di vedere il web: l’idea di fondo è quella di definire i dati sul web in modo tale che le macchine siano in grado di utilizzarli per estrarre, e integrare informazioni per conto dell’utente. The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
6
Il Web Semantico Agenti
Sono componenti software con le seguenti proprietà: autonomia reattività pro-attività abilità sociali [M. Wooldridge and N.R. Jennings. Intelligent agents: Theories and practice. The Knowledge Engineering Review.] Raccolgono contenuti dal Web da diverse sorgenti Elaborano informazioni Scambiano i risultati con altri programmi
7
Il Web Semantico Ontologie
“An ontology is an explicit specification of a conceptualization.” [Tom Gruber] Idea di fondo delle ontologie: descrizione di un particolare dominio, da un certo punto di vista, descrizione esplicita, costruzione di un vocabolario per quel dominio, un gruppo usa il vocabolario per accordarsi sul significato dei termini usati, fondamentale per la comunicazione. 1. top-level ontology: descrive concetti molto generali (spazio, tempo, evento, azione, ...) che sono quindi indipendenti da un particolare problema o dominio; si considera ragionevole, almeno in teoria, che anche comunità separate di utenti condividano la stessa top-level ontology; 2. domain e task ontology: descrivono rispettivamente il vocabolario relativo ad un generico dominio (come può essere un dominio medico o automobilistico) o a un generico obiettivo (come la diagnostica, o le vendite), dando una specializzazione dei termini introdotti nelle top-level ontology; 3. application ontology: descrive concetti che dipendono sia da un particolare dominio che da un particolare obiettivo. A proposito della definizione di Gruber According to Gruber an ontology is a quintuple composed of classes, instances, functions, relationships, axioms. Classes correspond to entities of the domain, instances are the actual objects which are in the domain, functions and relationships relate entities of the domain, and finally axioms constrain the meaning and the use of classes and instances, functions and relationships. A proposito della definizione di Guarino From this definition arises the relationship between a conceptualization and the ontology which specifies and formalize it. Each definition presented above highlights a specific aspect of the role played by ontologies. All definitions share the idea that an ontology provides a description of a particular viewpoint about a domain and that such a description must be explicit, because it states a vocabulary for the domain, which is expressed by a certain degree of formality, and that a group commits to use the vocabulary according to the intended meaning associated with it in order to communicate. Glossaries they are a list of terms and their meanings. The meanings are usually expressed in natural language statements that are chiefly aimed at humans. These statements, however, are ambiguous and cannot be used by computer agents; Thesauri add to glossaries the semantics emerging from the definition of the relations between terms, such as the synonym relationship. Typically, they do not provide an explicit hierarchical structure, although this can often be deduced by broader or narrower term specifications. A computer agent can often interpret the relationships defined in a thesaurus univocally; Formal Is-a hierarchies these are ontologies where concepts are organised according to a strict subclass hierarchy. Thus, for these ontologies inheritance is always applicable because it is always the case that if a concept C is a superclass of the concept C0, then any subclass of C must necessarily be a subclass of C0. These ontologies may include only class names; Value restriction these ontologies permit to apply restrictions on the values associated with properties. For example, in describing the concept Book we might restrict the value to associate with the property Author to be composed of maximum two names. These restrictions are usually to be inherited by the sub-concepts of the concept where they are stated for the first time, which clearly poses a problem when the type of hierarchical relation supported by the ontology is not a strict subclass relation; Le ontologie nel web semantico Collezioni di informazioni che definiscono le relazioni tra termini Tipicamente una tassonomia e un insieme di regole inferenziali Contribuiscono a migliorare il risultato delle ricerche nel web
8
Dinamica delle Ontologie
Le ontologie evolvono durante il loro ciclo di vita a causa di: cambiamenti nel dominio cambiamenti nella concettualizzazione condivisa cambiamenti nell’espressione, specificazione nuovi requisiti
9
Strumenti per la gestione delle Ontologie
Strumenti per lo sviluppo OILEd OntoEdit Protégé-2000 WebODE Strumenti per l’integrazione e la fusione Chimaera PROMPT ODEMerge FCA-Merge Osservazioni Forniscono soluzioni parziali Hanno approcci diversi Hanno diverse funzionalità Hanno differenti capacità di aiutare l’utente
10
MOMIS MOMIS Mediator envirOnment for Multiple Information Sources è un sistema intelligente per l’integrazione di dati eterogenei e distribuiti. Principali caratteristiche: “Approccio semantico” all’integrazione Common Thesaurus Global Virtual View (GVV) Interrogazioni sulla Global Virtual View Un modello dei dati comune – ODMI3 Un linguaggio per descrivere gli schemi delle sorgenti ODLI3 (Object Definition Language)
11
MOMIS – Architettura SI-Designer Global Schema QueryManager Wrapper
Data level Wrapper Relational Source XML Object generic legenda CORBA User GUI Software tools CORBA interaction User interaction WordNet Service level ODB- Tools Global Schema METADATA REPOSITORY Global Schema Builder QueryManager • SLIM WordNet interaction SIM ODB-Tools validation ARTEMIS Clustering TUNIM Map. table tuning SI-Designer MOMIS mediator creates Application Integration Designer USER
12
Processo di integrazione
XML <interface> <name=“student”> Common Thesaurus relazioni intra/inter schema relazioni lessicali (annotazione schemi sorgenti) relazioni inserite dall’utente relazioni inferite Tipi di rel.: SYN, NT, BT, RT. Es: CS.Course SYN UNI.Section Calcolo Cluster Schemi Sorgenti ODLI3 Common Thesaurus RDB OODB GloblalClass3 GloblalClass1 GloblalClass2 Mapping tra Schema Globale/ Schemi Locali Global Virtual View GVV
13
MOMIS e la dinamica La gestione della dinamica consiste nella capacità di far fronte a: inserimento di nuove sorgenti, aggiornamento o cancellazione di sorgenti già integrate. MOMIS non è in grado di gestire la dinamica. Nella tesi si è affrontato il problema dell’inserimento di nuove sorgenti nel sistema.
14
Annotazione della GVV La GVV deve essere annotata per aumentarne il potere espressivo. La fase di annotazione assegna agli elementi dello schema globale (classi e attributi) un nome e almeno un significato. Sono stati individuati i casi che si possono verificare per rendere il più possibile automatico il processo. L’annotazione viene eseguita rispetto al DB lessicale WordNet ( La fase di annotazione is foundamental to prepare the schema for the integration with new sources. Moreover, the annotation step allows us to save as much knowledge as possible in the schema that will be then exploited in the next integration sessions.
15
Annotazione della GVV Le classi locali annotate La classe globale
CS.Essay=<essay, {essay#1}> CS.Publication=<publication,{publication#2}> UNI.Article=<article,{article#1}> GlobalClass1 CS.Essay CS.Publication UNI.Article La classe globale Le relazioni nel CT UNI.Article NT CS.Publication CS.Essay GlobalClass1 = <publication, {essay#1,publication#2, article#1}> essay#1 = an analytic or interpretive literary composition publication#2 = a copy of a printed work offered for distribution article#1 = nonfictional prose forming an independent part of a publication La classe globale annotata significati nome forma base senso
16
Nuovo processo di integrazione
GVV annotata Common Thesaurus relazioni intra/inter schema (solo nuove sorgenti) relazioni lessicali (GVV e nuove sorgenti annotate) relazioni inserite dall’utente relazioni inferite Calcolo Cluster Schemi Sorgenti ODLI3 XML Common Thesaurus RDB Nuova OODB Nuova GloblalClass3 GloblalClass1 GloblalClass2 Mapping tra Schema Globale/ Schemi Locali Nuova GVV Let us analyze the final results of the integration process. The Global Virtual View is mainly composed of global classes, each one with its mapping table. We observe that global classes represent a well defined integrated view of the local sources, but they are not related to each other. The relationships saved in the Common Thesaurus are referred to local sources and they are used only to determine clusters. The idea was to better exploit the knowledge contained in the Common Thesaurus. We thought that during the integration of new sources against the GVV, it could be useful to have relationships among global classes. In some ways it was an attempt to preserve some of the knowledge saved in the Common Thesaurus. We have to transform the Common Thesaurus in order to exploit it during the integration of new sources.
17
Vantaggi – Svantaggi Vantaggi Svantaggi
Il processo non riparte da scratch Il processo sfrutta le conoscenze delle precedenti sessioni di integrazione Riduzione dei tempi di integrazione Riduzione degli effetti collaterali, preservando il più possibile lo schema precedente La metodologia di MOMIS viene conservata Svantaggi La GVV deve essere annotata Gli errori delle precedenti sessioni si possono propagare Possibile scarsa rappresentatività del dominio integrato Riduzione dell’espressività dopo diverse sessioni di integrazione
18
Conclusioni Difficoltà nell’implementazione del Web Semantico
La comunità scientifica non ha adottato una linea comune (linguaggi, strumenti, progetti) Difficoltà nella gestione della dinamica delle ontologie Estensione di MOMIS per la gestione dell’inserimento di nuove sorgenti Sviluppo del codice per l’estensione del sistema Futura estensione della gestione ai casi di modifica e cancellazione di sorgenti già integrate Integrazione del lavoro svolto nel progetto SEWASIE
19
SEWASIE SEWASIE (Semantic Webs and AgentS in Integrated Economies) è un progetto finanziato dalla Commissione Europea (Maggio 2002/Aprile 2005). Goal: progettare e implementare un motore di ricerca avanzato basato sulla semantica. I partecipanti: Università degli Studi di Modena e Reggio Emilia (ITALY) CNA SERVIZI Modena s.c.a.r.l. (ITALY) Università degli Studi di Roma “La Sapienza” (ITALY) Rheinisch Westfaelische Technische Hochschule Aachen (GERMANY) Libera Università di Bolzano (ITALY) Thinking Networks AG (GERMANY) Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung eingetragener Verein (GERMANY) IBM Italia SPA (ITALY) Il sito web:
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.