Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio di MOMIS.
Sommario Il Web Semantico Gli strumenti per l’annotazione Annotea OntoMat Confronti Conclusioni
Il WWW oggi La ricerca di informazioni in rete… - Grande quantità di informazioni - Difficoltà nel selezionare le informazioni interessanti La ricerca è basata sulla sintassi Il WWW domani La ricerca di informazioni in rete... - Informazioni che corrispondono alla richiesta - Facilità nella scelta delle informazioni La ricerca sarà basata sulla semantica Il Web Semantico
Il Web Semantico “The Semantic Web is an extension of the current web in which information is given well-defined meaning, better enabling computers and people to work in cooperation.” [Tim Berners-Lee, James Hendler, Ora Lassila, The Semantic Web, Scientific American, May 2001] Elementi chiave: Annotazioni Ontologie RDF XML Il Web Semantico è un nuovo modo di vedere il web: l’idea di fondo è quella di definire i dati sul web in modo tale che le macchine siano in grado di utilizzarli per estrarre, e integrare informazioni per conto dell’utente. The Semantic Web is a vision: the idea of having data on the web defined and linked in a way that it can be used by machines not just for display purposes, but for automation, integration and reuse of data across various applications.
Il Web Semantico Annotazioni Le annotazioni sono i commenti, le note, le spiegazioni, o altri tipi di note esterne che possono essere allegate a un documento Web Vengono raggruppate per formare Ontologie danno un significato alla pagina web sono fatte dall’utente di solito viste come metadati
Il Web Semantico Ontologie “An ontology is an explicit specification of a conceptualization.” [Tom Gruber] descrizione di un particolare dominio, da un certo punto di vista, descrizione esplicita, costruzione di un vocabolario per quel dominio, fondamentale per la comunicazione. 1. top-level ontology: descrive concetti molto generali (spazio, tempo, evento, azione, ...) che sono quindi indipendenti da un particolare problema o dominio; si considera ragionevole, almeno in teoria, che anche comunità separate di utenti condividano la stessa top-level ontology; 2. domain e task ontology: descrivono rispettivamente il vocabolario relativo ad un generico dominio (come può essere un dominio medico o automobilistico) o a un generico obiettivo (come la diagnostica, o le vendite), dando una specializzazione dei termini introdotti nelle top-level ontology; 3. application ontology: descrive concetti che dipendono sia da un particolare dominio che da un particolare obiettivo. A proposito della definizione di Gruber According to Gruber an ontology is a quintuple composed of classes, instances, functions, relationships, axioms. Classes correspond to entities of the domain, instances are the actual objects which are in the domain, functions and relationships relate entities of the domain, and finally axioms constrain the meaning and the use of classes and instances, functions and relationships. A proposito della definizione di Guarino From this definition arises the relationship between a conceptualization and the ontology which specifies and formalize it. Each definition presented above highlights a specific aspect of the role played by ontologies. All definitions share the idea that an ontology provides a description of a particular viewpoint about a domain and that such a description must be explicit, because it states a vocabulary for the domain, which is expressed by a certain degree of formality, and that a group commits to use the vocabulary according to the intended meaning associated with it in order to communicate. Glossaries they are a list of terms and their meanings. The meanings are usually expressed in natural language statements that are chiefly aimed at humans. These statements, however, are ambiguous and cannot be used by computer agents; Thesauri add to glossaries the semantics emerging from the definition of the relations between terms, such as the synonym relationship. Typically, they do not provide an explicit hierarchical structure, although this can often be deduced by broader or narrower term specifications. A computer agent can often interpret the relationships defined in a thesaurus univocally; Formal Is-a hierarchies these are ontologies where concepts are organised according to a strict subclass hierarchy. Thus, for these ontologies inheritance is always applicable because it is always the case that if a concept C is a superclass of the concept C0, then any subclass of C must necessarily be a subclass of C0. These ontologies may include only class names; Value restriction these ontologies permit to apply restrictions on the values associated with properties. For example, in describing the concept Book we might restrict the value to associate with the property Author to be composed of maximum two names. These restrictions are usually to be inherited by the sub-concepts of the concept where they are stated for the first time, which clearly poses a problem when the type of hierarchical relation supported by the ontology is not a strict subclass relation; Le ontologie nel web semantico Collezioni di informazioni che definiscono le relazioni tra termini Tipicamente una tassonomia e un insieme di regole inferenziali Contribuiscono a migliorare il risultato delle ricerche nel web
Gli strumenti per l’annotazione L’operazione di annotazione sarà fatta sul portale del DBGROUP: www.dbgroup.unimo.it Annotea OntoMat Smore MnM ….. Osservazioni: Permettono di annotare pagine web Hanno approcci diversi Hanno diverse funzionalità
Annotea Realizzato dalla W3C. Il suo client è Amaya. Principali caratteristiche: infrastruttura basata su RDF possibilità di annotare l’intera pagina web o parte di essa annotazioni memorizzate in locale o sul server annotazioni intese come commenti al contenuto delle pagine e completate con metadati http://www.w3.org/2001/Annotea/
OntoMat Realizzato dall’ Università di Karlsruhe. È il riferimento di CREAM (CREAting Metadata) Principali caratteristiche: annotazione memorizzata in un file HTML con codice RDF fa riferimento a classi di Ontologie già esistenti annotazioni memorizzate in locale o sul server annotazioni completate con attributi e relazioni tra istanze http://annotation.semanticweb.org/tools/ontomat
Confronti Annotea OntoMat Facilità d’uso Portabilità Aggiornamento/ sviluppo Ontologie Archiviazione delle Annotazioni Annotea Molto semplice e di facile comprensione Finora è possibile utilizzarlo sia con Windows che con Linux Attualmente è disponibile una versione con capacità un po’ limitate, comunque il codice è disponibile per eventuali estensioni. Si prevede però un motore di ricerca che sfrutti l’annotazione delle pagine Non vengono menzionate, le non sono fatte rispetto a nessuna Ontologia In locale o anche in remoto, espresse in RDF OntoMat E’presente una guida che rende di facile uso le operazioni principali Funziona sia con Windows sia con Linux. Recentemente sono uscite delle versioni anche per altre piattaforme E’ sempre possibile aggiornare le Ontologie scaricandole dal sito, o crearne delle proprie. In continuo sviluppo. Sono divise in classi,e coprono vari aspetti di interesse.
Conclusioni Annotea ed OntoMat sono due tra gli strumenti più importanti per lo sviluppo del Semantic Web Ogni strumento ha un proprio tipo di approccio,e un proprio modo di gestire le Ontologie Attualmente non esiste una linea comune (linguaggi,strumenti,progetti) In futuro saranno realizzati dei motori di ricerca basati sulla semantica per ottimizzare le ricerche sul web