La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico 2006-07.

Presentazioni simili


Presentazione sul tema: "Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico 2006-07."— Transcript della presentazione:

1 Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico

2 Barbara Re2 Agenda Gestione della conoscenza Metadati Ontologie

3 Barbara Re3 Dati Informazione Conoscenza Il DATO è un rozzo numero o fatto es: la matricola è un dato di tipo integer LINFORMAZIONE è il dato contestualizzato es: dimensione storico-geografica e curriculum dello studente La CONOSCENZA è linformazione che è stata autenticata e assunta essere vera es: percezione soggettiva delle qualità della persona

4 Barbara Re4 Dati – informazione - Conoscenza - Saggezza «Linformazione diventa conoscenza solo dopo essere stata processata dalla mente di un individuo» CONOSCENZA ESPLICITA Può essere catturata e codificata nei manuali, nelle procedure e nelle regole e quindi è facile da diffondere CONOSCENZA TACITA Non può essere facilmente articolata e quindi esiste solo nelle mani e nella mente degli individui

5 Barbara Re5 Conoscenza Tacita ed Esplicita

6 Barbara Re6 Processi coinvolti

7 Barbara Re7 Modello di Nonaka

8 Barbara Re8 La gestione della conoscenza CONDIVISIONE Il macro processo che consente il mantenimento dei fluissi informativi su cui si basa la gestione della conoscenza, attraverso il supporto strutturato ai processi di comunicazione ed allagire del sistema sociale ACQUISIZIONE Il macro processo che consente lesplicitazione della conoscenza tacita ed implicita (come le razionalità soggiacenti ai comportamenti degli attori), a partire da dati, informazioni e rappresentazioni ORGANIZZAZIONE Il macro processo che consente la gestione della memoria della conoscenza, sotto forma di rappresentazioni trattabili attraverso strumenti informatici. ACCESSO Il macro processo che consente il recupero della conoscenza attraverso modalità di ricerca svolte o assistite da elaboratore SUPPORTO Il macro processo che migliora le condizioni di esercizio dei processi cognitivi in situazione attraverso un uso mirato delle tecnologie digitali

9 Barbara Re9 KMS: cosè? Cosè un KMS? Un KMS è un ambiente integrato che utilizza le tecnologie di supporto ai processi di gestione della conoscenza per permettere alle organizzazioni di sfruttarne i vantaggi KMS o portale? Un portale è unapplicazione web- based che offre un singolo punto daccesso a informazioni distribuite Un portale è solo il livello più esterno di una struttura che prevede quattro strati funzionali

10 Barbara Re10 KMS: funzionalità

11 Barbara Re11 Cosa sono i metadati e le ontologie!! Cosa sono i metadati Data about data ? Descrizioni Descrizioni di una risorsa ? Relazioni tra risorse ? Catturano informazione presente nella risorsa ma non elaborabile in automatico ? presente nel contesto in cui la risorsa è inserita ? Cosa sono le ontologie ontologie? Cosa sono le ontologie ontologie? Specifica di un vocabolario condiviso dei termini utilizzati in un dominio applicativo ? Collezioni di definizioni di termini e relazioni fra questi ? Schema che cattura il significato dellinformazione contenuta in un sottostante archivio ?

12 Barbara Re12 METADATI: Alcune semplici definizioni … Machine-understandable information about Web resources or other things. Tim Berners-Lee, W3C, 1997 Data associated with objects which relieves their potential users of having to have full advance knowledge of their existence or characteristics. A user might be a program or a person. Lorcan Dempsey & Rachel Heery, 1998 Structured data about resources that can be used to help support a wide range of operations Michael Day, 2001 Structured data about data. Dublin Core Metadata Initiative FAQ, 2003

13 Barbara Re13 Che informazioni contengono i metadati I record di metadati possono includere Descrizione del materiale archiviato Record bibliografici appartenenti a cataloghi o ottenuti da servizi di indicizzazione e creazione di abstract Record relativi ad oggetti contenuti nella documentazione del museo Descrizione di oggetti digitali (documenti, immagini, video software, …) Descrizione di collezioni di oggetti digitali Descrizione di servizi in rete Descrizioni di record di metadati

14 Barbara Re14 Modelli di metadati I precursori MARC – MAchine Readable Cataloguing record metadati di applicazione generale Dublin Core (DC) Government Information Locator Service [now Global Information Locator Service] (GILS) Digital Object Identifier (DOI) metadati per specifici domini disciplinari MPEG7 Text Encoding Initiative (TEI) Encoded Archival Description (EAD) Consortium for the Interchange of Museum Information (CIMI) Visual Resources Association (VRA) Core Categories Content Standard for Digital Geospatial Metadata (CSDGM) Online Information Exchange (ONIX) Friend Of a Friend: metadati per descrivere reti sociali

15 Barbara Re15 Modelli di metadati: MARC Sviluppato alla fine degli anni 60 alla Library of Congress (USA) per promuovere la condivisione di cataloghi tra biblioteche. È diventato un formato quasi standard. Utilizza un sistema di numeri, lettere e simboli allinterno del record per individuare i diversi tipi di informazione

16 Barbara Re16 Modelli di Modelli di metadati: Dublin core Un insieme di elementi descrittivi capaci di rappresentare qualsiasi risorsa di informazione accessibile in rete Format Identifier Source Language Relation Coverage Rights Title Creator Subject Description Publisher Contributor Date Type

17 Barbara Re17 FOAF "Friend Of A Friend" The Friend of a Friend (FOAF) project is about creating a Web of machinereadable homepages describing people, the links between them and the things they create and do FOAF Basics Agent Person Name Nick Title Homepage Mbox mbox_sha1sum Img depiction (depicts) Surname family_name Givenname firstName Per provare a scrivere il vostro FOAF [http://www.ldodds.com/foaf/foaf-a-matic.html] Personal Info weblog knows interest currentProject pastProject plan based_near workplaceHomepage workInfoHomepage schoolHomepage topic_interest publications geekcode myersBriggs dnaChecksum

18 Barbara Re18 Modelli di metadati: MPEG7 Standard sviluppato dallMPEG (Moving Picture Expert Group) Viene denominato Multimedia content description interface Fornisce una descrizione del contenuto di dati multimediali, estraibile attraverso la sua analisi ed elaborazione Strumento generico non finalizzato ad una applicazione specifica, ma adatto a supportare un ampio numero di applicazioni Digital libraries Description generation Description consumption Description based training Image understanding Intelligent vision Smart cameras/VCRs Information retrieval Information filtering

19 Barbara Re19 Caratteristiche dei metadati Descrittivi per l'identificazione e il recupero degli oggetti digitali; sono costituiti da descrizioni normalizzate dei documenti digitali nativi, risiedono generalmente nelle basi dati dei sistemi di Information Retrieval all'esterno degli archivi degli oggetti digitali e sono collegati a questi ultimi tramite appositi link. Amministrativi e gestionali forniscono dati utili per la gestione della risorsa descritta, per le operazioni di gestione degli oggetti digitali all'interno dell'archivio. Strutturali descrivono la struttura interna fisica o logica dei documenti (es. introduzione, capitoli, sezioni, indice di un libro) e le loro relazioni fra le varie parti degli oggetti digitali.

20 Barbara Re20 Metadati: embedded o esterni Embedded sono inclusi nelloggetto, Esterni sono esterni alloggetto ed archiviati a parte come link alloggetto descritto.

21 Barbara Re21 Funzioni Gestire le risorse fornendo la loro lidentificazione a favore della loro presentazione e recupero Consentire lorganizzazione, la localizzazione, la gestione e le statistiche Favorire linteroperabilità e lintegrazione di risorse simili Facilitare larchiviazione e la conservazione delle risorse

22 Barbara Re22 Tool per la gestione dei metadati (1) DC/DOT Questo servizio recupera pagine Web ed automaticamente genera metadati Dublin Core o come tag HTML o RDF/XML adatti per esser inseriti nella sezione head delle pagine. I metadati generati possono essere editati usando delle form specifiche che possono convertire i metadati in altri formati (USMARC, SOIF, IAFA/ROADS, TEI headers, GILS, IMS or RDF). Nordic project Questo servizio è fornito dal Nordic Metadata Project al fine di fornire un buon supporto per la creazione di metadati Dublin Core per la comunità Nordic Net-publisher. Reggie Leditor di metadati Reggie fornisce un facile modo di creare metadati da un programma web configurabile. I metadati creati da Reggie possono essere mostrati e in alcuni casi esportati nei seguenti formati HTML 3.2, HTML 4.0 e RDF. MKDoc MKDoc è un sistema per la gestione dei contenuti nei siti Web che può produrre metadati Dublin Core in formato HTML e RDF per ogni documento. Editor-Converter Dublin Core metadata Si tratta di un programma on-line che può essere utilizzato per due scopi: come editor di metadati Dublin Core e come convertitore ad UNIMARC.

23 Barbara Re23 Tool per la gestione dei metadati (2) Photo RDF-Gen Questo tool genera RDF per descrivere immagini ed in particolar modo fotografie DescribeThis Si tratta di un parser automatico ed al tempo stesso di generatore di metadati Dublin Core per le risorse on-line Scorpion Il progetto Scorpion Open Source offre un software in grado di implementare un sistema per la classificazione automatica di documenti di testo accessibili dal Web. Esso viene usato per investigare sulla presenza di uno schema di classificazione o un thesaurus leggibile dalla macchina da incorporare nel sistema di classificazione automatica Viewer-Generator Dublin Core metadata Rappresenta un form on-line per effetture un test su di un URL e valutare quindi la presenza di metadati Dublin Core. Al tempo stesso esso genera automaticamente metadati Dublin Core da una pagina che contiene tradizionali metadati HTML

24 Barbara Re24 Cosa sono i metadati e le ontologie!! Cosa sono i metadati Data about data ? Descrizioni Descrizioni di una risorsa ? Relazioni tra risorse ? Catturano informazione presente nella risorsa ma non elaborabile in automatico ? presente nel contesto in cui la risorsa è inserita ? Cosa sono le ontologie? Cosa sono le ontologie? Specifica di un vocabolario condiviso dei termini utilizzati in un dominio applicativo ? Collezioni di definizioni di termini e relazioni fra questi ? Schema che cattura il significato dellinformazione contenuta in un sottostante archivio ?

25 Barbara Re25 Cosè unontologia In termini astratti Sul piano filosofico: area della metafisica che studia come è realmente fatto luniverso che ci circonda Sul piano informatico: area dellintelligenza artificiale che studia i metodi per rappresentare correttamente luniverso che ci circonda In termini pratici Specifica un vocabolario comune tra sistemi differenti … … basandosi su una descrizione semantica del dominio dei dati … …che agevoli la comunicazione sia tra agenti software sia tra agenti software e esseri umani

26 Barbara Re26 Definizioni Philosophy (400BC) Systematic explanation of Existence Neches (91) Ontology defines basic terms and relations comprising the vocabulary of a topic area as well as the rules for ombining terms and relations to define extensions to the vocabulary Gruber (93) Explicit specification of a conceptualization Borst (97) Formal specification of a shared conceptualization Studer(98) Formal, explicit specification of a shared conceptualization Una specifica esplicita e formale di una concettualizzazione condivisa

27 Barbara Re27 Cosè unontologia In termini formali… Unontologia è una specificazione esplicita e formale di una concettualizzazione condivisa in cui si usa… CONCETTUALIZZAZIONE perché ci si riferisce a modello astratto di fenomeno CONDIVISA perché cattura conoscenza riconosciuta da un gruppo FORMALE perché automaticamente decodificabile ESPLICITA perché basata su strutture di immediata applicazione

28 Barbara Re28 Formalmente (1) Un insieme di concetti (detti anche classi) Le interconnessioni semantiche tra essi (dette relazioni concettuali, o attributi semantici) Un eventuale livello logico che permetta di inferire nuovi fatti a partire da quelli codificati allinterno della risorsa (ad esempio, un insieme di assiomi o micro-teorie)

29 Barbara Re29 Formalmente (2) Unontologia O può dunque essere definita come una tripla (C, R, A) dove C è un insieme di concetti R è un insieme di relazioni concettuali tali che ogni relazione in R è definita su CC A è un insieme di assiomi (se A = lontologia non è assiomatizzata)

30 Barbara Re30 Definizione formale di ontologia (3) Si osservi che gli insiemi C ed R individuano un grafo G = (V, E) tale che V C E = { (c 1, c 2 ) CC : S R : (c 1, c 2 ) S } e una funzione di etichettatura : CC 2 R tale che (c 1, c 2 ) = { S R : (c 1, c 2 ) S }

31 Barbara Re31 Esempio Un semplice esempio di ontologia è il seguente O = (C, R, A) dove: C = {Entità, Oggetto, Persona, Meccanico, Automobile, Motore} R = {è-un, ha-un, ripara} A = { a Automobile m Meccanico : ripara(m, a) }) è-un = { (Oggetto, Entità), (Persona, Entità), (Meccanico, Persona), (Automobile, Oggetto), (Motore, Oggetto) } ha-un = { (Automobile, Motore) } ripara = { (Meccanico, Automobile) }

32 Barbara Re32 I componenti di unontologia

33 Barbara Re33 I componenti di unontologia Un concetto… …anche noto come classe, può rappresentare un oggetto, una nozione o unidea …può essere astratto o concreto, elementare o composto, reale o fittizio… …è caratterizzato da un termino o un simbolo, da una estensione e da una intensione

34 Barbara Re34 I componenti di unontologia Un assioma …è un affermazione sempre vera sul modello …serve per specificare la semantica dei concetti …può essere usato per descrivere una relazione: il tipo, la cardinalità, le proprietà algebriche (simmetria, transitività), le proprietà concettuali (esclusività, genericità, identità)

35 Barbara Re35 I componenti di unontologia Una relazione… …è una forma di interazione tra concetti del dominio del tipo R: C1xC2x…xCn …è caratterizzata da un termine, da una intenzione e da una estensione… …può essere, ad esempio, genitore che lega due concetti o due istanze

36 Barbara Re36 I componenti di unontologia Una funzione… …è un tipo speciale di relazione in cui ln-esimo argomento dipende dagli altri, nella forma F: C1xC2x…xCn-1àCn …può essere, ad esempio,madre di, calcolata a partire da un concettogenitore e dallattributosesso

37 Barbara Re37 I componenti di unontologia Un elemento aggiuntivo può essere… …unistanza rappresenta i singoli elementi del dominio …un fatto rappresenta una relazione tra due istanze …un individuo rappresenta qualsiasi elemento del dominio che non sia un concetto …una claim rappresenta lasserzione di un fatto tramite unistanza

38 Barbara Re38 I criteri della progettazione… Chiarezza: il significato intenzionale deve essere oggettivo Coerenza: si può inferire solo ciò che è consistente con le definizioni Estendibilità: successive estensioni o specializzazioni devono essere monotone, senza richiedere revisione Minima dipendenza dalla codifica: la concettualizzazione non deve dipendere da vincoli del linguaggio di rappresentazione Minimo commitment ontologico: la conoscenza deve essere rappresentata col minor numero possibile di dichiarazioni

39 Barbara Re39 Il ciclo di vita della progettazione

40 Barbara Re40 Processo di sviluppo di unontologia Studio di Fattibilità Identificazione dominio e campo di applicazione Costruzione Valutazione Documentazione Ontologia Utenti, Esperti di dominio e Sviluppatori Mantenimento 1)Catturare lontologia 2)Codificare lontologia 3)Integrare con ontologie esistenti chiarezza coerenza estensibilità min impegno ontologico min dipendenza codice

41 Barbara Re41 Ontologie: Problemi di ricerca E unarea di ricerca che si è molto espansa nellultima decade Ontologie Costruzione Traduzione Aggiornamento Riuso Valutazione Apprendimento Mapping Fusione Gestione Strumenti Metodologie Linguaggi

42 Barbara Re42 I linguaggi per la rappresentazione della conoscenza Si utilizzano logiche descrittive intese come una famiglia di formalismi utilizzati per rappresentare la conoscenza in un dominio di applicazione detto mondo Più recentemente le logice descrittive sono state utilizzate come formalismo di base per lo sviluppo degli standard promossi dalla "Semantic Web initiative" del W3CSemantic WebW3C RDFRDF che però non può essere considerato una logica descrittiva OWLOWL (nato dalle ceneri dei progetti DAML e OIL)

43 Barbara Re43 Linguaggi di rappresentazione

44 Barbara Re44 RDF: come possibile approccio allinteroperabilità strutturale RDF si propone come unhub da usare per gestire i costrutti strutturali al posto di numerose integrazioni ad hoc Source: Tim Berners Lee tbl/Overview.htmlhttp://www.w3.org/2002/Talks/09-lcs-sweb- tbl/Overview.html

45 Barbara Re45 RDF mette a disposizione un modello di dati semplice … e molto flessibile si possono codificare

46 Barbara Re46 Che cosè RDF RDF Come HTML, permette di creare dei link tra risorse pubblicati sul Web Al contrario dei comuni ipertesti i link di RDF Possono essere etichettati, al fine di indicare esplicitamente la relazione che intercorre tra gli oggetti Si riferiscono a oggetti tipizzati, nel senso che RDF standardizza la modalità con cui si assegna un significato alla risorsa

47 Barbara Re47 Confronto HTML e RDF

48 Barbara Re48 RDF: un esempio guida Il modello RDF rende disponibile un meccanismo per descrivere in modo machine- processable risorse Web risorse Web, ad esempio, pagine Web Esempio Immaginiamo di voler tener traccia del fatto che qualcuno di nome Mario Rossi ha creato una certa pagina Web ( ) Se dovessimo descrivere questo fatto in linguaggio naturale potremmo utilizzare una semplice frase:

49 Barbara Re49 RDF: un esempio guida Alcune parti della frase sono sottolineate per identificare ciò che si vuole descrivere (in questo caso la pagina) la specifica proprietà (autore) di ciò che si vuole descrivere ciò che vogliamo utilizzare per assegnare un valore alla proprietà (chi è lautore) di ciò che si vuole descrivere

50 Barbara Re50 La terminologia In RDF per identificare La frase si usa il termine stantment La parte che identifica ciò di cui la frase parla si usa soggetto La parte che identifica la proprietà del soggetto che la frase specifica si usa predicato La parte che identifica il valore assegnato dalla frase alla proprietà si usa oggetto

51 Barbara Re51 Machine processability (1) Delle frasi in linguaggio naturale possono servire uomini per comunicare, ma lo scopo di RDF è rendere queste frasi machine-processable Per rendere frasi simili a quelle precedenti machine processable occorre degli identificativi machine-processable che permettano di identificare il soggetto, loggetto e il predicato in una frase senza nessuna possibilità di confusione con un altro identificativo simile usato da qualcun altro sul Web un formato machine-processable per rappresentare e scambiare le frasi tra macchine

52 Barbara Re52 Machine processability (2) Il web di oggi dispone di entrambi i meccanismi gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

53 Barbara Re53 Machine processability Il web di oggi dispone di entrambi i meccanismi gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

54 Barbara Re54 Tutto deve avere un URI Per scrivere Occorre assegnare un URI a tutte (o quasi) le parti sottolineate della frase Nello stantment RDF di esempio: Il soggetto è già un URI Il valore (loggetto) Mario Rossi potrebbe essere identificato dallURI URN:org:example:staffid:85740 Per il predicato autore si può utilizzre lURI

55 Barbara Re55 Tutto deve avere un URI Risultato

56 Barbara Re56 Predicati come URI Etichetta Creatore Definizione Un'entità che ha la responsabilità principale della produzione del contenuto della risorsa Descrizione Esempi di Creator includono una persona, un'organizzazione o un servizio. In particolare, il nome di un Creator dovrebbe essere usato per indicare l'entità

57 Barbara Re57 Uso dei nemespace E possibile abbreviare le URI facendo uso dei prefissi dei namespace di XML Esempio Lo stantment Introducendo i seguenti prefissi per i tre namespace diventa

58 Barbara Re58 Oggetti come URI (1) Ci sono molti vantaggi nellutilizzare gli URI come semplice modalità di identificazione Invece di Identificare lautore come la stringa Mario Rossi Si può usare lURI sid:85740 In questo caso 1.Possiamo essere più precisi nella nostra idenficazione dellautore della pagina Non è una stringa Mario Rossi o qualcuna delle migliaia di persone che si chiamano Mario Rossi Ma in particolare Mario Rossi è associato allURI

59 Barbara Re59 Oggetti come URI (2) 2.Dal momento che lautore della pagina ha un URI, è a tutti gli effetti una risorsa, e possiamo descriverla ulteriormente assegnandogli, ad esempio, il nome, leta, …

60 Barbara Re60 Quasi tutto deve avere un URI Il soggetto e il predicato di ogni stantment devono essere delle risorse, quindi devono avere un URI Loggetto può anche essere un valore La terminologia di RDF utilizza il termine Letterale (litteral)

61 Barbara Re61 Tipizzare le risorse Per tipizzare una risorsa si usa la proprietà rdf:type

62 Barbara Re62 Machine processability Il web di oggi dispone di entrambi i meccanismi gli Uniform Resource Identifier (URI) rendono disponibile un modo per identificare qualunque cosa di cui si voglia parlare in uno statement RDF Extensible Markup Language (XML) è il formato ideale per rappresentare e scambiare degli statement RDF

63 Barbara Re63 Sintassi XML di RDF Lidea di base prevede un elemento XML per ogni nodo (soggetto e oggetto) e arco (predicato)

64 Barbara Re64 Sintassi XML di RDF Una possibile abbreviazione prevede luso dellattributo rdf:resource nei poperty element

65 Barbara Re65 Sintassi XML di RDF Altri stantment Si possono serializzare Sempre di seguito Nel caso in cui si descriva loggetto del primo anche innestandoli

66 Barbara Re66 Sintassi XML di RDF Possibile abbreviazione per risorse tipizzate

67 Barbara Re67 Sintassi XML di RDF

68 Barbara Re68 Sintassi N-Triple di RDF La sintassi XML di RDF È utile per far leva sui numerosi tool già sviluppati per XML Ma non è semplice distinguere i vari stantment e in particolare isolare soggetto, predicato e oggetto Per scopi didattici, o in generale quando occorre leggere RDF, si può utilizzare la sintassi N-Triple Ogni statment si scrive come una tripla

69 Barbara Re69 Sintassi N-Triple di RDF: esempio Es. lesempio guida in N-triple Fissando i prefissi La tripla diventa

70 Barbara Re70 Alcuni vocabolari

71 Barbara Re71 RDF come Hub RDF può essere utilizzato come Hub Abilita un buon grado di interoperabilità strutturale Ovvero i vari sistemi informativi, che condividono lo stesso modello RDF, possono scegliere indipendentemente il formato più adatto allinformazione che intendono scambiare È molto semplice fondere (merge) modelli RDF Ovvero non ci sono ostacoli nel combinare informazione preveniente da sistemi differenti (quindi anche in formati diversi), purchè questi condividano lo stesso modello RDF

72 Barbara Re72 Esempio di interoperabilità strutturale otttenuta via RDF

73 Barbara Re73 Esempio di interoperabilità strutturale otttenuta via RDF

74 Barbara Re74 Esempio di interoperabilità strutturale otttenuta via RDF

75 Barbara Re75 Esempio di fusione (merge)

76 Barbara Re76 Esempio di fusione (merge)

77 Barbara Re77 Esempio di fusione (merge)

78 Barbara Re78 Protegè

79 Barbara Re79 Ci sono domande?


Scaricare ppt "Ontologie UNIVERSITA DI CAMERINO Corso di laurea in Informatica Barbara Re Anno Accademico 2006-07."

Presentazioni simili


Annunci Google