La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.

Presentazioni simili


Presentazione sul tema: "Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web."— Transcript della presentazione:

1 Semantic Web

2 I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web  Documenti debolmente collegati tra loro Occorrerebbero dei collegamenti semantici  Che riconoscano i domini (=contesti) entro i quali sono disponibili risorse

3 Domini, schemi e dati Dominio è costituito da  Dati Informazione elementare  Metadati classificano i dati  Schema (Ontologia) mettono in relazione le classi

4 Web Semantic 2001, Tim Barners Lee Rappresentare web come un insieme di ontologie  Progetto irrealistico Ontologie specifiche  Secondo settori di interesse  Costruzione di ontologie: campo del Knowledge Management:

5 La struttura del Web semantico Il Semantic Web si candida ad essere una architettura universale della scambio di informazione e conoscenza Ogni applicazione, ogni intenzione di scopo applicata ad un dominio, utilizzerà una sua propria ontologia L'operazione di collegare ontologie che definiscono stessi oggetti con una semantica differente è chiamata Mapping Impensabile un mapping globale  ogni diverso schema dovrebbe mapparsi all'ontologia globale che funzionerebbe così come una lingua universale Si lavorerà su una architettura federativa.

6 Mapping Implica l’identificazione di soluzioni tecniche e transazioni comunicative Potrà essere di due tipi: automatico o manuale, forse misto  In una prima fase dei tool leggeranno grosse quantità di dati e realizzeranno dei cluster, un esperto poi dovrà validare le scelte dei tool Si adotterà il modello dell’interlingua  Inizialmente alcuni gruppi di organizzazioni si accordano per creare un standard condiviso, quando questo standard si consolida e afferma altre realtà si associano allo standard.

7 E-learning semantico Due progetti  http://edutella.jxta.org http://edutella.jxta.org  http://www.merlot.org http://www.merlot.org Learning objects collegati secondo schemi ontologici

8 I linguaggi del web semantico Il W3C propone RDF(S)  set di linguaggi dichiarativi basati su sintassi XML Gli schemi si scrivono in linguaggio RDF(S) e producono file *.RDFS

9 RDF Resource Description Framework (RDF).  per la descrizione delle risorse sul Web, La descrizione si basa su tre tipi di oggetti:  Risorse (resources) una pagina, un gruppo di pagine, un’immagine, un server o una qualsiasi altro elemento che abbia un Universal Resource Identifier (URI), cioè un meccanismo di identificazione come l’indirizzo Web  Proprietà (properties) Una proprietà è una specifica caratteristica o attributo di una risorsa una proprietà può anche descrivere relazioni con altre risorse.  Asserzioni (statements) Una asserzione è costituita dall’insieme di una risorsa, una proprietà e uno specifico valore per quella proprietà e descrive le caratteristiche di una risorsa e le relazioni con altre risorse

10 Asserzione la pagina all’indirizzo www.html.it/rdf.html ha per argomento RDF  asserzione costituita dalla risorsa pagina all’indirizzo www.html.it/rdf.html,www.html.it/rdf.html dalla proprietà argomento, dal valore RDF. Per ragioni pratiche, la definizione formulata del W3C propone XML come metalinguaggio per la rappresentazione del modello RDF, mediante alcuni tags predefiniti ( …) e altra tags liberi per la descrizione Ecco la asserzione espressa in xml:

11 Namespace Nella descrizione RDF si fa uso della tecnica dei namespace di XML Un namespace è un contesto che definisce un insieme di tag da utilizzare in un documento XML  Nel precedente esempio, il tag indica che tale tag è definito nel namespace identificato dal prefisso rdf, la cui dichiarazione si trova nella prima riga del documento XML

12 Schemi RDF La creazione libera di tags genera ambiguità Gli schemi RDF sono vocabolari di tags concordati  insiemi di proprietà ed elementi che definiscono un contesto per la descrizione di determinate categorie di risorse  Es.: il Dublin Core Metadata: esso definisce i tag da utilizzare per la descrizione di documenti elettronici

13 Sviluppi L’uso di RDF è agli inizi e non sono ancora apprezzabili gli effetti che questa tecnologia porterà sul Web.

14 Costruzione di un’ontologia 1) Dichiarazione iniziale

15 Corso sottoclasse di “resource” (elemento radice generico) RESOURCE CORSO Costruzione di un’ontologia 2)

16 Costruzione di un’ontologia 3) “Argomento” sottoclasse di “corso” RESOURCE CORSO ARGOMENTO

17 Costruzione di un’ontologia 4) “Specializzazione ” sottoclasse di ““resource” (elemento radice generico) RESOURCE CORSO ARGOMENTO SPECIALIZZAZIONE

18 Costruzione di un’ontologia 5) “Titolo” proprietà di “Corso” esprimibile in formato stringa (codominio#Literal) RESOURCE CORSO ARGOMENTO SPECIALIZZAZIONE titolo

19 Costruzione di un’ontologia 6) “Livello di specializzazione” proprietà di “Corso” e di “Specializzazione” RESOURCE CORSO ARGOMENTO SPECIALIZZAZIONE titolo Livello di specializz.

20 Costruzione di un’ontologia 7) “Utenti” proprietà di “Specializzaz ione” e di “Utenti” RESOURCE CORSO ARGOMENTO SPECIALIZ ZAZIONE titolo Livello di specializz. Utenti

21 Costruzione di un’ontologia 8) “Preparazione Utenti” proprietà di “Specializzazi one” RESOURCE CORSO ARGOMENTO SPECIALIZ ZAZIONE titolo Livello di specializz. Utenti Preparazio ne utenti Classe 1° Classe 2° Classe 1° classe radice proprietà

22 I metadati I metadati dovrebbero esprimere relazioni di un documento con un certo contesto, dovrebbero definire relazioni trasversali al documento Non può esserci un sistema di navigazione semantica senza i metadati Non esistono ancora sistemi solidi per l'archiviazione e l'interrogazione di metadati  Non si è ancora consolidata una pratica  Esistono diversi sistemi

23 Indicizzazione automatica di metadati Limiti: un estrattore automatico non capisce il contesto: si basa sui tesauri di cui dispone… Text Zoner  suddivide il testo in parti strutturali (title, body, etc...) Preprocessor  fa una analisi morfologica delle frasi, stabilisce cioè di che parti è costruita una frase (soggetto, predicato, oggetto). Filter  Elimina dal testo le frasi e le sentenze irrilevanti Named Entity Recognizer  identifica strutture lessicali minime (nomi, date, numeri..) Lexical Disambiguation  assicura che i termini con più significati siano tradotti in un unico modo Semantic Interpreter  riporterà gli elementi significativi riscontrati su strutture ontologiche possedute a priori

24 Raccomandazioni I metadati non sono dati  non possono limitarsi a riportare in modo stringato i contenuti di un testo I metadati possono avere valore diverso  La proprietà di una classe può essere un valore es.: “Paolo”  O puntare ad un Uri: “quel” Paolo Volatilità dei metadati Essere e asserire  Mediante la reificazione: asserzioni di asserzioni

25 Costruzione di metadati Dall’ontologia ai metadati  http://www.nomesito.it/nomecorso/nomecorso.html http://www.nomesito.it/nomecorso/nomecorso.html  Indichiamo come si relazionano allo schema I metadati si definiscono mediante asserzioni:  Soggetto: Classe dello schema Esprimibile come Url Lo schema è esprimibile come spacename  Predicato: Attributi della classe  Oggetto: Dati I metadati si scrivono in file *.RDF

26 Costruzione di metadati 1) Qui la dichiarazione iniziale non necessita del namespace rdfs

27 Costruzione di metadati 2) Prima asserzione: la prima risorsa è un corso dal titolo “nomecorso“

28 Costruzione di metadati 3) Questa stessa risorsa (“Nomecorso) è legata a due argomenti diversi: nomeargomento1 e nomeargomento2 La classe “argomento” potrebbe essere espansa come http://miosito/rdfs/nomeschema/Argomento sostituendo il cancelletto con lo schema dichiarato in cima al documento

29 Flessibilità delle asserzioni Gli elementi sintattici delle asserzioni possono essere sostituiti da Uri  Soggetto Generalmente la classe di uno schema anche diverso  Predicato Un attributo, ma che può puntare ad un’altra classe  Oggetto Una stringa, o un’altra classe, o classi di schemi diversi Le asserzioni si possono collegare tra loro  Tramite ID

30 Reificazione delle asserzioni Inserimento di un’asserzione entro un’altra dico che in una certa pagina si dice che c'è un corso che ha titolo nomecorso.

31 RDF oltre XML RDF(S) è pensato per i metadati  Descrive dati ma non ha dati  Xml contiene dati XML si presta poco alle relazioni tra classi  Ha carattere inclusivo: nidifica bene le relazioni parentali, ma fatica ad esprimere quelle associative

32 Ontologia Delinea le strade che collegano gli oggetti del dominio Ontologie di scopo  rappresentano la struttura dei processi Ontologie di dominio  forniscono gli oggetti specifici

33 Ontologia di scopo: Archiviazione di e-learning Ontologia “Archiviazione”  Attributi (stringhe o puntati ad altre classi) Contenuto Data Locazione Archiviatore

34 Ontologia di dominio I concetti di scopo permettono di pensare agli oggetti che compongono il dominio La modellazione avviene per classi Gli attributi sono ereditati dal padre delle classi dello stesso livello Il valore di un attributo può essere definito da un’altra classe

35 Criteri di modellazione Dare alle classi nomi al singolare L'albero dell'ontologia deve essere bilanciato nella granularità  I rami devono avere un numero di classi simile


Scaricare ppt "Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web."

Presentazioni simili


Annunci Google