La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

WEB SEMANTICO Comunicazione Multimediale Letizia Catarini.

Presentazioni simili


Presentazione sul tema: "WEB SEMANTICO Comunicazione Multimediale Letizia Catarini."— Transcript della presentazione:

1 WEB SEMANTICO Comunicazione Multimediale Letizia Catarini

2 World Wide Web rete di risorse di informazione basata sullinfrastruttura di internet Modalità di localizzazione delle risorse(URL) Modalità di localizzazione delle risorse(URL) Protocolli per accedere alle risorse(HTTP) Protocolli per accedere alle risorse(HTTP) Ipertesto, per la navigazione tra le risorse(HTML) Ipertesto, per la navigazione tra le risorse(HTML) Primo sito (1991 – Berners Lee) (1989 – CERN di Ginevra) necessità di condividere la documentazione scientifica in formato elettronico – definizione di linguaggi (HTML) e protocolli (HTTP). Primo sito (1991 – Berners Lee) (1989 – CERN di Ginevra) necessità di condividere la documentazione scientifica in formato elettronico – definizione di linguaggi (HTML) e protocolli (HTTP).

3 World Wide Web rete di risorse di informazione basata sullinfrastruttura di internet Dal web statico ai web service Dal web statico ai web service Ci si orienta verso la costruzione di pagine dinamiche che consentissero lutilizzazione di dati estratti da database Ci si orienta verso la costruzione di pagine dinamiche che consentissero lutilizzazione di dati estratti da database Common Gateway Interface consentono di eseguire presso un web server applicazioni esterne che presentino poi i risultati in una pagina html interpretabile dal browser. Common Gateway Interface consentono di eseguire presso un web server applicazioni esterne che presentino poi i risultati in una pagina html interpretabile dal browser. Introduzione di linguaggi di scripting (Javascript, VBscript) interpretabili dai browser lato client Introduzione di linguaggi di scripting (Javascript, VBscript) interpretabili dai browser lato client Linguaggi integrati con il web server (jsp, php,asp, …) lato server Linguaggi integrati con il web server (jsp, php,asp, …) lato server Web service che hanno lo scopo di limitare il più possibile le attività di implementazione, consentendo di accedere a servizi software resi disponibili in rete. Web service che hanno lo scopo di limitare il più possibile le attività di implementazione, consentendo di accedere a servizi software resi disponibili in rete.

4 World Wide Web rete di risorse di informazione basata sullinfrastruttura di internet Dal web statico al web semantico Dal web statico al web semantico Il web è ancora una gigantesca biblioteca di pagine html statiche on line. Html come strumento di formattazione dei documenti senza consapevolezza dei contenuti (ricerca Rossi – signor Rossi, capelli rossi, etc.) Il web è ancora una gigantesca biblioteca di pagine html statiche on line. Html come strumento di formattazione dei documenti senza consapevolezza dei contenuti (ricerca Rossi – signor Rossi, capelli rossi, etc.)html 1998 (lee) definizione dello standard XML(eXtensible Markup Language), metalinguaggio che consente la creazione di nuovi linguaggi di marcatura, consente laggiunta di informazioni semantiche sui contenuti 1998 (lee) definizione dello standard XML(eXtensible Markup Language), metalinguaggio che consente la creazione di nuovi linguaggi di marcatura, consente laggiunta di informazioni semantiche sui contenuti 1998 Obiettivi XML: Obiettivi XML: utilizzo del linguaggio su internet utilizzo del linguaggio su internet Facilità di creazione dei documenti Facilità di creazione dei documenti Supporto di più applcazioni Supporto di più applcazioni Chiarezza e comprensibilità Chiarezza e comprensibilità DallXML al vero e proprio web semantico dal machine-representable al machine-understandable (documenti interpretati anche da agenti automatici) DallXML al vero e proprio web semantico dal machine-representable al machine-understandable (documenti interpretati anche da agenti automatici) Sono definiti nuovi linguaggi R esource D escription F ramework e W eb O ntology L anguage basati su XML che si rifanno alla logica dei predicati mutuata dallintelligenza artificiale. Sono definiti nuovi linguaggi R esource D escription F ramework e W eb O ntology L anguage basati su XML che si rifanno alla logica dei predicati mutuata dallintelligenza artificiale.

5 eXtensible Markup Language linguaggio estensibile di marcatura dalle proprietà E un linguaggio per lo scambio di dati E un linguaggio per lo scambio di dati Utilizza tag inventati dallo sviluppatore Utilizza tag inventati dallo sviluppatore Devono essere comprensibili Devono essere comprensibili Devono rispettare delle regole (case sensitive) (non possono iniziare con numeri o caratteri speciali e non possono contenere spazi) Devono rispettare delle regole (case sensitive) (non possono iniziare con numeri o caratteri speciali e non possono contenere spazi) E altamente portabile (Microsoft per ASP e Visual Basic usa loggetto XMLDOM, ecc) E altamente portabile (Microsoft per ASP e Visual Basic usa loggetto XMLDOM, ecc) E alla base di altri meta-linguaggi: E alla base di altri meta-linguaggi: DTD(Document Type Definition) specifica il tipo di documento attraverso una serie di regole grammaticali DTD(Document Type Definition) specifica il tipo di documento attraverso una serie di regole grammaticali Schema come DTD definisce la grammatica è più avanzato (XSD XML Schema Definition) Schema come DTD definisce la grammatica è più avanzato (XSD XML Schema Definition) Xlink definisce link tra risorse Xlink definisce link tra risorse

6 eXtensible Markup Language linguaggio estensibile di marcatura dalle proprietà 1. Serve a strutturare i dati: parametri di configurazione, transazioni finanziarie; insieme di regole per strutturare i dati; non è un linguaggio di programmazione 2. Assomiglia ad HTML: fa uso di tag e attributi per delimitare pezzi di dati interpretati dallapplicazione che li legge, non hanno sempre lo stesso significato 3. E testo, ma non da leggere: i dati non sono scritti in binario, quindi rileggibili anche senza lapplicativo, ma se ci sono errori non risultano eseguibili a differenza dellhtml 4. E prolisso per design: occupa più spazio, ma i vari compressori possono essere usati e i protocolli di comunicazione possono comprimere i dati al volo 5. E una famiglia di tecnologie: XLink, Xpointer, CSS (XSL), DOM (dai linguaggi di programmazione),…. (vedi W3C9)

7 eXtensible Markup Language linguaggio estensibile di marcatura dalle proprietà 6. E nuovo, ma non così nuovo: inizia nel 1996, deriva da SGML nato nei primi anni Porta dallHTML allXHTML: applicazione dellXML alla formattazione di un documento, sintassi simile allHTML 8. E modulare: consente di definire un nuovo formato di documento combinando o riutilizzando altri formati 9. E la base per RDF e il web semantico: supporta la descrizione di risorse e applicazioni metadata come liste musicali, album di foto e bibliografie. I computer necessitano di meccanismi per accordarsi sul significato dei termini 10. E libero, indipendente dalla piattaforma e ben supportato: xml è gratis, una grossa comunità di tecnici lo utilizza, è in espansione

8 Resource Description Framework insieme di librerie e codice per la descrizione della conoscenza nel web Descrive i metadati relativi alle risorse, si basa su tre principi chiave: Qualunque cosa può essere identificata da un Universal Resource Identifier Qualunque cosa può essere identificata da un Universal Resource Identifier Utilizzare il linguaggio meno espressivo per definire qualunque cosa Utilizzare il linguaggio meno espressivo per definire qualunque cosa Qualunque cosa può dire qualunque cosa su qualunque cosa Qualunque cosa può dire qualunque cosa su qualunque cosa E un modello formale di dati dotato di sintassi di interscambio, un sistema di schemi di tipo ed un linguaggio di interrogazione

9 Resource Description Framework insieme di librerie e codice per la descrizione della conoscenza nel web Qualunque cosa descritta da RDF è detta risorsa. Principalmente una risorsa è reperibile sul web, ma non solo. LURI è un identificatore univoco di risorse e può essere un Uniform Resource Locator (URL). Il modello di dati RDF è formato da risorse, proprietà e valori. Le proprietà sono delle relazioni che legano tra loro risorse e valori, e sono anchesse identificate da URI. Un valore, invece, o è una risorsa o è un tipo di dato primitivo. Il modello di dati RDF è formato da risorse, proprietà e valori. Le proprietà sono delle relazioni che legano tra loro risorse e valori, e sono anchesse identificate da URI. Un valore, invece, o è una risorsa o è un tipo di dato primitivo. Lunità base per rappresentare uninformazione in RDF è lo statement. Uno statement è una tripla del tipo: Lunità base per rappresentare uninformazione in RDF è lo statement. Uno statement è una tripla del tipo: Soggetto – Predicato – Oggetto dove il soggetto è una risorsa, il predicato è una proprietà e loggetto è un valore. Esempio: Umberto_Eco è_autore_di In_nome_della_rosa Soggetto – Predicato – Oggetto dove il soggetto è una risorsa, il predicato è una proprietà e loggetto è un valore. Esempio: Umberto_Eco è_autore_di In_nome_della_rosa

10 WEB SEMANTICO Con il termine Web Semantico si intende la trasformazione del in un ambiente dove è possibile pubblicare non più solo documenti (pagine HTML, file office, immagini, file multimediali,...) ma anche informazioni e dati in un formato adatto alla interrogazione, interpretazione e, più in generale, elaborazione automatica. Con il termine Web Semantico si intende la trasformazione del World Wide Web in un ambiente dove è possibile pubblicare non più solo documenti (pagine HTML, file office, immagini, file multimediali,...) ma anche informazioni e dati in un formato adatto alla interrogazione, interpretazione e, più in generale, elaborazione automatica.

11 WEB SEMANTICO in un documento (ad es. una pagina HTML) sia possibile parlare di un Signor Ciampi ed esprimere semanticamente questo con opportuni tag, è difficile capire se due documenti che parlano di un Signor Ciampi si riferiscono alla stessa persona con conseguente scarsa qualità dei risultati restituiti dai motore di ricerca. in un documento (ad es. una pagina HTML) sia possibile parlare di un Signor Ciampi ed esprimere semanticamente questo con opportuni tag, è difficile capire se due documenti che parlano di un Signor Ciampi si riferiscono alla stessa persona con conseguente scarsa qualità dei risultati restituiti dai motore di ricerca. Nella migliore delle ipotesi sarebbe possibile dedurlo se, tra gli altri, vi fossero dati anagrafici semanticamente definiti e sufficientemente precisi (ad es. il Codice Fiscale) o hyperlink debitamente descritti che li collegano. Nella migliore delle ipotesi sarebbe possibile dedurlo se, tra gli altri, vi fossero dati anagrafici semanticamente definiti e sufficientemente precisi (ad es. il Codice Fiscale) o hyperlink debitamente descritti che li collegano. Poiché, però, i diversi documenti sono redatti per scopi differenti, indipendentemente gli uni dagli altri e normalmente senza condividere un comune formato XML, informazioni utili quali l'indirizzo postale o la data di nascita finiscono per essere espresse in modo dissimile e non uniforme. L'indirizzo in un caso può essere semplicemente racchiuso dal tag, in altri da,, o, e poi è da considerare la possibilità di avere esplicitamente identificati,,... rendendo ardua e non priva di rischi ogni deduzione automatica. Poiché, però, i diversi documenti sono redatti per scopi differenti, indipendentemente gli uni dagli altri e normalmente senza condividere un comune formato XML, informazioni utili quali l'indirizzo postale o la data di nascita finiscono per essere espresse in modo dissimile e non uniforme. L'indirizzo in un caso può essere semplicemente racchiuso dal tag, in altri da,, o, e poi è da considerare la possibilità di avere esplicitamente identificati,,... rendendo ardua e non priva di rischi ogni deduzione automatica.

12 WEB SEMANTICO LINGUAGGI: RDF e XML. secondo la logica dei predicati le informazioni sono esprimibili con asserzioni (statement in inglese) costituite da triple formate da soggetto, predicato e valore (in inglese spesso identificati come subject, verb e object). Ad esempio, le seguenti affermazioni: LINGUAGGI: RDF e XML. secondo la logica dei predicati le informazioni sono esprimibili con asserzioni (statement in inglese) costituite da triple formate da soggetto, predicato e valore (in inglese spesso identificati come subject, verb e object). Ad esempio, le seguenti affermazioni: 1. La Signora Catarini vive a Macerata. 2. La Signora Catarini ha codice fiscale CTRLTZ57B49E783H. possono essere schematicamente scomposte come: Asserzione 1 Asserzione 2 Soggetto: La Signora Catarini Predicato: vive a ha codice fiscale Valore:MacerataCTRLTZ57B49E783H

13 WEB SEMANTICO Si deduce che condizione necessaria per il buon utilizzo di RDF è la disponibilità on line di riferimenti di qualità alle URI referenziate. La Signora Catarini vive a Maceratahttp://www.comune.macerata.it ha codice fiscale Nella scelta dei termini da utilizzare per la definizione delle relazioni si deve ricorrere a dizionari già noti e diffusi invece che inventarne ogni volta di nuovi. Ad es. per le informazioni anagrafiche personali tipiche dei biglietti da visita quali nome, cognome, indirizzo, , ruolo aziendale,... è già disponibile vCard. Ci sono numerose applicazioni XML definite per abilitare l'EDI (Electronic Data Interchange, scambio dati elettronico) nell'ambito della pubblica amministrazione (e-Governement [2]) o di associazioni di settore (xml.org). Nella costruzione del web semantico, progetti come wikipedia o wikidizionario sono funzionali e abilitanti perché forniscono lemmi ben documentati per individuare risorse e predicati, garantendone la stabilità nel tempo e, grazie alla possibilità di dichiarare equivalenze nella stessa lingua e tra lingue diverse, di accrescere ulteriormente l'estensione di un'indagine automatica. vCardapplicazioni XMLEDIe-Governement[2]xml.orgvCardapplicazioni XMLEDIe-Governement[2]xml.org

14 ESEMPIO RDF 6. 8. CTRLTZ57B49E783H

16 Ontology Web Language: estensioni ad RDF (una ontologia è il tentativo di formulare uno schema concettuale esaustivo e rigoroso nell'ambito di un dato dominio; si tratta generalmente di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi, ed i vincoli specifici del dominio) Sfruttando le possibilità offerte dall'elaborazione automatica, la logica dei predicati può essere ulteriormente estesa con costrutti capaci di ampliarne ulteriormente l'espressività. Due di queste, molto semplici da comprendere, sono l'equivalenza tra risorse e la relazione inversa. Per equivalenza tra risorse si intende la possibilità di poter affermare che due o più URI rappresentano lo stesso elementoPer equivalenza tra risorse si intende la possibilità di poter affermare che due o più URI rappresentano lo stesso elementoURI Per inversa si intende la possibilità di dire che se è vero (soggetto, predicato, oggetto), allora è anche vero (oggetto, predicato_inverso, soggetto).Per inversa si intende la possibilità di dire che se è vero (soggetto, predicato, oggetto), allora è anche vero (oggetto, predicato_inverso, soggetto).

17 WEB SEMANTICO Fiducia Un altro tema molto importante e dibattuto è come gestire la fiducia sulle asserzioni o, più esattamente, sugli autori delle asserzioni. Agenti È da segnalare che molto lavoro è attualmente in corso per estendere le possibilità del web semantico applicando l'idea degli agenti intelligenti (programmi in grado di esplorare ed interagire autonomamente con i sistemi informatici per, ad es., ricercare informazioni). Ruolo di questi agenti nel web semantico è di fornire più vaste capacità di inferenza: si prospetta un futuro in cui Lucy fissa una visita medica alla madre utilizzando alcuni agenti capaci di "capire" la patologia, contattare i centri in grado di curarla e perfino di richiedere un appuntamento ai relativi agenti, salvo poi lasciarle la decisione di confermare.

18 WEB SEMANTICO Web semantico e gestione della conoscenza L'XML si rivolge alla descrizione di documenti, RDF (e sue evoluzioni) è particolarmente indicato per rappresentare dati, fornendo un metodo potenzialmente capace di risolvere un tema finora solo parzialmente soddisfatto da strumenti informatici: la Gestione della conoscenza aziendale, ovvero la capacità non solo di trattare le diverse anagrafiche (di prodotto, clienti, fornitori, dipendenti,...) e di classificare i documenti tecnici o amministrativi, (analisi di mercato, specifiche tecniche, norme, procedure,...) ma di arrivare anche a gestire i contenuti di questi documenti permettendo, ad es., il reperimento delle informazioni in funzione delle specifiche esigenze del richiedente, integrando quanto reso disponibile da fonti diverse [3].


Scaricare ppt "WEB SEMANTICO Comunicazione Multimediale Letizia Catarini."

Presentazioni simili


Annunci Google