La nuova “visione” del web: il Web Semantico

Slides:



Advertisements
Presentazioni simili
TIC per ricerca e condivisione dell'informazione
Advertisements

I Namespace Mario Arrigoni Neri.
WWW XML-Namespace Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u Lesigenza e il funzionamento dei Namespace in XML.
Introduzione ad XML Mario Arrigoni Neri.
SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.
Analisi e progettazione
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità A1 Informazioni e dati.
A. FERRARI Alberto Ferrari. L'HyperText Markup Language (HTML) (traduzione letterale: linguaggio di marcatura per ipertesti) è un linguaggio usato per.
Linguaggi di Programmazione e compilatori
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
Numerico-Vespignani, Informatica per le scienze umanistiche, Il Mulino, La rappresentazione dellinformazione testuale e i linguaggi di codifica.
Biblioteche elettroniche e archivi digitali
4 – Progettazione – Introduzione e Modello E-R
XML Prof. Alfredo Pulvirenti. XML XML (eXtensible Markup Language) è un meta linguaggio. Può essere definito come un insieme di regole e convenzioni che.
Basi di Dati prof. A. Longheu 4 – Progettazione – Introduzione e Modello E-R Cap. 5 Basi di dati Atzeni – Ceri – Paraboschi - Torlone.
Intelligenza Artificiale Linguaggio naturale
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 7 Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
E-learning e tecnologia dei learning object:
TECNOLOGIE PER DOCUMENTI DIGITALI
Architettura del World Wide Web
Labbreviazione: WWW letteralmente: World = mondo Wide = esteso Web = rete Può essere tradotta come: Rete estesa in tutto il mondo.
Università della Svizzera italiana Il web semantico: mito o realtà? Marco Colombetti Politecnico di Milano e Università della Svizzera italiana Roma, 24.
INFORMATICA UMANISTICA B STRUTTURE DATI BASI DI DATI RAPPRESENTAZIONE DELLA CONOSCENZA ONTOLOGIE.
Introduzione Estrazione di Informazioni dal Web Prof. Paola Velardi.
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
XML e la generazione di cataloghi multimediali F. Garzotto, L. Mainetti, P. Paolini Politecnico di Milano HOC - Hypermedia Open Center Dipartimento di.
Metodologie di Annotazione Semantica per la Rappresentazione della Conoscenza nellambito dei Beni Culturali Paola Velardi Dipartimento di Informatica Università
Modello E-R Generalizzazioni
Modello E-R Generalizzazioni
A.Natali DL Maggio1999 Oggetti Concetti fondamentali.
LINGUAGGI DI PROGRAMMAZIONE
Namespace Spazio dei nomi Ing. Luca Sabatucci. Scopo I Namespace servono a: I Namespace servono a: distinguere tra elementi e attributi con lo stesso.
1 Internet e nuove tecnologie Anno Accademico Prof. Flavio De Paoli Dott. Marco Loregian.
Database & Information Retrieval
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Internet L’essenziale.
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
1 Ripassino Reti di Computer Carasco 19/02/ Che cosa è una rete informatica? Una rete informatica è un insieme di computer connessi tra di loro.
Creare pagine web Xhtlm. Struttura di una pagina.
Tesi di Laurea in Ingegneria Informatica
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Programma del Corso.
Linguaggi per COMUNICARE
G.ADORNI, M.COCCOLI, G.VERCELLI, G.VIVANET E-LEARNING & KNOWLEDGE MANAGEMENT LAB. UNIVERSITÀ DI GENOVA Il Semantic Web per l’e-learning e l’e-government:
Sistemi basati su conoscenza Gestione della conoscenza Prof. M.T. PAZIENZA a.a
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
I DATABASE.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Ontologie e World Wide Web: la diffusione della conoscenza.
Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.
PIATTAFORMA MAESTRA.
Internet e HTML Diffusione di informazioni mediante la rete Internet.
Catalogo: cosa è? Il catalogo è lo strumento principe di mediazione fra la biblioteca e il lettore; registra e comunica le.
AIUCD 2014 Fr amm entazione delle informazioni e organizzazione della conoscenza Claudio Gnoli (Università di Pavia ; ISKO)
InternetInternet Sede: Salvo D’acquisto 2010/2011 Docente: Vito Monno.
PROGETTO… Internet Providers, registrazione del dominio Costruire una home page … e renderla visibile sul Web.
Carluccio Antonio Carluccio Alessandra Caricola Giovanni Vizzino Anna Università degli Studi di Bari.
Sapienza Università di Roma Sapienza Università di Roma Laurea specialistica in Ingegneria Informatica Seminari di Ingegneria del Software Traduzione di.
SISTEMI DIDATTICI PER L’ E- LEARNING
Metamodellazione in RDF Tesina del corso di Seminari di Ingegneria del Software Alberto Cerullo.
Servizi Internet Claudia Raibulet
Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Corso di “Teorie e pratiche della traduzione” “La scrittura accademica attraverso le lingue e le culture: studio su corpus della voce autoriale” Dott.ssa.
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
Transcript della presentazione:

La nuova “visione” del web: il Web Semantico

Il WWW Un (immensa) rete di collegamenti fra pagine che contengono svariati tipi di risorse: Documenti testuali e multimediali Basi i dati Servizi: prenotazioni on-line, web assistant.. Programmi

Problema: accessibilità dei contenuti Come si accede alle informazioni sul web? Parole chiave digitate dall’utente Voci di una barra di navigazione Nel primo caso l’efficacia dipende dagli algoritmi usati dai motori di ricerca (che studieremo in questo corso e anche nel corso algoritmi per il web) Nel secondo caso, l’efficacia dipende da chi ha organizzato e programmato i contenuti del sito In entrambe le situazioni, molto dipende dal potere evocativo di una espressione

Parole e contenuti Una espressione, o parola chiave, può avere un rapporto generico con il contenuto cui si riferisce Nel caso di navigazione per parole-chiave, ambiguità: Es: albero: informatica, botanica, nautica? Nel caso di barra di navigazione, come classificare un documento che parla di finanziamento del governo alle società calcistiche in pericolo di fallimento? Sport, politica, finanza? Nel web, i collegamenti che consentono di raggiungere i contenuti sono intrinsecamente deboli, troppo generici e vaghi.

Collegamenti sintattici e semantici Le pagine web sono collegate sintatticamente mediante indici che localizzano la URL della pagina. Questi collegamenti permettono di identificare la pagina in modo univoco, e sono dunque piuttosto solidi (problemi di aggiornamento a parte) La debolezza sta nei collegamenti semantici, cioè quelli che dovrebbero definire il significato della pagina indicizzata. Oltre a portare in un determinato luogo (pagina web) un collegamento dovrebbe descrivere il luogo in cui porta. Questa funzione è la capacità semantica.

L’organizzazione delle pagine web attualmente

Organizzazione delle pagine con collegamenti semantici

Collegamenti Semantici: ne avete già sentito parlare! Quando interroghiamo una base di dati, ad esempio una biblioteca on-line, possiamo fare ricerche piuttosto raffinate, ad esempio, chiedere “quali autori hanno scritto almeno due libri sull’Information Retrieval” L’utente può formulare una richiesta che imponga precise relazioni (“almeno due libri sull’IR”), e tali relazioni sono stabilite fra concetti (“autore” e “libro”) anziché fra parole chiave (non si ricerca la stringa “autore” o “libro”). Questo è possibile perché esiste uno schema del DB, cioè un modello ed un insieme di regole che stabiliscono coe debbano essere organizzati i dati

Schemi e collegamenti in un DB: esempio BOOK ISBN authors title name birthdate Schema 1 AUTHOR books Schema

“..voli fra Parigi e New York Web Semantico: utilizzare schemi per descrivere dominii di informazione Tre livelli I dati (le pagine web) I metadati o annotazioni (collegamenti semantici) Lo schema (o ontologia) del dominio “..voli fra Parigi e New York PLACE CITY AirPort kind_of near Building

Ma cosa è il Semantic Web? Il “Semantic Web Wedding Cake”

Livello 1: URI URI: universal resource identifier include URL (locator, cioè ftp:.., http://…) e URN un nome che identifica la risorsa Unicode: assegna un unico numero ad ogni carattere, indipendentemente dalla piattaforma, programma, linguaggio. Lo Standard Unicode è stato adottato da: Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys ecc. http://www.unicode.org/

Livello 2: annotazione Annotazione: entità artificiali utilizzate per descrivere un documento, una sua parte, o una intera collezione. Una annotazione è una coppia (l,def) dove l è un label (ad esempio creator) e def è una definizione più o meno formalmente espressa del suo significato ed uso inteso Annotazione manuali: linguaggi di mark-up (XML, xmlschema..), metadati Annotazione automatica: metodi di elaborazione automatica del linguaggio naturale

Linguaggi di mark-up: XML eXtensible Mark-up Language

Livello 3: RDF resource description framework Un modello generale (e minimalista) per fare asserzioni semantiche su oggetti Web Un “oggetto Web” è detto Risorsa. Una Risorsa è qualsiasi entità identificabile mediante un URI (Uniform Resource Identifier); ciò include pagine Web e documenti XML. Una Proprietà è una risorsa che ha un nome, per esempio Author o Title. In molti casi, l’informazione è contenuta nel nome stesso.

RDF (2) Uno Statement (asserzione) è la combinazione di una Risorsa, una Proprietà ed un valore. Queste parti sono note come soggetto, predicato e oggetto dell’asserzione. Per esempio: "The Author of http://www.textuality.com/RDF/Why.html is Tim Bray." Il valore può essere una stringa, es: "Tim Bray" oppure un’altra risorsa, per esempio: "The Home-Page of http://www.textuality.com/RDF/Why.html is http://www.textuality.com."

RDF (3) Queste proprietà astratte possono essere espresse usando ancora XML, Es: </rdf:Description> <rdf:Description ID="MotorVehicle"> <rdf:type resource="http://www.w3.org/2000/01/rdf-schema#Class"/> <rdfs:subClassOf rdf:resource="http://www.w3.org/2000/01/rdf- schema#Resource"/> <rdf:Description ID="Truck"> <rdfs:subClassOf rdf:resource="#MotorVehicle"/>

Problemi dei linguaggi di annotazione RDF e XML hanno una semantica non esplicita, ed inoltre l’annotazione è manuale. Gran parte del testo è annotata con “tag” generiche, che non descrivono il contenuto. <abstract> <p>The Extensible Markup Language (XML) is a subset of SGML that is completely described in this document. Its goal is to enable generic SGML to be served, received, and processed on the Web in the way that is now possible with HTML.</p> ….. </abstract>

Il livello ontologico Uno modello semantico (schema) ed un insieme di regole per “ragionare” sui dati a disposizione.

Cos’è un’ontologia? Alcune definizioni: Filosofia: “a systematic explanation of being” Neches : “…defines the basic terms and relations including the vocabulary of a topic area as well as the rules for combining terms and relations to define extensions to the vocabulary.” Gruber, la più citata: “…an explicit specification of a conceptualization” Borst, leggermente modificata:“…a formal specification of a shared conceptualization” Guarino: “…a logical theory which gives an explicit, partial account of a conceptualization”

Definizione formale di ontologia (1) 1. un insieme di concetti (detti anche classi), 2. le interconnessioni semantiche tra essi (dette relazioni concettuali, o attributi semantici) 3. un eventuale livello logico che permetta di inferire nuovi fatti a partire da quelli codificati all’interno della risorsa (ad esempio, un insieme di assiomi o micro-teorie).

Definizione formale di ontologia (2) Un’ontologia O può dunque essere definita come una tripla (C, R, A) dove: C è un insieme di concetti R è un insieme di relazioni concettuali tali che ogni relazione in R è definita su CC. A è un insieme di assiomi (se A =  l’ontologia non è assiomatizzata)

Definizione formale di ontologia (3) Si osservi che gli insiemi C ed R individuano un grafo G = (V, E) tale che: V  C E = { (c1, c2)  CC : S  R : (c1, c2)  S } e una funzione di etichettatura l : CC  2R tale che l(c1, c2) = { S  R : (c1, c2)  S }.

Esempio Un semplice esempio di ontologia è il seguente: O’ = (C’, R’, A’) dove: C’ = { Entità, Oggetto, Persona, Meccanico, Automobile, Motore } R’ = { è-un, ha-un, ripara } A’ = { “a  Automobile m  Meccanico : ripara(p, a)” }) è-un = { (Oggetto, Entità), (Persona, Entità), (Meccanico, Persona), (Automobile, Oggetto), (Motore, Oggetto) } ha-un = { (Automobile, Motore) } ripara = { (Meccanico, Automobile) }

Esempio (2) Entity Person Object Mechanic Car Engine Kind_of Has_part Repair

A cosa servono le ontologie? Migliorare la comunicazione fra persone e organizzazioni Favorire l’ interoperabilità fra sistemi Condividere metodi di modellazione, paradigmi, linguaggi, e strumenti software Supportare l’ ingegnerizzazione di sistemi IT (Information Technology): favorire riusabilità/condivisibilità : condivisione delle rappresentazioni formali migliorare la ricerca: usata come meta-data per indicizzare databases documenti e sistemi informativi in generale esprimere specifiche: aiuta nell’identificare i requirements di un sistema IT acquisire conoscenza (generalizzare ragionare)

Annotazioni o metadati UN CASO D’USO SCHEDA REF 820 TITOLO Discorso di Raffaello Lambruschini in occasione dell’adunanza tenuta in onore di Vincenzo Gioberti DESCRIZIONE / Raffaello Lambruschini. - [documento manoscritto]. - 5 luglio 1853. - 8 c. AUTORE Lambruschini, Raffaello INVENTARIO 58671 COLLOCAZIONE Busta 81.1394 NOTA Pubbl. in Atti, C. 31, 1853, p. 344. KEYWORDS Accademia dei Georgofili Annotazioni o metadati

Un caso d’uso: recupero/classificazione di documenti Supponiamo che ad un documento storico digitalizzato sia associato il seguente descrittore: “Discorso di Raffaello Lambruschini in occasione dell’adunanza tenuta in onore di Vincenzo Gioberti”. Un sistema di information retrieval “classico” può estrarre le 4 parole chiave: discorso, Raffaello Lambruschini , adunanza, Vincenzo Gioberti, e con queste indicizzare il documento. Sinonimia: Ad esempio, la parola adunanza ha, nella lingua italiana, i seguenti sinonimi : riunione, adunata, incontro, raduno, assemblea, consiglio, convegno, simposio, compagnia, folla, assembramento, e molti (se non tutti) fra questi termini avrebbero potuto essere usati dall’autore della descrizione in esame. Una annotazione del tipo “meeting, get toghether” (il nome dell’annotazione è tratto dal lessico semantico on-line WordNet 1.7 ) potrebbe riconoscere l’equivalenza di tutti questi termini.

Raffaello Lambruschini adunanza SCHEDA REF 820 TITOLO Discorso/ORAL_COMMUNICATION di Raffaello Lambruschini/PEDAGOGIST in occasione dell’adunanza/MEETING tenuta in onore di Vincenzo Gioberti/PHYLOSOPHER DESCRIZIONE / Raffaello Lambruschini. - [documento manoscritto]. - 5 luglio 1853. - 8 c. AUTORE Lambruschini, Raffaello INVENTARIO 58671 COLLOCAZIONE Busta 81.1394 NOTA Pubbl. in Atti, C. 31, 1853, p. 344. KEYWORDS Accademia dei Georgofili STUDIOSO FILOSOFO PEDAGOGO COMUNICAZIONE_ORALE COMUNICAZIONE RELAZIONE_SOCIALE INCONTRO GRUPPO_SOCIALE GRUPPO Vincenzo Gioberti Raffaello Lambruschini adunanza discorso

Core Ontology STUDIOSO FILOSOFO PEDAGOGO COMUNICAZIONE_ORALE COMUNICAZIONE RELAZIONE_SOCIALE INCONTRO GRUPPO_SOCIALE GRUPPO Vincenzo Gioberti Raffaello Lambruschini DESCRIZIONE: comunicazione_orale, filosofo:Vincenzo_Gioberti, pedagogo: Raffaello_Lambruschini, incontro

Un caso d’uso: navigazione assistita e storytelling Chiaroscuro In drawing, painting, and the graphic arts, the rendering of forms through a balanced contrast between light and dark areas. The technique which was introduced during the Renaissance, is effective in creating an illusion of depth and space around the principal figures in a composition. ... Painting techniques

Una mini-ontologia delle tecniche pittoriche (estratta automaticamente) stipple technique painting gouache monotype rendering framing combining color-stencil- painting etching acquaint matting conservation framing chiaroscuro photomontage collage dry mount serigraph assemblage

Esempio 2: Interoperabilità fra servizi web Segreteria Elettronica (Agente 1) - Riunione - Orario di lavoro - Sede di lavoro - Viaggio - …….. KB1 Sistema di prenotazioni ferroviarie (Agente 2) KB2 - Città di partenza - Città di arrivo - Data di partenza - Ora del giorno - …….. ma: cittaDiPartenza := sedeDiLavoro; cittaDiArrivo := luogoDelMeeting; E se cittaDiPartenza si chiama CittaPart o DepartureCity?

Interoperabilità fra servizi web (2) Top Ontology City Città_Arr Città_Part Sede-Lavoro Agent 2 Ontology Agent 1 Ontology

Esempio 3 E-learning SebRow - sviluppato nel progetto 2003-2004 Un messaggio inviato dal destinatario al mittente per informarlo che il frame è arrivato correttamente SebRow - sviluppato nel progetto 2003-2004

E-learning E’ un “servizio” quindi in realtà rientra nel caso dell’esempio precedente Navigazione “semantica” dei corsi Classificazione materiale didattico Reperimento di materiale didattico (ricerca per concetti)

Problemi (alcuni..) Ontologie (punti di vista) non identici, ma condivisi Sistemi già esistenti: possono mantenere la propria struttura, ma se vogliono comunicare devono avere un protocollo comune Ontologie esistenti compatibili in parte: per ora, quindi, soluzione parziale Poichè necessita anche comunicazione uomo-macchina, condivisione delle ontologie anche tra macchine ed esseri umani

Ontologie: Problemi di ricerca E’ un’area di ricerca che si è molto espansa nell’ultima decade Metodologie Ontologie Costruzione Traduzione Aggiornamento Riuso Valutazione Apprendimento Mapping Fusione Gestione Linguaggi Strumenti

Prossime lezioni Linguaggi Metodologie Strumenti Esempi di ontologie esistenti