WWW Metadata e RDF Fabio Vitali. WWW Fabio Vitali2 Introduzione Oggi esaminiamo in breve: u L’esigenza di meta-informazioni u PICS u Il modello dei dati.

Slides:



Advertisements
Presentazioni simili
Tu hai Facebook, o Facebook ha te?
Advertisements

I Namespace Mario Arrigoni Neri.
WWW XML-Namespace Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u Lesigenza e il funzionamento dei Namespace in XML.
Introduzione ad XML Mario Arrigoni Neri.
SEMANTIC WEB Antonio Bucchiarone FBK-IRST Trento, Italy 13 Novembre 2009.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
PHP.
Modulo3 Linguaggi: RDF UNIVERSITA’ DI CAMERINO
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia
INFORMATICA typedef.
Metadati: RDF e RDFS Fabio Vitali.
TW Analisi dei documenti n Classificazione dei componenti n Selezione dei componenti, costruzione della gerarchia, dei blocchi informativi e degli elementi.
WWW Link in XML Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u XLink.
"In Internet non siamo in grado di selezionare, almeno a colpo docchio, fra una fonte credibile e una folle. Abbiamo bisogno di una.
I file l I File sono l unità base di informazione nellinterazione tra utente e sistema operativo l Un file e costituito da un insieme di byte attinenti.
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
Torniamo al terzo problema. Vi è mai capitato di andare in libreria alla ricerca di un libro, cercare tra gli scaffali e non trovarlo... Allora chiedete.
Information Architecture DOL carlotta melon zannini DOL DIPLOMA ON LINE – POLITECNICO DI MILANO - DOL DIPLOMA ON LINE – POLITECNICO DI MILANO.
TECNOLOGIE PER DOCUMENTI DIGITALI
XML e DTD. –il "PROLOG contiene: dichiarazione della versione di XML; commenti (facoltativi); dichiarazione del DOCUMENT TYPE. –il "DOCUMENT INSTANCE.
Università della Svizzera italiana Il web semantico: mito o realtà? Marco Colombetti Politecnico di Milano e Università della Svizzera italiana Roma, 24.
I PROFILI DI APPLICAZIONE (Susanna Peruginelli) ICCU Seminario nazionale sui METADATI Roma, 3 Aprile 2001.
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
RISORSE WEB Internet Per un uso consapevole delle risorse della Rete
INSIEMI NUMERABILI L’analisi matematica introduce il concetto di insieme numerabile come insieme i cui elementi possono essere “contati” ossia che possiede.
LINGUAGGI DI PROGRAMMAZIONE
DBMS ( Database Management System)
Namespace Spazio dei nomi Ing. Luca Sabatucci. Scopo I Namespace servono a: I Namespace servono a: distinguere tra elementi e attributi con lo stesso.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
Implementare un modello di dati
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
Internet L’essenziale.
FONDI PER LA FORMAZIONE AZIENDALE
SINTASSI.
Creare pagine web Xhtlm. Struttura di una pagina.
HTML Lezione 3 Stili.
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Hyper-Text Mark-Up Language
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
XHTML Corso linguaggi per il web a.s. 2011/2012 ITIS A. Righi – Corsico Relatore – Aldo Guastafierro.
HTML I tag HTML (parte 1). I tag HTML  I comandi che il browser interpreta  Etichette per marcare l’inizio e la fine di un elemento HTML  Formato e.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Semantic Web. I problemi della ricerca in Web Querying  Ambiguità della formula Browsing  Arbitrarietà nei criteri di classificazione dei dati = Web.
WWW Link in XML Fabio Vitali. WWW Fabio Vitali2 Introduzione Qui esaminiamo: u XLink.
Nemesi Creazione e pubblicazione di una rivista online tramite l’utilizzo di Java Message Service.
Impostare i caratteri. Le prime versioni del linguaggio HTML così come le prime versioni dei browser consentivano unicamente la scelta tra due tipi di.
Come costruire una mappa concettuale
Biblioteca Digitale Anno 2005 – 2006 GRUPPO METADATA Maestri Gianluca Dal Soglio Serena Conforti Laura Dazzi Enrico Vicini Matteo Cavicchia Daniele.
Tecnologie di InternetDocument Type Definition Dott. Nicola Dragoni Document Type Definition  Document Type Definition (DTD)  Documento XML valido 
HTML e CSS C. Gena, C. Picardi, J. Sproston HTML e CSS.
PROGETTO… Internet Providers, registrazione del dominio Costruire una home page … e renderla visibile sul Web.
Carluccio Antonio Carluccio Alessandra Caricola Giovanni Vizzino Anna Università degli Studi di Bari.
TW Asp - Active Server Pages Nicola Gessa. TW Nicola Gessa Introduzione n Con l’acronimo ASP (Active Server Pages) si identifica NON un linguaggio di.
LTW Annotazioni sul progetto Fabio Vitali. LTW Scopo del progetto Realizzare un sito Web per la lettura e la ricerca di testi e dati su un argomento specifico.
Progettazione di una base di dati Ciclo di vita di un sistema informativo Studio di fattibilità definisce le varie alternative possibili, i relativi costi.
Cenni Su SGML, HTML, XML SGML (Standard Generalized Markup Language) è il padre di tutti i linguaggi "Markup" – Lo svantaggio è la "pesantezza" dei suoi.
WWW Domande Fabio Vitali. WWW Fabio Vitali2 Domanda 1 Vorrei sapere se quando definiamo un tag a livello di working group, cioè per definire i tag comuni.
Servizi Internet Claudia Raibulet
WWW Metadati: RDF e RDFS Riccardo Gentilucci Marco Pirruccio.
Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.
I tag di intestazione. I tag di intestazione sono: e.
Web semantico. il Web Semantico si basa sullo standard URI (Uniform Resource Identifiers), per la definizione univoca di indirizzi Internet al livello.
2 Indice Un esempio Che cosa è A cosa serve Confronto con HTML Punti di forza La sua struttura.
Cercare In Internet. Cercare in Rete La scuola ha un ruolo preciso in relazione a quella che nei paesi anglosassoni viene denominata: Information Literacy.
INSIEMI E LOGICA PARTE QUARTA.
Transcript della presentazione:

WWW Metadata e RDF Fabio Vitali

WWW Fabio Vitali2 Introduzione Oggi esaminiamo in breve: u L’esigenza di meta-informazioni u PICS u Il modello dei dati di RDF u Aspetti della sintassi di RDF u Il Dublin Core

WWW Fabio Vitali3 Meta-informazioni Tutta la famiglia di linguaggi XML ha uno scopo: generare informazioni che non siano soltanto destinati alla lettura, ma che possano essere riutilizzati per applicazioni automatiche. Ad esempio, non c’è niente in un documento HTML che indichi l’argomento trattato o la fonte delle informazioni. L’unico tipo di ricerca che posso fare su un documento dunque è la ricerca sul contenuto. Questo non è sufficiente nella maggior parte delle volte: io ottengo qualche migliaio di hit la maggior parte dei quali non serve assolutamente a niente. Le meta-informazioni permettono agli autori di specificare informazioni sui loro documenti che siano non soltanto leggibili, ma anche interpretabili in maniera intelligente dalle applicazioni di rielaborazione, e soprattutto dai motori di ricerca.

WWW Fabio Vitali4 La responsabilità autoriale sul Web Nel 1995 il W3C era preoccupato perché l’esistenza di siti con materiale “sconveniente” (pornografia, hacking, estremismo politico, ecc.) stava danneggiando lo sviluppo della rete. Il Web, per sua natura, non permette meccanismi di controllo e valutazione preventiva dei contenuti, né meccanismi seri di identificazione degli autori di un documento. Questo significa che chiunque voglia inserire dati e documenti “opinabili” può farlo senza sforzo, rischio personale e ricusabilità. In particolare si temeva in molte sedi l’intervento pesante dei governi, la nascita di un organismo centrale (governativo o meno, comunque controllabile politicamente) che decidesse cosa fosse lecito mettere e cosa no. L’organismo centrale è radicalmente opposto alla filosofia d’uso del Web e di Internet in generale, in quanto collo di bottiglia per l’uso e la distribuzione di informazioni sulla rete.

WWW Fabio Vitali5 PICS (1) PICS (Platform for Internet Content Selection) fu la risposta del W3C alle lamentele sulla qualità delle informazioni sul web poste da associazioni di genitori, associazioni di educatori, associazioni religiose e politiche, ecc. PICS è un brillante meccanismo per coinvolgere le stesse associazioni. Immediatamente adottato ed implementato dai principali produttori di browser, PICS richiede il contributo attivo e indispensabile della stessa associazione di categoria. PICS non invoca nessun meccanismo di censura sui contenuti (peraltro impossibile in una realtà veramente internazionale), ma propone l’uso di meccanismi di valutazione (rating) dei contenuti del sito, e individua nei singoli browser il compito di attivare o meno un controllo.

WWW Fabio Vitali6 PICS (2) Inoltre,non fornisce un sistema fisso di categorie e valori, ma permette a ciascuna associazione di definire le categorie rilevanti e le voci di ciascuna categorie. Infine, non fornisce un meccanismo centralizzato per memorizzare i rating di ciascun sito, ma un’architettura distribuita secondo la quale il seguace, il genitore, la scuola si abbona ad un particolare sito di rating, stabilisce le politiche di selezione del contenuto visibile, e può visitare soltanto quel sottoinsieme di Web che viene reputato innocuo dallo specifico fornitore di rating. PICS non stabilisce categorie pre-definite, ma un meccanismo generale per identificare categorie. E’ quindi possibile usare PICS non solo per fornire censure locali a categorie, ma in generale per esprimere concetti di qualunque tipo sui siti.

WWW Fabio Vitali7 PICS (3) Ad esempio, l’associazione delle biblioteche universitarie americane fornisce attraverso PICS un rating dell’autorevolezza delle informazioni tecniche contenute sui siti: non per fare censura, ma per guida e valutazione delle informazioni. Questo é in definitiva un meccanismo funzionante e sofisticato per esprimere meta-informazioni (cioè valutazioni) su siti Web. Tuttavia PICS richiede di identificare in anticipo tutte le categorie rilevanti e tutti i valori da assegnare a qualunque categoria. Questa limitazione, più il successo di XML, più la nascente idea di Web semantico, hanno portato alla creazione di RDF.

WWW Fabio Vitali8 Il Web semantico Il W3C considera l’ideale evoluzione del Web dal machine- representable al machine-understandable. L’idea è di generare documenti e siti che possano al tempo stesso essere letti ed apprezzati da individui, ma anche acceduti ed interpretati da agenti automatici alla ricerca di contenuti. Il Web si deve dunque dotare di una sovrastruttura di significato processabile da applicazioni, che lo renderebbe il Web semantico. Tre sono le tecnologie chiave per questo sviluppo: u XML, che permette di assegnare etichette e strutture descrittive ai documenti u XPointer, che permette di individuare, negli URI, frammenti arbitrari di risorse pronte per il riuso. u RDF, che permette di associare affermazioni a risorse, affermazioni che sono machine-processable e che permettono

WWW Fabio Vitali9 Applicazioni del Web semantico n Resource discovery: per una efficienza migliore dei motori di ricerca n Sistemi di catalogazione: per descrivere con esattezza il contenuto e le relazioni tra i contenuti di pagine, siti o librerie digitali n Agenti software intelligenti: per facilitare l’accquisione e lo scambio di nuova conoscenza n Content rating: per descrivere collezioni di pagine secondo criteri di interesse o stima soggettivi. n Collezioni: per rappresentare come connesse ed appartenenti ad un’unica opera pagine diverse magari su siti diversi n Gestione del copyright, della proprietà intellettuale, e delle esigenze di privacy di singole pagine ed interi siti.

WWW Fabio Vitali10 RDF E’ una delle più importanti raccomandazioni del mondo W3C. TBL ci tiene moltissimo, il resto del W3C è variamente distribuito dagli entusiasti agli scettici. Molti motori di ricerca stanno già usando RDF per descrivere il contenuto dei loro motori di ricerca. Tuttavia RDF ha senso se c’è attiva partecipazione da parte degli autori di siti, e ad oggi non esistono software ragionevoli per esprimere gradevolmente queste informazioni. RDF è composto da due documenti: u Model and Syntax Specification (W3C Reccomendation del 22 febbraio 99): espone la struttura fondamentale del modello RDF, e descrive una possibile sintassi basata su XML. u RDF Schema ( W3C Candidate Recommendation 27 March 2000 ): espone la sintassi per definire schemi e vocabolari di metainformazioni. Noi ci concentriamo solo sulla prima parte

WWW Fabio Vitali11 Il modello di RDF (1) Il scopo sostanziale di RDF è quello di definire proprietà e valori a risorse descrivibili con URI. Il concetto di URI è fondamentale per RDF (ogni cosa può essere descritta da un URI, sia documenti di rete che oggetti reali, come libri) RDF definisce un modello concettuale fondamentale, e fornisce una possibile sintassi basata su XML. La sintassi XML tuttavia non è necessaria: ogni rappresentazione che mantenga il modello è accettabile.

WWW Fabio Vitali12 Il modello di RDF (2) Il modello di RDF è basato su tre concetti: u La risorsa: le cose che vengono descritte, individuate o da un URI proprio, o da un URI a cui possono essere fatte risalire. u Proprietà: uno specifico aspetto o attributo etichettato che voglio associare alla risorsa. Ogni proprietà ha un significato, una serie di valori leciti, è associabile ad uno o più tipi di risorsa, e si pone in relazione con altre proprietà. u Affermazioni (statement): l’associazione di una proprietà ad una risorsa. Ogni affermazione ha una struttura obbligata del tipo “La proprietà X della risorsa Y vale Z”, o anche “Z è X per Y” Ad esempio: u La proprietà “autore” della risorsa “ vale “Mario Rossi” u “Mario Rossi è l’autore di

WWW Fabio Vitali13 Rappresentazione grafica (1) Mario Rossi La proprietà “autore” della risorsa “ vale “Mario Rossi” autore Risorsa (ovale) Proprietà (freccia) Stringa (scatola)

WWW Fabio Vitali14 Rappresentazione grafica (2) Mario Rossi autore nome La proprietà “autore” della risorsa “ è colui il cui nome è “Mario Rossi” e il cui è

WWW Fabio Vitali15 Sintassi estesa Il primo caso diventa in sintassi estesa: Mario Rossi E il secondo: Mario Rossi

WWW Fabio Vitali16 Prima sintassi compatta Esistono alcune forme equivalenti ma più compatte. Il primo esempio è equivalente alla seguente forma: <rdf:Description about=" fv:autore=“Mario Rossi” /> Gli elementi di tipo stringa e non ripetuti vengono direttamente inseriti nel tag di “Description”.

WWW Fabio Vitali17 Seconda sintassi compatta Il secondo esempio è equivalente alla seguente forma: Mario Rossi Le descrizioni prive di identità autonoma possono essere annidate

WWW Fabio Vitali18 Tipi E’ possibile assegnare ad ogni Description un tipo appartenente ad uno schema di meta-informazioni (progettabile attraverso la definizione di schemi): Mario Rossi L’attributo type specifica l’URI della definizione del tipo nello schema usato.

WWW Fabio Vitali19 Terza sintasi compatta E’ possibile usare il valore del tipo come nome di elemento della descrizione relativa: Mario Rossi Lo schema dà cioè nome alle risorse anonime viste in precedenza.

WWW Fabio Vitali20 Contenitori A volte è importante fare riferimento ad un insieme di risorse (ad esempio, se un documento è stato creato da più autori, o se lo stesso autore ha fatto più di un documento, ecc.) In questo caso si deve inserire la risorsa all’interno di un contenitore a cui verrà applicata la proprietà. RDF definisce tre tipi di contenitori: u Bag. Il bag è un insieme con ripetizioni. L’ordine non è rilevante, ma è possibile inserire più volte lo stesso elemento. u Sequenza. La sequenza è un insieme con ripetizioni ed un ordine definito tra le risorse presenti. u Alternativa. L’alternativa è un insieme senza ripetizioni in cui può essere scelto uno solo degli elementi. L’ordine degli elementi può essere usato per esprimere preferenza.

WWW Fabio Vitali21 Rappresentazione dei contenitori autore Gli autori della risorsa “ sono Andrea Verdi, Giovanni Bruni e Maria Celesti rdf:bag rdf:type rdf:_1 rdf:_2 rdf:_3

WWW Fabio Vitali22 Sintassi dei contenitori Gli autori della risorsa “ sono Andrea Verdi, Giovanni Bruni e Maria Celesti Analogamente si useranno per le sequenze e per le alternative.

WWW Fabio Vitali23 Referenti e referenti distributivi (1) Quando si fa un’affermazione su una collezione, a cosa ci riferiamo: alla collezione o ai singoli elementi? u Dire «Mario Rossi ha scritto “ e “ equivale a dire «Mario Rossi ha scritto “ e «Mario Rossi ha scritto “ u Tuttavia, dire «La commissione composta da Andrea Verdi, Giovanni Bruni e Maria Celesti ha approvato la pubblicazione di “ non è equivalente a dire che Andrea Verdi, Giovanni Bruni e Maria Celesti hanno approvato la pubblicazione: è stata la commissione ad approvarlo, ed uno dei membri poteva senza dubbio aver votato contro.

WWW Fabio Vitali24 Referenti e referenti distributivi (2) Il referente è l’indicazione della risorsa a cui ci riferiamo. RDF definisce tre referenti come attributi dell’elemento “Description”: u about è un referente globale, che si riferisce alla collezione intera, ma non ai singoli elementi. u aboutEach è un referente distributivo, che si riferisce non alla collezione ma a ciascuno dei suoi membri. Mario Rossi u aboutEachPrefix è un referente distributivo definito su un pattern (ad esempio su una directory di un sito Web).

WWW Fabio Vitali25 Reificazione ed indirezione (1) Come è possibile fornire meta-informazioni su una meta- informazione? Ad esempio come posso esprimere la frase «Ugo Bianchi dice che Mario Rossi è l’autore di “ Questo in breve significa attribuire proprietà ad una affermazione, per la qual cosa occorre considerare la meta-informazione come una risorsa da descrivere. Questa procedura si chiama reificazione (riduzione ad oggetto) della affermazione (o statement). Con una indirezione (un referente allo statement reificato) potrò allora esprimere statement su di esso.

WWW Fabio Vitali26 Reificazione ed indirezione (2) Ogni statement, infatti, è equivalente ad un bag di tipo “Statement” in cui la risorsa è il soggetto, il valore è l’oggetto, e la proprietà è il predicato. Quindi sono equivalenti: Mario Rossi e Mario Rossi

WWW Fabio Vitali27 Reificazione ed indirezione (3) Uno Statement reificato può essere usato come risorsa destinatario di un’altra proprietà: Mario Rossi Ugo Bianchi

WWW Fabio Vitali28 Sintassi compatta di reificazione L’attributo “bagID” permette di considerare uno statement esplicito come se fosse reificato. La stessa description può dunque avere un “ID”, utile per indicarla come fonte di ulteriori meta-informazioni, ed un “bagID” utile per esprimere meta-informazioni su di essa. La frase precedente è equivalente al blocco: <rdf:Description about=" bagID=“ST1”> Mario Rossi Ugo Bianchi

WWW Fabio Vitali29 Dublin Core (1) Il Dublin Core è uno schema di meta-informazioni ideato per assegnare etichette ragionevoli alle risorse della rete. Si chiama Dublin Core perché è considerato il nucleo (core) delle meta- informazioni interessanti per qualunque risorsa, e perché è nato da un’iniziativa di bibliotecari, archivisti, fornitori di contenuto e esperti di markup svoltasi nel 1995 a Dublino. Dublin Core è ovviamente indipendente da qualunque sintassi, ma ben si adatta a tutte, ed in particolare a RDF. Dublin Core versione 1 ha introdotto esattamente quindici categorie di meta-informazioni utili per la catalogazione di risorse di rete. La versione 2 non ha modificato le dieci categorie, ma ha aggiunto un meccanismo di sottoclassi (detti qualificatori) delle categorie, ed ha introdotto un elenco iniziale di qualificatori.

WWW Fabio Vitali30 Dublin Core (2) Le quindici categorie descrivono meta-informazioni di tre tipi: ContenutoProprietà intellettualeIstanza TitleCreatorDate SubjectPublisherFormat DescriptionContributorIdentifier TypeRightsLanguage Source Relation Coverage I qualificatori permettono di specificare ulteriormente informazioni di queste categorie, secondo questi criteri: u Raffinamento dello schema: fornisce alcuni significati più precisi sui termini. Ad esempio, “Date” ha come qualificatori: “created”, “valid”, “available”, “issued”, “modified”) u Supporto per codifiche specifiche: permette di usare i valori di specifiche codifiche all’interno del Dublin Core. Ad esempio, “Subject” ha come qualificatori: “LCSH” (Library of Congress Subject Headings), “MeSH” (Medical Subject Headings), “DDC” (Dewey Decimal Classification), ecc.

WWW Fabio Vitali31 Un esempio di Dublin Core in RDF <RDF xmlns=" xmlns:dc=" D-Lib Program The D-Lib program supports the community of people with research interests in digital libraries and electronic publishing. Corporation For National Research Initiatives Research; statistical methods Education, research, related topics Library use Studies World Wide Web Home Page text/html en

WWW Fabio Vitali32 Conclusioni Oggi abbiamo parlato di u L’esigenza di meta-informazioni u PICS u Il modello dei dati di RDF u Aspetti della sintassi di RDF u Il Dublin Core

WWW Fabio Vitali33 Riferimenti n Ora Lassila, Ralph R. Swick, Resource Description Framework (RDF), Model and Syntax Specification, W3C Recommendation 22 February 1999, n Dan Brickley, R.V. Guha, Resource Description Framework (RDF) Schema Specification 1.0, W3C Candidate Recommendation 27 March 2000, n Ora Lassila, Introduction to RDF Metadata, W3C NOTE , n Tim Berners-Lee, Dan Connolly, Ralph R. Swick, Web Architecture: Describing and Exchanging Data, W3C Note 7 June 1999, n Eric Miller, An Introduction to the Resource Description Framework, D-Lib Magazine, May 1998, n S. Weibel, C. Lagoze, M. Wolf, Dublin Core Metadata for Resource Discovery, RFC 2413, September 1998