Sistemi basati su conoscenza Semantic Web Prof. M.T. PAZIENZA a.a. 2005-2006.

Slides:



Advertisements
Presentazioni simili
Intelligenza Artificiale 1
Advertisements

Introduzione ad XML Mario Arrigoni Neri.
Analisi e progettazione
INTRODUZIONE Il framework.NET. Un po di storia Sin dalla prima versione del sistema operativo Windows (1990 circa), nacque la necessità di far comunicare.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità B1 Introduzione alle basi di dati.
Unità A1 Informazioni e dati. Obiettivi Conoscere i principali concetti legati allinformatica Saper distinguere tra informazioni e dati Conoscere il concetto.
1 Introduzione ad XML. 2 Problemi con SGML Complesso da comprendere ed utilizzare Non è pensato per la rete: mancano link ipertestuali e specifiche grafiche.
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Relatore: Prof. Sonia Bergamaschi Correlatore: Alexandre Passant
Il Sistema MOMIS Il progetto MOMIS (Mediator EnvirOnment for Multiple Information Sources) consiste nella realizzazione di un sistema intelligente d integrazione.
Il mio nome è Alain Fergnani e nel corso della tesi mi sono occupato della dinamica delle ontologie per il Web Semantico, e in particolare dell’approccio.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Basi di Dati prof. A. Longheu
4 – Progettazione – Introduzione e Modello E-R
Basi di Dati prof. A. Longheu 4 – Progettazione – Introduzione e Modello E-R Cap. 5 Basi di dati Atzeni – Ceri – Paraboschi - Torlone.
Ontologie: dalle scienze cognitive al Semantic Web
Intelligenza Artificiale 2 Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Gestione dei dati e della conoscenza (agenti intelligenti) M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Prof. M.T. PAZIENZA a.a
Metodologie per la gestione di conoscenza ontologica Prof. M.T. PAZIENZA a.a
Maria Teresa PAZIENZA a.a
Intelligenza Artificiale 1 Gestione della conoscenza lezione 8
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento (2 - Reti semantiche, Frames) Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Conoscenza e ragionamento Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Basi di conoscenza: rappresentazione e ragionamento Prof. M.T. PAZIENZA a.a
XML Prof. Barbara Pernici Politecnico di Milano. Introduzione a XML.
Tipo Documento: unità didattica 1 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
Perché.Net e non più COM/DCOM ? Superamento dei problemi di COM: Richiede una infrastruttura "non semplice" da ogni applicazione (ad esempio Class Factory.
Università della Svizzera italiana Il web semantico: mito o realtà? Marco Colombetti Politecnico di Milano e Università della Svizzera italiana Roma, 24.
Linguaggi di markup1 LINGUAGGI DI MARKUP. Linguaggi di markup2 Documenti su Internet Internet permette (tra laltro) di accedere a documenti remoti In.
Modello E-R Generalizzazioni
Normalizzazione Le forme normali certificano che la base di dati soddisfa criteri di qualità che mirano ad evitare le ridondanze e i conseguenti effetti.
Modello E-R Generalizzazioni
AN FI Un denominatoe comune Comandi u notazioni che esprimono azioni che, una volta eseguite, comportano una modifica permanente dello stato interno.
Applicazioni di modelli matematici alla ricerca semantica
Descrizione Semantica ad Alto Livello di Ambienti Virtuali in X3D
VRML97 -Appendice- Cristina Donati 1 VRML97. Il Virtual Reality Modeling Language (VRML) è un formato di file volto alla descrizione degli oggetti interattivi.
Lezione 1 Linguaggi di programmazione – Algoritmi –Istruzioni
Il Semantic Web applicato ai percorsi formativi nelle organizzazioni innovative By CSTAdvising CSTAdvising, professionisti della conoscenza,
Verso lo spazio profondo
Tesi di Laurea in Ingegneria Informatica
Basi di Dati e Sistemi Informativi
Il World Wide Web Lidea innovativa del WWW è che esso combina tre importanti e ben definite tecnologie informatiche: Documenti di tipo Ipertesto. Sono.
Analisi dei Requisiti (Requirements Engineering) Seminario RE Università degli Studi di Padova, 12 Gennaio 2004.
1 Ontology languages. Strato dei modelli LA SCELTA DEL LINGUAGGIO Una volta selezionati i componenti dell’ontologia occorre esprimerli in maniera esplicita,
PROGRAMMA IL FUTURO Anno Scolastico 2014 / 2015
I DATABASE.
DAL WEB AL SEMANTIC WEB Aspetti teorici e tecnologici Carmagnola Francesca Dipartimento Informatica C.so Svizzera 185, Torino
Sistemi basati su conoscenza Semantic Web Prof. M.T. PAZIENZA a.a
HTML e CSS C. Gena, C. Picardi, J. Sproston HTML e CSS.
1 Interpretazione astratta: un approccio sistematico all’analisi statica.
LTW Annotazioni sul progetto Fabio Vitali. LTW Scopo del progetto Realizzare un sito Web per la lettura e la ricerca di testi e dati su un argomento specifico.
Corso di Laurea in Informatica
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
Servizi Internet Claudia Raibulet
1 Linguaggi: guardando la semantica §esistono un insieme di concetti semantici e di strutture di implementazione in termini dei quali si descrivono in.
Intelligenza Artificiale 1 Gestione della conoscenza lezione 14 Prof. M.T. PAZIENZA a.a
Informatica Umanistica LM - Scienze del Testo Docente Alessia Scacchi.
Facoltà di Sociologia Corso di formazione in Sicurezza urbana Anno accademico 2007/08 Corso in SOCIETÀ DEL RISCHIO Tutor : Anita Bacigalupo Lezione del.
Progettazione di basi di dati: metodologie e modelli
Indicizzazione di documenti semistrutturati Sistemi informativi – AA D’Este Laura.
Intelligenza Artificiale Metodologie di ragionamento Prof. M.T. PAZIENZA a.a
Sistemi basati su conoscenza Semantic Web Prof. M.T. PAZIENZA a.a
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Università degli studi di Modena e Reggio Emilia Facoltà di Scienze Fisiche, Informatiche e Matematiche Corso di Laurea in Informatica Progettazione e.
Le basi di dati.
  Lingua materna (LM o L1): la lingua che acquisiamo ‘inconsciamente’, del nostro vivere quotidiano  Lingua seconda (L2): la lingua che si impara in.
Transcript della presentazione:

Sistemi basati su conoscenza Semantic Web Prof. M.T. PAZIENZA a.a

Introduzione Internet contiene enormi quantità di dati memorizzati in milioni di pagine che vengono usate per lo scambio di informazioni. In maggioranza sul web vengono create pagine a contenuto testuale ma prive di qualunque tipo di annotazione semantica. A causa di ciò il processo di ricerca si basa ancora quasi esclusivamente su keywords vanificando gli obiettivi ambiziosi di accesso alle informazioni supportato dal web

Tim Berners-Lee visione (2001) “... a goal of the Web was that, if the interaction between person and hypertext could be so intuitive that the machine-readable information space gave an accurate representation of the state of people's thoughts, interactions, and work patterns, then machine analysis could become a very powerful management tool, seeing patterns in our work and facilitating our working together through the typical problems which beset the management of large organizations.” T. Berners Lee (ed altri) continuano a lavorare per la realizzazione di un tale progetto ambizioso ormai universalmente noto come Semantic Web

Situazione attuale: Syntactic Web [Hendler & Miller 02]

Il Syntactic Web è… Un luogo dove 1.gli elaboratori gestiscono la visualizzazione dei documenti (compito ben definito e facilmente implementabile) 2.le persone realizzano i collegamenti concettuali e l’interpretazione (compito ancora non ben definito e difficile da realizzare) Sarebbe interessante sviluppare processi automatici per il punto 2

Aspettative per il SW Porre domande complesse che implichino background knowledge (vorrei informazioni su chi insegna“basi di dati”) Localizzare informazioni specifiche all’interno di data repositories (ricerche di percorsi di viaggio, prezzi di prodotti di una categoria merceologica, risultati di esperimenti, …) Delegare a web “agents” compiti complessi (mostrami un sito dove comprare un laptop potente, non molto costoso e soprattutto leggero)

Qual è il problema? Consideriamo una pagina web

Qual è il problema? Consideriamo un’altra pagina web

Qual è il problema? Consideriamo ancora un’altra pagina web

Qual è il problema? Le pagine sono state visualizzate negli opportuni formati e colori, i link ipertestuali sono opportunamente visualizzati e collegati ad altri contenuti; il tutto indipendentemente dal linguaggio in cui le pagine sono state scritte Il contenuto (semantico) di ciascuna pagina è accessibile solo agli umani ma non agli elaboratori …

Un esempio: analisi della query Who holds the Database course? [Who] [holds] [the Database course]? lsubjlobj NPK:course_cNPKVPK syntactic analysis list_all(X). relation(E,teach), arg1(E, person_c(X)), arg2(E,course_c(“ Database course “ )) semantic analysis

Un esempio: matching della query list_all(X). relation(E,teach), arg1(E, person_c(X)), arg2(E,course_c(“ Database course “ )) teach

L’informazione vista dalla macchina…                          

Solutione: XML markup con tag ricchi di significato                        …

Ma cosa dire circa i contenuti?…                           …

C’è bisogno di semantica External agreement sul significato delle annotazioni Accordo sul significato di un insieme di tag di annotazione Problemi possibili Scarsa flessibilità Numero limitato di fatti che possono essere espressi Uso di Ontologie per specificare il significato delle annotazioni –Le ontologie forniscono un vocabolario di termini –Nuovi termini posso essere formati combinando termini preesistenti: “Conceptual Lego” –Il significato (semantica) di tali termini è formalmente specificato –E’ possibile specificare relazioni tra termini in ontologie diverse.

[AKT 2003]

Quali le difficoltà? I linguaggi ontologici sono complessi Le ontologie sono complesse (le persone le realizzano facilmente usando l’intuizione piuttosto che la logica; ma l’intuizione è difficile da formalizzare) La complessità del problema è nota sin dall’antichità (Aristotele), ed ora torna di attualità perché il SW diventa significativo una volta definiti i problemi di rappresentazione della conoscenza

Struttura delle ontologie Le ontologie in genere si basano su due componenti principali: Vengono usati nomi per indicare concetti di dominio –Elefante è un concetto i cui membri sono degli animali –Erbivoro è un concetto i cui membri sono proprio quegli animali che mangiano solo piante o parti di piante –Elefante adulto è un concetto i cui membri sono proprio quegli elefanti con età superiore a 20 anni Conoscenza di background /vincoli sul dominio –Gli elefanti adulti pesano almeno 2000 kg –Tutti gli elefanti sono o elefanti africani o elefanti indiani –Nessun individuo può essere contemporaneamente un erbivoro ed un carnivoro

Gestione delle ontologie Necessità di definire tool e servizi per aiutare gli utenti a: –Disegnare e mantenere ontologie di qualità, ovvero: Ricche di significato — tutte le classi definite devono avere istanze Corrette — catturare le intuizioni degli esperti Scarsamente ridontanti — evitare sinonimi inutili Ampiamente assiomatizzate — descrizioni dettagliate –Memorizzare numerose istanze di classi di dominio, ovvero: Annotazioni dalle pagine web –Rispondere a query relative a classi ed istanze dell’ontologia, ovvero: Trovare classi più generali/specifiche Trovare pagine/annotazioni corrispondenti ad una data descrizione –Integrare ed allineare più ontologie

Premise: a promise …quindi… The concept of machine-understandable documents does not imply some magical artificial intelligence which allows machines to comprehend human mumblings. It only indicates a machine's ability to solve a well-defined problem by performing well-defined operations on existing well-defined data. Instead of asking machines to understand people's language, it involves asking people to make the extra effort. Tim Berners-Lee, “What the Semantic Web can represent”,

Soluzioni per il SW L’adesione a linguaggi per la rappresentazione della conoscenza sul web, come RDF e OWL, dovrebbe garantire una effettiva interoperabilità della conoscenza distribuita tra più sorgenti informative autonomamente definite. Il passaggio da syntactic a semantic web più che richiedere una maggiore intelligenza da parte dei sistemi di calcolo, può avvenire se si definiscono metodologie condivise (standard) per la rappresentazione della conoscenza. …ma…

Modelli e Meta-modelli OWL, RDF etc.. non sono modelli del mondo/dominio, sono modelli per la rappresentazione della conoscenza e, di conseguenza, meta-modelli per descrivere oggetti del mondo reale. Se si afferma A is-a B, si intende: che tutte le istanze di A sono anche istanze di B che tutte le istanze di A sono soggette alle restrizioni delle proprietà che sono specificate su B … Non si può affermare: come le istanze di A (o B ) si relazionino con oggetti del mondo reale

Soluzioni per il SW Per tornare alle parole di Berners-Lee, non c’è alcuna necessità di –“magical artificial intelligence” –natural language understanding bensì soltanto di aderire ad un livello ontologico –non necessariamente ad una sola ontologia generale … –…ma un insieme di ontologie di fiducia che vengono condivise in un dato contesto.

Semantica di una ontologia La semantica di una ontologia viene definita tramite: –l’interpretazione data da coloro che usano l’ontologia stessa all’interno di un framework specifico (red car è una macchina rossa o un modellino di macchina rossa?) –l’uso che le applicazioni fanno dei concetti dell’ontologia all’interno del framework in cui sono coinvolte Lo spazio dei nomi si comporta, sotto tutti gli aspetti, come referente degli oggetti all’interno dello stesso framework. Si ipotizza che: –gli umani siano capaci di interpretare nella stessa maniera gli stessi nomi nello stesso spazio dei nomi, così come –le macchine siano capaci di usare tali dati consistentemente.

Esistono molte ontologie tra loro diverse e altre saranno sviluppate in futuro relativamente allo stesso dominio o domini parzialmente sovrapposti Integrare le loro informazioni è importante sia: a livello di schema Migrazione della conoscenza ed interrogazioni remote a livello di dati Espandere la conoscenza relativa agli stessi oggetti Tale integrazione può essere realizzata attraverso processi di Ontology Merging (produzione di una sola risorsa globale da altre pre-esistenti) Ontology Alignment (mappings tra due risorse esistenti) Cosa accade in caso di mancato agreement semantico? SISI SJSJ SKSK

La mancanza di un qualsivoglia accordo rende difficile che: –concettualizzazioni analoghe in diverse ontologie siano facilmente “mappate” una con l’altra –questi mappings siano “semanticamente conservativi” Ciò implica che i sistemi di calcolo siano coinvolti in attività ulteriori di processing per rendere la conoscenza : –“comprensibile” –interoperabile

Ruolo del linguaggio naturale Su quale informazione possono basarsi le macchine? Il linguaggio Il linguaggio (naturale), alla fine, può essere considerato l’ultima risorsa sfruttabile Rimane l’unico modo per trasferire la semantica dei dati Aiuta gli umani a capire come oggetti formali corrispondano alla loro conoscenza sul mondo Può essere d’aiuto alle macchine nell’armonizzae differenti concettualizzazioni Pro: offre un modo ricco ed universalmente accettato per esprimere il significato Contro: è ambiguo; fenomeni di synonimia ed omonimia L’importanza del linguaggio è spesso sottostimata, sotto molti aspetti: –Risultati sperimentali (e.g. nel Ontology Alignment) –Standard (nessuno standard nè per associare il linguaggio alla conoscenza concettuale, nè per rappresentare la stessa conoscenza linguistica) –Risorse / Infrastrutture