P2P e Semantic Web Argomenti avanzati di Sistemi Informativi 2005 Alessio Gambi Andrea Gaschi
P2P e Semantic Web2 Agenda Peer-to-peer Ontologie Soluzioni Architettura Joining the network Query processing Clustering dei nodi Sintesi Esempi di applicazioni
P2P e Semantic Web3 Peer-to-peer: stato dellarte Definizione di Peer-to-Peer: Un sistema di P2P si può definire come un sistema distribuito i cui nodi, o peer, hanno capacità e ruoli equivalenti nello scambio di informazioni e servizi tra loro. Panoramica dei modelli P2P: Direct P2P ModelBroker mediated ModelSuper Peer Network Where is Star Wars ep. III? Alice has it Where is Star Wars ep. III? Alice has it Copying Star Wars ep. III Bob Alice CarolTed Broker BobAliceCarolTed Super Peer
P2P e Semantic Web4 Ontologie Definizione di ontologia Una specifica formale esplicita di una concettualizzazione condivisa Le applicazioni delle ontologie nei sistemi P2P: P2P tradizionali DHT Reti P2P basate su schemi Reti di super-peer per repository distribuiti Sistemi P2P tradizionali Uso limitato dei metadati Indici centralizzati Super-peer e repository distributi P2P basati su schemi DHT Indici distribuiti Costruzione di una topologia della rete Routing più efficace Descrizione del contenuto tramite schemi espliciti Metadati per descrivere le risorse dei nodi e per garantire interoperabilità semantica Strategie di routing basate su schemi e ontologie Migliore scalabilità
P2P e Semantic Web5 Problema Esempio di scenario in una rete P2P: quali problemi ci sono. Peer A Peer B Peer D Peer C Peer Y Peer WPeer Z Peer X Peer Detective Novel Book Novel Journal Book Publication Novel Volume Mistery Novel
P2P e Semantic Web6 Soluzioni tecnologiche: introduzione al nostro lavoro Il nostro lavoro si è concentrato sullanalisi delle principali soluzioni tecnologiche disponibili, che integrino Semantic Web e P2P. Lanalisi si è concentrata su: Architettura concettuale e moduli software Metodologie utilizzate, in particolare: Rappresentazione della conoscenza Query processing Propagazione delle query Soluzioni tecnologiche analizzate: SWAP (AIFB Institute, University of Karlsruhe) Edutella EDAMOK (Itc-Irst e Università di Trento) PSearch H3
P2P e Semantic Web7 ? Architettura dei nodi Definizione di peer: Ogni nodo è una risorsa che si autogestisce e che può compiere molteplici azioni, indipendentemente da tutti i suoi pari. Un peer, può accedere anche a sorgenti di conoscenza esterne. Peer D Detective Novel Diverse implementazioni: Proprietarie vs. Standard Architettura multilivello vs. Wrapping
P2P e Semantic Web8 Joining the network Nel momento in cui un nodo vuole partecipare ad una rete P2P deve notificare la sua presenza (per ricevere le richieste), fornendo informazioni su se stesso alla rete, e deve recuperare informazioni sulla rete stessa o sui suoi partecipanti (per poter inviare le query). Peer D Detective Novel Peer Detective NovelMistery Novel Politiche di notifica: Import vs. Export vs. Passive Evoluzione della conoscenza del nodo: Esplicita vs. Implicita
P2P e Semantic Web9 Query Processing: routing Peer D: Vorrei trovare altre Detective Novel (esempio di query ricca…) Creazione della richiesta contenente le informazioni semantiche del concetto target La richiesta viene inviata ai nodi collegati Ogni nodo che riceve la richiesta, in base alle proprie conoscenze, la inoltra verso i nodi in grado di rispondere Peer B Peer C Peer Y Peer WPeer Z Peer X Detective NovelMistery Novel Book Novel Volume Novel Peer D Semantic Overlay Network Detective Novel Formulazione delle query Scelta obbligata per il linguaggio vs. Libertà di scelta Potere espressivo Sistemi P2P puri vs. Sistemi con Hub
P2P e Semantic Web10 Query Processing: matching Il matching si basa sul concetto di confronto tra il soggetto della query e la rappresentazione delle risorse del nodo. Se il peer B adottasse un algoritmo di matching esatto, la query non otterrebbe alcuna risposta. Invece si abbandona il concetto di matching esatto tipico dei tradizionali sistemi di Information Retrieval, a favore di concetti più laschi come l'equivalenza e la corrispondenza semantica. Peer B Detective Novel Book Novel Book Novel Detective Novel Algoritmi di matching Vettori di termini vs. Schemi Formato delle risposte
P2P e Semantic Web11 Query Processing: reply Le risposte vengono costruite ed inviate direttamente al nodo che ne aveva fatto richiesta. Il peer D raccoglie le risposte e le presenta allutente. Nel caso di assenza di risultati, la politica scelta è non creare nessuna risposta. Peer B Peer C Peer Y Peer WPeer Z Peer X Detective NovelMistery Novel Book Novel Volume Novel Peer D Reply
P2P e Semantic Web12 Clustering dei nodi I nodi che condividono gli stessi interessi o che possiedono informazioni relative a concetti correlati vengono messi logicamente vicini, per aumentare contemporaneamente l'efficienza e l'efficacia delle ricerche di informazioni nella rete. Gli altri nodi, secondo il principio di località, vedono come vicini i nodi correlati. Peer B Peer C Peer Y Peer W Peer Z Peer X Detective NovelMistery Novel Book Novel Volume Novel Peer D Novel Federazioni esplicite vs. Clustering
P2P e Semantic Web13 Sintesi Dal punto di vista prestazionale, le tecnologie di Semantic P2P rappresentano un effettivo miglioramento rispetto ai sistemi P2P tradizionali: Aumento del recall Aumento della precisione Riduzione del numero di messaggi scambiati Limiti ancora da superare: Qualità del servizio Allineamento automatico di schemi diversi Gestione di query complesse Performance non ancora ottimali di meccanismi di matching e di routing
P2P e Semantic Web14 Esempi e applicazioni – problemi tradizionali Bibster: un sistema realizzato in Java e basato sulle tecnologie di SWAP che assiste i ricercatori nella gestione, nella ricerca e nella condivisione di metadati bibliografici in una rete P2P. Molti ricercatori mantengono manualmente liste di dati bibliografici: Senza una semplice visione generale Qualità dei dati variabile. Molti ricercatori desiderano condividere queste risorse senza dover investire tempo nel farlo. Una soluzione centralizzata non esiste, Bibster realizza un ambiente di condivisione della conoscenza che permetta ai ricercatori di: condividere facilmente i dati bibliografici; risparmiare sforzi nella ricerca di questi dati; evitare di dover riscrivere questi dati a mano. PADLR: una infrastruttura web per lapprendimento che permetta una maggiore flessibilità e funzionalità a tutti i livelli dellinsegnamento universitario. PADLR fa in modo che la conoscenza e i materiali didattici siano costantemente ristrutturati e rimodellati e che possano essere acceduti individualmente e soprattutto quando sono necessari. Limplementazione del sistema P2P per lo scambio di risorse didattiche è basata su nodi Edutella.
P2P e Semantic Web15 Unapplicazione originale Distribuited Knowledge Management in B2B: applicazione delle tecnologie P2P e del Semantic Web al B2B, in particolare ai Marketplace (e in genere alleProcurement). Marketplace: un luogo concettuale in cui si incontrano diversi soggetti per scambiare beni e servizi. I problemi di comunicazioni (sinonimie e omonimie) vengono affrontati attraverso la standardizzazione dei cataloghi: Il gestore del marketplace fornisce un catalogo comune sul quale si mappano gli utilizzatori Nel caso eProcurement, sul catalogo di sistema devono essere mappati I cataloghi fisici dei fornitori I cataloghi mentali dei compratori Ma i cataloghi sono difficili da standardizzare! Soluzione: approccio distribuito Gestione distribuita dei cataloghi Aggregazione virtuale di gruppi dacquisto e vendita VerduraFrutta Mele Pere Azienda X Azienda Y Prodotti ortofrutticoli SELLER BUYER Esotica Dessert e Frutta TorteFrutta Nostrana Ciliege Mele Coltivazioni EstiveInvernali Uva Mele Catalogo Standardizzato
P2P e Semantic Web16 Grazie per lattenzione.