Peer-to-Peer Systems Content-Based Routing of Path Queries in Peer-to-Peer Systems Georgia Koloniari and Evaggelia Pitoura Ingargiola Salvatore Montauti Andrea Pompei Fabio
Sommario Introduzione Sistemi Peer-to-Peer Filtri di Bloom Organizzazione reti P2P: Content-Based Risultati Sperimentali Conclusioni
Introduzione Migliorare le performance di information retreaving in sistemi P2P Ipotesi di lavoro: Contenuto nodi: documenti XML schema-less sintetizzati mediante filtri di Bloom multilivello Organizzazione rete: P2P Content-Based Tipologia query: path queries (XPath-like)
Sistemi P2P: Stato dellArte Sistema Peer to Peer ibrido: impiega un server centrale per ottenere meta-informazioni sull'identità dei Peer che posseggono le informazioni richieste. Napster e OpenNap Sistema Peer to Peer puro: I Peer sono connessi direttamente tra di loro. Non è necessario un server principale. Query routing: flooding, indici decentralizzati. Gnutella e Freenet
Filtro di Bloom Un Bloom Filter è un vettore di bit definito da due parametri : 1.Array di M bit 2.K funzioni di Hash indipendenti con CDom in [1,M] I bit del filtro sono usati per codificare in modo efficiente un insieme di N oggetti. Per Costruire un Bloom filter si scorrono uno dopo laltro gli oggetti dellinsieme. Applicando K funzioni hash ad ogni oggetto si ottengono K valori hash, ogni valore rappresenta la posizione di un bit che deve essere settato ad uno. N.B. : più di una chiave può settare lo stesso bit.
Filtro di Bloom: esempio
Filtri di Bloom multilivello Filtri di Bloom semplici inadeguati per sintetizzare la struttura multilivello dei documenti XML. Soluzioni proposte: Breadth Bloom Filters (BBF) Depth Bloom Filters (DBF)
Breath Bloom Filter XML
BBF filter-match operation Root query: /sport/auto/f1
Depth Bloom Filter XML
DBF filter-match operation Root query: /sport / auto / f1
Risultati Sperimentali BBF DBF con filtri maggiori di bit Migliori performance di BBF con elevato numero di elementi
Struttura gerarchica reti P2P
Content-Based Struttura gerarchica organizzata non più sulla prossimità dei nodi bensì sulla similarità dei loro contenuti Operazioni analizzate: Join Query routing Update: CountSum, BitSum
Content-Based: Join Funzione Hash XML Threshold = 6 Similarity = m – d(Nx, Ny) N1N6N7N2 Nx9657
Content-Based: Query routing Path query //calendario/modelle == A
Content-Based: Query routing Path query //calendario/modelle
Content-Based: Query routing Path query //calendario/modelle
Content-Based: Query routing == XML Path query //calendario/modelle
Content-Based: Update CountSumBitSum
CountSumBitSum tempo
CountSumBitSum tempo
CountSumBitSum tempo
CountSumBitSum tempo
CountSumBitSum tempo Con il metodo Bitsum meno scambi di messaggi
Risultati Sperimentali In sistemi content-based convergenza più veloce Con filtri multilivello minor numero di salti per completare la query
Conclusioni Dal processo dicotomico dellanalisi sperimentale si evince che il miglioramento delle performance nellinformation retreaving può essere ottenuto mediante: 1.Organizzazione gerarchica Content-Based 2. Filtri di Bloom multilivello BBF 3. BitSum come implementazione dei contatori
Bibliografia 1.G. Koloniari, E. Pitoura. (2004) Content-Based Routing of Path Queries in Peer-to-Peer Systems. In Proceedings of the 9° Intenational Conference on Extending Database Technology, pages G. Koloniari, E. Pitoura. Filters for XML-based Service Discovery in Pervasive Computing. Computer Science Dept, University of Ioannina, Greece. 3.X. Gong, W. Qian, Y. Yan, A. Zhou. Bloom Filter-based XML Packets Filtering for Millions of Path Queries. Department on Computer Science and Enngineering Fundan University, Shanghai, China. 4.N. Gioia. (2004) Un sistema Peer-to-Peer per linterrogazione distribuita di dati XML. Tesi di Laurea, Università degli studi di Pisa.
Peer-to-Peer Systems Ingargiola Salvatore Montauti Andrea Pompei Fabio Content-Based Routing of Path Queries in Peer-to-Peer Systems Georgia Koloniari and Evaggelia Pitoura