Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Mohammad Kolahdouzan and Cyrus Shahabi Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases GRUPPO 13: Relatore: Mengoli Dario Mengoli Dario Rovatti Fabrizio Tassoni Davide Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Introduzione Trovare i K Nearest-Neighbors in un Spatial Network Database Approcci esistenti sono basati sul: Calcolo on-line delle distanze tra query e oggetti (Incremental Network Expansion) Utilizzo di strutture a indici (M-tree, R-tree) Gli svantaggi di questi approcci sono: Performance basse se le entità non sono densamente distribuite nella rete Non applicabile per distanze non euclidee (es. distanze di rete) Devo trovare i 5 ristoranti più vicini Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Regole generali Per ottenere un buon risultato un algoritmo deve avere alcune caratteristiche: Incorporare le connettività di rete (es. strade) Dare risposte efficienti per oggetti in movimento Scalabile Essere efficiente nell’inserimento di collegamenti o nodi nella rete Indipendente dalla densità dei punti di interesse Possibilità di considerare query con vincoli su direzione e range Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Voronoi Diagram Partiziona lo spazio in poligoni disgiunti Ogni punto appartiene a una sola cella ad eccezione dei punti di bordo che sono condivisi tra le celle adiacenti Ogni punto dentro il poligono ha come nearest point il generatore del poligono Cella di Voronoi Punto di interesse Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Network Voronoi Diagram Specializzazione di un diagramma di Voronoi calcolato su una rete (dove gli oggetti sono posizionati sugli archi che connettono i nodi) Gli archi possono rappresentare le strade e i nodi i punti di intersezione tra le strade Le distanze tra gli oggetti dipendono dalle connettività della rete e non dalla loro posizione spaziale (non si considera la distanza euclidea) Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Network Voronoi Diagram Punto di Bordo equidistante dai generatori (punto di interesse) delle celle adiacenti Punti di interesse Nodo Network Voronoi Polygon Link Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Approccio utilizzato da VN3 Creazione del Network Voronoi Diagram Precalcolo delle distanze e memorizzazione Generazione di un indice spaziale sui poligoni di Voronoi (R-tree) Salvataggio per ogni cella dei poligoni adiacenti in tabelle di lookup Calcolo del primo NN utilizzando l’indice spaziale Iterazione per K-1 volte per trovare gli altri NN: Filter step Refinement step Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Passo 1 – Network Voronoi Diagram e Tabelle di Lookup Distanza tra i punti di bordo con i punti interni al poligono (per ogni NVP) Distanza tra i punti di bordo del poligono b1 P1 dn (b1, P1) n1 dn (b1, n1) n2 dn (b1, n2) n3 dn (b1, n3) b2 … …… dn (b1, b2 ) Generazione dei Network Voronoi Polygons Precalcolo delle distanze, generazione dell’indice spaziale (R-tree) e delle tabelle di lookup Questi calcoli verranno eseguiti per ogni singolo poligono. In questo modo si riduce la complessità spaziale e computazionale rispetto al caso in cui vengano calcolate le distanze tra ogni punto con tutti gli altri del grafo (punti di bordo<< punti totali) P12 b38 P11 b37 P10 b35 Adiacenza poligoni Punti di bordo Distanze precalcolate b21 P9 b39 b18 b17 b36 b20 b19 b16 b22 b34 P13 P4 P3 b13 b2 b3 b14 b12 b23 b1 P8 b24 b15 b25 n2 n3 P2 b4 b26 P5 P1 n1 b8 b9 b11 b33 b5 b27 b28 b10 b29 b7 P7 b40 b30 b6 b32 P6 P14 b31 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Passo 2 – Generazione dell’indice spaziale e delle tabelle di lookup NVP(P1) P2 NVP(P2) P3 NVP(P3) … …… Salvataggio in tabelle di lookup dei poligoni adiacenti Creazione e salvataggio in memoria dell’ indice spaziale (R-tree) per i poligoni P1 P2, P3, P4, P5, P6 P2 P1, P3, P6, P7, P8 , P10 P3 P1, P2, P4, P10, P11 P4 ………… P12 b38 P11 b37 P10 b35 b21 P9 b39 b18 b17 b36 b20 b19 b16 b22 b34 P13 P4 P3 b13 b3 b2 b14 b12 b23 b1 P8 b24 b15 b25 n2 n3 P2 b4 b26 P5 P1 n1 b8 b9 b11 b33 b5 b27 b28 b10 b29 b7 P7 b40 b30 b6 b32 P6 P14 b31 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Ricerca 1° Nearest Neighbor Attraverso l’indice spaziale R-tree si ricava il primo NN (poligono che contiene q) Accessi al disco O(log n), dove n sono i generatori della rete P1 NVP(P1) P2 NVP(P2) P3 NVP(P3) … …… P12 b38 P11 b37 P10 b35 b21 P9 b39 b18 b17 b36 b20 b19 b16 b22 b34 P13 P4 P3 b13 b3 b2 b14 b12 b23 b1 P8 b24 b15 b25 n2 n3 P2 q b4 b26 P5 P1 n1 b8 b9 b11 b33 b5 b27 b28 b10 b29 b7 P7 b40 b30 b6 b32 P6 P14 b31 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Passo 3 – Filter Step Proprietà: il numero di celle adiacenti per ogni poligono sono in media 6 Proprietà: il vicino successivo si trova necessariamente nei poligoni adiacenti ai poligoni contenenti i precedenti NN Vincola spazio di ricerca Accessi al disco totali: O(5k+1)O(k) Si trovano i poligoni candidati a contenere il secondo NN attraverso le tabelle di lookup che contengono le informazione delle adiacenze tra poligoni P12 b38 P11 b37 P10 b35 b21 P9 b39 b18 b17 b36 b20 b19 b16 b22 b34 P13 P4 P3 b13 b3 b2 b14 b12 b23 b1 P8 b24 b15 b25 n2 n3 P2 q b4 b26 P5 P1 n1 b8 b9 b11 b33 b5 b27 b28 b10 b29 b7 P7 b40 b30 b6 b32 P6 P14 b31 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Passo 3 – Refinement step Si calcolano le distanze tra l’insieme dei candidati (punti di interesse) trovati nel passo di filter con il punto query per trovare il prossimo NN. Per far questo è necessario usare due tipologie di distanze: Query to border computation Border to border computation Distanza tra il punto query e i punti di bordo del poligono che lo contiene (trovata attraverso le distanze salvate nelle tabelle di lookup) Distanze tra i bordi dei NVP, per far questo usano le distanze precalcolate all’inizio e salvate nelle tabelle di lookup Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Minimum possible network distance Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Minimum possible network distance È la distanza minima tra q e un punto di interesse nella rosa dei candidati Proprietà: Se (P1; …; Pk) è l’insieme dei primi K generatori più vicini a q, allora il cammino minimo tra q e Pk può passare solo attraverso una combinazione dei confini comuni tra i poligoni contenenti (P1; …; Pk) Questo cammino può passare solo attraverso poligoni il cui generatore è già stato precedentemente selezionato come NN di q Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Minimum possible network distance Con VN3 tutte queste singole distanze sono già precalcolate Es: dmpn(q, P6) = min{ d(q, b6)+d(b6, P6) ; d(q,b7)+d(b7, P6) ; d(q, b8)+d(b8, b9)+d(b8, b9)} Se (P1, P2) sono i generatori più vicini a q già etichettati, il cammino più breve da q a P6 (il prossimo NN) può passare solo attraverso i confini comuni tra P1/P2 e P6 P12 b38 P11 b37 P10 b35 b21 P9 b39 b18 b17 b36 b20 b19 b16 b22 b34 P13 P4 P3 b13 Primi 2 NN di q b3 b2 b14 b12 b23 b1 P8 b24 b15 b25 n2 n3 P2 q b4 b26 P5 P1 n1 b8 b9 b11 b33 b5 b27 b28 b10 b29 b7 P7 b40 b30 b6 b32 P6 P14 b31 3° NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Trovare il cammino minimo Al passo precedente si è etichettato il prossimo NN. Sono proposti due metodi per definire il cammino minimo: Network Voronoi Poligon Expansion Generazione di sottoreti Distance Computing Optimizazion Versione ottimizzata del precedente in grado di ricalcolare le distanze solo se necessario Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Riassumendo…. Precalcolo distanze, indice e tabelle Ricerca del primo NN attraverso l’indice Generazione dei possibili candidati per il 2° NN Calcolo delle minimun distance tra q e i candidati Determinazione del 2° NN e determinazione del cammino minimo attraverso Dijkstra Generazione dei possibili candidati per il 3° NN ……… Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Esempio Stradale Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Esempio Stradale Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Inserimento punti di interesse Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Calcolo delle distanze 6,08 6,08 12,17 11,18 9,06 9,06 13,04 12,17 9,06 12,17 9,43 14,04 6,08 10,2 7,07 7,07 10,2 10,2 7,07 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 8,25 7,07 6,08 7,07 6,08 15,03 8,25 6,08 12,17 8,25 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 7,07 12,17 13,04 7,07 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Generazione del Network Voronoi Diagram 6,08 6,08 12,17 11,18 9,06 9,06 13,04 12,17 9,06 12,17 9,43 14,04 6,08 10,2 7,07 7,07 10,2 10,2 7,07 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 8,25 7,07 6,08 6,08 12,17 15,03 8,25 7,07 6,08 12,17 12,17 8,25 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 7,07 12,17 13,04 7,07 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Affinamento dei Network Voronoi Poligons 6,08 6,08 12,17 11,18 9,06 9,06 13,04 12,17 9,06 12,17 9,43 14,04 6,08 10,2 7,07 7,07 10,2 10,2 7,07 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 8,25 7,07 6,08 6,08 12,17 15,03 8,25 7,07 6,08 12,17 12,17 8,25 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 7,07 12,17 13,04 7,07 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Pre-calcolo delle distanze Border-to-Generator d(P1,b1) 34,82 6,08 6,08 12,17 b1 11,18 9,06 9,06 13,04 12,17 9,06 12,17 9,43 14,04 6,08 10,2 7,07 7,07 10,2 10,2 7,07 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 P1 8,25 7,07 6,08 7,07 6,08 12,17 15,03 8,25 6,08 12,17 12,17 8,25 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 7,07 12,17 13,04 7,07 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Precalcolo delle distanze Border-to-Generator d(P1,b1) 34,82 ………… ……… 6,08 6,08 12,17 b1 11,18 9,06 9,06 13,04 12,17 9,06 b2 12,17 9,43 14,04 b3 6,08 10,2 7,07 7,07 10,2 10,2 7,07 b4 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 P1 b5 8,25 7,07 6,08 6,08 12,17 7,07 15,03 8,25 6,08 12,17 12,17 8,25 b6 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 b7 7,07 12,17 13,04 7,07 b8 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Precalcolo delle distanze Query-to-Border d(n1,b1) 28,74 ………… ……… 6,08 6,08 12,17 b1 11,18 9,06 9,06 13,04 12,17 9,06 b2 12,17 9,43 14,04 b3 6,08 10,2 7,07 7,07 10,2 10,2 7,07 b4 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 9,06 n1 11,05 P1 b5 8,25 7,07 6,08 6,08 12,17 8,25 7,07 15,03 6,08 12,17 12,17 8,25 b6 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 b7 7,07 12,17 13,04 7,07 b8 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Precalcolo delle distanze Border-to-Border ………… ……… d(b2,b1) 35,295 6,08 6,08 12,17 b1 11,18 9,06 9,06 13,04 12,17 9,06 b2 12,17 9,43 14,04 b3 6,08 10,2 7,07 7,07 10,2 10,2 7,07 b4 8,25 12,17 11 11,66 6,08 6,08 11,05 9,06 16,12 11,4 6,08 11,05 6,08 9,06 11,05 9,06 P1 b5 8,25 7,07 6,08 7,07 6,08 12,17 15,03 8,25 6,08 12,17 12,17 8,25 b6 8,25 8,25 12,17 6,08 8,25 7,07 6,08 6,08 12,17 12,17 14,32 7,07 7,07 7,07 12,17 b7 7,07 12,17 13,04 7,07 b8 7,07 6,08 14,18 12,17 6,08 14,14 Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Inserimento del Punto Query Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Primo Nearest-Neighbor 1-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Filter-Step (Scelta dei candidati) 1-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Refinement-Step (calcolo delle distanze) 2-NN 1-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Refinement-Step (cammino minimo) 2-NN 1-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
K-esimo Nearest-Neighbor 2-NN 1-NN 3-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
K-esimo Nearest-Neighbor 2-NN 1-NN 3-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
K-esimo Nearest-Neighbor 2-NN 1-NN 4-NN 3-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
K-esimo Nearest-Neighbor 2-NN 1-NN 4-NN 3-NN Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Update Network Modifiche alla rete comportano cambiamenti non all’intero NVD ma solo ad alcuni poligoni e questo comporta il ricalcolo solo di alcune distanze Aggiunta/rimozione di link/nodi contenuti in un solo NVP ricalcolo delle distanze rispetto ai punti di bordo Eventuale ricalcolo della forma del NVP e delle distanze con i punti di bordo dei NVP Aggiunta/rimozione di link/nodi contenuti in un più NVP Rigenerazione dei NVP interessati e di quelli adiacenti Aggiunta/rimozione di un punto d’interesse La modifica della rete interesserà solo il poligono che contiene il punto d’interesse aggiunto/rimosso ed alcuni poligoni adiacenti. Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
VN3 vs Incremental Network Expansion VN3 ha un tempo di calcolo nullo indipendentemente dalla densità dei punti, INE peggiora di molto se ho una bassa densità dei punti di interesse VN3 ha più utilizzo cpu a causa delle distanze precalcolate ma ha meno accessi in memoria Il tempo totale di risposta di VN3 è fino ad un ordine di grandezza in meno rispetto a INE Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Overhead precalcoli Il numero di precalcoli aumenta quando la densità dei punti di interesse diminuisce in quanto i NVP devono ricoprire aree più grandi Nell’approccio Naive dove si calcolano le distanze tra tutte le coppie di nodi sono richiesti comunque 3,2 miliardi di precalcoli!!! Meno densi Più densi Overhead dei precalcoli Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases
Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases Conclusioni VN3 migliora le prestazioni di INE di un fattore che varia da 1,5 a 12 a seconda della densità dei punti di interesse La fase di Filter Step genera un set di candidati 4 volte più piccolo rispetto approcci tradizionali e varia di poco a seconda della densità dei punti di interesse Complessità totale degli accessi al disco O(k+log(n)) Implementato utilizzando semplici strutture dati (es: R-tree, tabelle) Il precalcolo richiede bassa complessità spaziale e temporale poiché interessa aree più piccole (rispetto all’intera rete) Voronoi-Based K Nearest Neighbor Search for Spatial Network Databases