La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Sviluppo di una applicazione software per verificare la correttezza di un modello di costo in ambito Data Warehouse si è fatto riferimento al modello.

Presentazioni simili


Presentazione sul tema: "Sviluppo di una applicazione software per verificare la correttezza di un modello di costo in ambito Data Warehouse si è fatto riferimento al modello."— Transcript della presentazione:

1

2 Sviluppo di una applicazione software per verificare la correttezza di un modello di costo in ambito Data Warehouse si è fatto riferimento al modello di costo pubblicato da Engström et al. la Tesi è stata svolta presso lUniversità di Exeter (UK) e lUniversità di Skövde (Svezia) Sviluppo di una applicazione software per verificare la correttezza di un modello di costo in ambito Data Warehouse si è fatto riferimento al modello di costo pubblicato da Engström et al. la Tesi è stata svolta presso lUniversità di Exeter (UK) e lUniversità di Skövde (Svezia) Il problema affrontato Gli elementi più significativi del modello di costo Applicazione software Esempi di risultati sperimentali Il problema affrontato Gli elementi più significativi del modello di costo Applicazione software Esempi di risultati sperimentali Obiettivo della tesi Percorso

3 Database Sorgente DB1 Database Sorgente DB2 Database Sorgente DBN.. Data Warehouse Database sorgente Tabella Database sorgente Tabella Data Warehouse Vista Data Warehouse Vista Data Warehouse Il sistema considerato nel modello di costo Update Query Dati Delta Utenti

4 Update Validazione Sperimentale: corrispondenza tra il comportamento di un sistema reale e le predizioni del modello Sistema reale + Strumenti per eseguire esperimenti Validazione Sperimentale: corrispondenza tra il comportamento di un sistema reale e le predizioni del modello Sistema reale + Strumenti per eseguire esperimenti Il problema affrontato nel Modello di costo nella Tesi

5 Il modello di costo (1) Caratterizzazione delle proprietà della sorgente

6 Database sorgente Tempo di esecuzione Data Warehouse Tempo di esecuzione Tempo di comunicazione Misure tradizionali (esecuzione e comunicazione) Misura staleness (Z) DW Istante in cui la query è posta S1 S2 Risposta basata sullo stato 1 di S1 e 3 di S t t t Il modello di costo (2) - Nuova metrica (qualitativa e quantitativa) Z

7 Applicazione software – Criteri guida Per il linguaggio: portabilità, gestione della concorrenza, gestione connessioni a database; Per larchitettura funzionale: chiara separazione tra le classi che modellano il sistema e le classi che si occupano di controllare e misurare lo stesso; Per i benchmark: rilevanza delle grandezze osservate, scalabilità, chiarezza nellesporre le caratteristiche dellimplementazione e nel presentare i risultati.

8 Applicazione software - Architettura SaccessInterbase ACCESS RowTable WaccessWrapper thread Supdater thread Wquerier thread DirectorConfiguration Data generatorGui Entità del sistema Classi di benchmark Database sorgente Nuovi tipi di dato Data warehouse Emulazione del carico Controllo e misurazione

9 Applicazione software – Implementazione (1) Caratteristiche della sorgente La proprietà DAW Supdater Database Sorgente Waccess Aggiornamenti Numero dellultimo update della sorgente che ha subito il commit Le proprietà CHAC e CHAW Tabella sorgente Tabella DAW Trigger Update Insert Delete Wrapper Se non DAW Se DAW Numero dellultimo update inviato al DW Wrapper confronto

10 Caratterizzazione degli update Basata sullanalisi di Adelberg / Garcia-Molina: Applicazione software – Implementazione (2) Emulazione del carico di lavoro Update parziali Frequenza aperiodica Esecuzione immediata Distribuzione di Poisson

11 Applicazione software – Implementazione (3) Emulazione del carico di lavoro Esplorazione di nuovi algoritmi per produrre il flusso di update Vincente: Algoritmo del Guide Attribute a run-time Pre- scheduling Pro: flusso di update pronto allinizio di un esperimento Contro: numero di update comunque limitato Run-time Pro: flusso illimitato Contro: attenzione ai ritardi introdotti

12 Validazione e Verifica Validazione: garantita dal modello di costo considerato Verifica: svolta mediante controllo dei protocolli e del comportamento sotto carico

13 Verifica (1) I protocolli I protocolli Utilità: 1) Controllare la corretta sequenza di operazioni nelleseguire le politiche di manutenzione 2) Verificare la effettiva indipendenza tra i processi concorrenti Metodo: introduzione di un appropriato output di sistema

14 Verifica (2) Comportamento sotto carico Comportamento sotto carico Utilità: 1) Osservare la evoluzione del sistema nel tempo 2) Controllare le proprietà statistiche degli algoritmi (es: dimensione della tabella sorgente e distribuzione dei valori dei GA) Metodo: creazione di applicazioni esterne di supporto per il monitoraggio della dinamica del sistema

15 Benchmark Ambiente di esecuzione Piattaforma: Sun Ultra 5, Solaris 8, 128 MB, Interbase 6.0, Java 1.2, Codice bytecode 77 Kb Tuning dei parametri di basso livello del sistema operativo e del Dbms Ispezione della qualità dei risultati: si scartano i risultati ottenuti da esperimenti che non soddisfano i criteri di integrità definiti (es: overlapping update, overlapping query)

16 Benchmark Esempi (1) Staleness al variare della frequenza di polling in caso di aggiornamenti periodici del data warehouse. Le due politiche offrono prestazioni sempre più simili al diminuire della frequenza di aggiornamento del DW. Legenda P1: Modifica Incrementale con DAW (violetto) P2: Modifica totale (blu)

17 Benchmark Esempi (2) Costo integrato (esecuzione e comunicazione) al variare della frequenza di polling. Levidenza sperimentale è in pieno accordo con le predizioni del modello anche in caso di configurazioni dei parametri estreme. Risultati sperimentali ( P1 blu, P2 violetto) Predizioni del modello di costo (P1 nero, P2 verde)

18 CONCLUSIONI Lapplicazione implementa tutti gli aspetti del modello di costo Ha superato tutti i test di verifica Gli esempi di benchmark hanno permesso di: 1) fornire conferma di taluni comportamenti del modello; 2) migliorare la nostra conoscenza sul suo comportamento; 3) evidenziare possibili punti di discussione per affinare il modello;

19 Sviluppi futuri Caso distribuito (Java RMI) Estensione al caso multisorgente Considerazione di sorgenti non-relazionali (XML)


Scaricare ppt "Sviluppo di una applicazione software per verificare la correttezza di un modello di costo in ambito Data Warehouse si è fatto riferimento al modello."

Presentazioni simili


Annunci Google