UNIVERSITA’ POLITECNICA DELLE MARCHE

Slides:



Advertisements
Presentazioni simili
Esame di Stato Prova scritta di Informatica
Advertisements

I.Stat per i censimenti Stefania Bergamasco | Dipartimento per l'integrazione, la qualità e lo sviluppo delle reti di produzione e di ricerca.
Esercizio zSi vuole realizzare un data warehouse per una azienda che vende mobili allingrosso. zIl data warehouse deve permettere di analizzare i ricavi.
una interfaccia internet per il sistema Momis
Biglietti e Ritardi: schema E/R
Obiettivo della tesi Percorso
WebProfessional Web Content Management System
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Relatore:
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento Analisi.
Presentazione del Progetto
Università degli Studi di Modena e Reggio Emilia
“PROGETTO ED IMPLEMENTAZIONE DI UN SISTEMA DI BUSINESS INTELLIGENCE
Progetto e realizzazione del software "Solar Data Manager"
Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea in Ingegneria Informatica Integrazione di WordNet Domains.
Analisi e Contromisure di tecniche di Sql Injection
UNIVERSITA’ DEGLI STUDI DI MODENA E REGGIO EMILIA
COMPARAZIONE DI STRUMENTI SOFTWARE PER LA CREAZIONE, LA GESTIONE E LINTEGRAZIONE DI ONTOLOGIE Università degli Studi Modena e Reggio Emilia Facoltà di.
Data warehousing con SQL Server
Biglietti: schema E/R.
1 Biglietti: schema E/R. 2 Biglietti: albero degli attributi.
Tesi di Laurea Triennale in Ingegneria Elettronica Applicata
30/05/07Cinzia Bocchi1 Programmi Ministeriali Informatica Abacus Finalità e obiettivi.
Progetto Sistema direzionale per le politiche di sviluppo rurale 9 gennaio 2008 Sistema Informativo Direzionale Regionale REGIONE TOSCANA.
La piattaforma di BI si basa essenzialmente su un sistema di metadati centralizzato che garantisce la consistenza delle informazioni e consente la navigazione.
Il Data Warehouse dellIstat i.Stat Istat, 18 febbraio 2010.
ON LINE ANALYTICAL TRANSACTION PROCESSING (OLAP)
Gruppo di ricerca in Computer Networks Dipartimento di Informatica e Automazione Università di Roma Tre attività del.
Prototipo di uno strumento per la produzione di siti Web adattativi in grado di gestire varie coordinate di adattamento Riccardo Torlone Milano, novembre.
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
E-learning e tecnologia dei learning object:
D2I Integrazione, Warehousing e Mining di sorgenti eterogenee Tema 2: Progettazione e interrogazione di Data Warehouse Unita' coinvolte nel tema Università
Il Corso di Laurea in Fisica
CISI – Centro Interstrutture di Servizi Informatici e Telematici Progettazione e realizzazione di un sistema FaD dAteneo CISI – Centro Interstrutture di.
Monitoraggio, analisi e qualità dei dati Lucia Buzzigoli Gianni Marliani Cristina Martelli Dipartimento di Statistica G.Parenti La rilevazione dei prezzi.
Il ruolo degli Uffici Regionali dellIstat e iniziative sperimentali Incontro sul tema LOSSERVATORIO COMUNALE PREZZI: il punto di vista degli statistici.
WP3 – Fornitura per realizzazione Prototipo Condivisione obiettivi e scenari duso 12 Giugno 2008.
Università degli studi di Udine facoltà di Scienze M.F.N. SVILUPPO FUNZIONALITA' GIS SU PORTALE ZOPE Relatore: Prof. Claudio Mirolo Laureando: Marco Celotti.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Scienze Matematiche, Fisiche e Naturali Corso di Laurea in Scienze dellInformazione Applicazione.
KAPPAELLE 2008 Roberto Pirrone Università degli Studi Palermo
Integrazione dei dati e reportistica avanzata in SURplus: un esempio
ORSS Web 2012.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA DI MODENA Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO E REALIZZAZIONE.
COMUNE ODERZO Gestione del CMS……………… Tecnoteca srl © 2008.
Gruppo 11: Ausili Andrea Giovanni Belellixxxxxxxx Polenta Marcoxxxxxxxx Giuseppe Prencipexxxxxxxx Marco Trinastichxxxxxxxx Università Politecnica.
LA QUALITA’ NELLA PROGRAMMAZIONE DELL’ESERCIZIO
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA Facoltà di Ingegneria “Enzo Ferrari” – Sede di Modena Corso di Laurea Specialistica in Ingegneria Informatica.
UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica Anno Accademico Sistema informativo.
23 novembre 2000Provincia di Pesaro - Servizi sociali e Servizi informativi e statistici 1 O SSERVATORIO P ROVINCIALE SULLE P OLITICHE S OCIALI Modello.
Università del Salento Facoltà di Ingegneria Corso di Basi di dati I a.a
Usability Lab 2001 Corso Elementi di Progettazione di Basi di Dati Multimediali in rete Metodologie di validazione e Usabilità Usability Lab 2001 Interfacce.
Risultati complessivi Diego Ragazzi
Laurea specialistica in pianificazione e politiche per lambiente Progettazione operativa ed utilizzo di un archivio sulle tecnologie di bonifica Ing. Stefania.
Usability Lab 2007 Corso Laboratorio di Basi Dati II Interfacce visuali avanzate ROOMS Linguaggio di navigazione e di interrogazione visuale Prof. Flavio.
1 Data warehousing con SQL Server SQL Server è un RDBMS (Relational DataBase Management System) Analysis Services è un componente di SQL Server che offre.
ReportER: strumento per il supporto al processo decisionale regionale Sistema Informativo Politiche per la Salute e Politiche Sociali Bologna 16/05/2014.
Un "adempimento" che si trasforma in opportunità Pronti per il ?
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA DIPARTIMENTO DI INGEGNERIA “Enzo Ferrari” Corso di Laurea in Ingegneria Informatica Anno Accademico 2013/2014.
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
SCHEDA INFORMATIVA DI UNITÀ
1 Business Intelligence Franco Perduca Factory Software Analysis Service Introduzione.
Tema 2: progettazione e interrogazione di data warehouse
Kick off GeoPKDD - Pisa, Data Warehouse Spaziali idee preliminari maria luisa damiani dico - milano.
By: Powered by:. Tecnologia Microsoft La soluzione CCAnalyzer utilizza la tecnologia OLAP (On Line Analytical Processing) di Microsoft presente nel software.
Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.
Università degli Studi di Bologna FACOLTÀ DI INGEGNERIA Corso di Laurea in Ingegneria Gestionale Ricerca Operativa MODELLI PER L’OTTIMIZZAZIONE DELL’OFFERTA.
Progettazione di basi di dati: metodologie e modelli
Per un nuovo orientamento nella progettazione dei linguaggi di programmazione Tesi di Laurea di: RICCARDO SOLMI Università degli Studi di Bologna Facoltà.
Sociologia Generale R. Ghigi - Sociologia Generale – Scienze della Formazione – (7CFU) Corso di Sociologia Generale Facoltà di Scienze della Formazione.
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Transcript della presentazione:

UNIVERSITA’ POLITECNICA DELLE MARCHE Facoltà di Ingegneria Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO DI UN DATA WAREHOUSE PER IL SUPPORTO AL MONITORAGGIO DI PREZZI E TARIFFE SUL WEB http://pollosky.it Anno Accademico 2007/2008

Ambito Problematiche Obiettivi Osservatori prezzi TRASPARENZA E CONOSCENZA SUI LIVELLI E SULLE DINAMICHE CHE CARATTERIZZANO L’ ANDAMENTO DEI PREZZI Problematiche RACCOLTA DATI (COSTI, COMPLESSITÀ) POTENZIALITA’ DI ANALISI Obiettivi RACCOLTA ED INTEGRAZIONE DEI DATI SUL WEB GESTIONE DEI DATI SISTEMA DI SUPPORTO ALLE ANALISI Come già detto il progetto nasce da uno studio degli osservatori prezzi Caratteristiche servizi Si sono individuate delle problematiche Ciò ha condotto alla definizione di un insieme di obiettivi orientati verso la raccolta e la gestione dei dati Che hanno poi portato all’implementazione di una soluzione per il supporto all’attività di monitoraggio di prezzi e tariffe

Si possono notare linguaggi e strumenti di riferimento Area indirizzata all’analista Estrarre informazioni dalle sorgenti web coordinare le chiamate al wrapper tool Interpretare i dati estratti applicare una logica per il riconoscimento delle informazioni Supervisionare le operazioni di caricamento monitorare le fasi di caricamento, prevedere dei file di log Supportare analisi di alto livello implementare strumenti analitici flessibili ed efficaci

Attività progettuale Progettazione della base dati Completa Generalizzata Soluzione problematiche Gestione delle eterogeneità (aggregazioni) Base dati capace di agevolare le operazioni analitiche Diversi tipi Parallelamente si sono gestite tutta una serie di problematiche legate alla progettazione della base dati La maggiore criticità si è incontrata nella gestione delle aggregazioni tra i dati

Sistema di supporto alle analisi Analisi flessibili ed interattive OLAP Modello multidimensionale Dimensione Funzione di aggregazione Lo scopo è di riuscire a realizzare un sistema che permetta di gestire analisi flessibili ed interattive Generare query dinamicamente Nei data warehouse l’analisi avviene rappresentando i dati in forma multidimensionale Modello logico di riferimento è il datacube… Fatto: concetto sul quale centrare l’analisi Misura: proprietà atomica di un fatto Dimensione: prospettiva lungo la quale effettuare l’analisi Misura

Metodologia di progettazione [Cabibbo, 1998]: Data warehouse Metodologia di progettazione [Cabibbo, 1998]: Studio della natura delle sorgenti Formato di rappresentazione dei dati Proprietà associate ai fatti Identificazione delle misure e delle prospettive di analisi Identificazione di fatti e dimensioni Schema Entità-Relazione Grafo Dimensionale Modello MD Identificazione di fatti e misure  analisi dei requisiti (valutazione degli osservatori prezzi)

Progettato per immagazzinare voci di prezzo per differenti tipologie di prodotti: carburanti, alimenti, servizi

Gestione delle eterogeneità informazioni sul web diversi livelli di granularità Consideriamo ad esempio il sito prezzibenzina.it Ogni fonte presenta diversi livelli di granularità COMUNALE PROVINCIALE REGIONALE NAZIONALE

Misure aggregate Provincia 1,524 1,522 Comune 1 1,517 Comune 2 Roll up Misura aggregata AVG 1,522 Comune 1 1,517 Comune 2 Roll up 1,521 Comune 3 Data warehouse -> permette di visualizzare la misura a diversi livelli di dettaglio Drill down: aumenta il livello di dettaglio Roll up: aggrega secondo una funzione di aggregazione In una situazione di questo tipo idealmente avendo a disposizione tutti i rilevamenti comunali sarebbe possibile derivare le aggregazioni ai livelli superiori. Ma se il sito mette già a disposizione delle misure pre-aggregate allora il sistema deve riuscire a gestire la disponibilità di tali dati evitando di dover necessariamente avere a disposizione tutti i dati comunali per ricavare il valore nazionale. 1,536 Comune 4

Misure aggregate 1,520 Provincia 1,524 Provincia 1,522 Comune 1 GIA’ DISPONIBILE 1,524 Provincia AVG 1,522 Comune 1 1,517 Comune 2 1,521 Comune 3 L’aggregazione tramite roll up chiaramente dipende dai dati registrati nel data base, se ad esempio supponiamo che manchi il rilevamento in riferimento al comune 4 Gestire contemporaneamente dati aggregati tramite operazioni di rollup e dati preaggregati estratti dalla sorgenti (se la sorgente li mette a disposizione) NON PRESENTE NEL DATA WAREHOUSE - Comune 4

Possibili soluzioni Prevedere un modulo che pre-calcoli ogni livello di aggregazione navigabile Personalizzare il server OLAP Viste materializzate Intervenire a livello logico (query MDX) Intervenire a livello logico  approccio più elegante Salvare gli aggregati direttamente nel database per poi evitare di dover gestire le aggregazioni durante la navigazione della tabella olap  soluzione potenzialmente efficace ma di difficile sviluppo (investimenti in termini di tempo e collaudo) Il software va a pescare direttamente il dato senza andarlo a ricavare da aggregazioni online  così però si disabilita il fattore di aggregazione anche per dimensioni per cui l’aggregatore è fondamentale. Viste materializzate in cui visualizzare esclusivamente le informazioni di interesse (soluzioni rigida) Query MDX Parla della ricompilazione di mondrian: aggregazione nulla, in questo modo però si limita il fattore di aggregazione anche per dimensioni per le quali l’aggregazione è valida

Campo per esplicitare il livello di aggregazione in riferimento agli indici che identificano una misura prezzo aggregato

Soluzione DIMENSIONE AUSILIARIA FILTRAGGIO NUOVA MISURA IF Level IS [Nazionale] THEN IF Level IS [Regionale] THEN IF Level IS [Provinciale] THEN IF Level IS [Comunale] THEN Query MDX Aggiungere una dimensione ausiliaria per esplicitare il livello di aggregazione associato ai dati Applicare delle operazioni di filtraggio per raggruppare i dati secondo i livelli di aggregazione di riferimento Generare una nuova misura per imporre al sistema il caricamento dei giusti valori in riferimento al livello di aggregazione corrente Ciò naturalmente non toglie la possibilità di visualizzare anche i dati che si otterrebbero dalle operazioni di roll up

Implementazione Motore OLAP Mondrian-JPivot Query espresse in MDX CONFIGURAZIONE Query espresse in MDX Legge i dati da un RDBMS Presenta i risultati in forma multidimensionale Architettura orientata verso prodotti open-source Il mondrian XML schema ha consentito di applicare la soluzione esposta precedentemente per risolvere la problematica dei dati pre-aggregati Cube Table Dimension Hierarchy Level CalculatedMember Measures Collezione di misure e dimensioni Relazioni con le tabella del database fisico Gerarchie legate ad una dimensione Mondrian XML Schema

Sperimentazione Significatività Analisi sui dati disponibili Generare query di interesse Elaborare rappresentazioni grafiche Confrontare le misure visualizzate Stimare i tempi di calcolo Performance Significatività Significatività delle informazioni proposte

Analisi OLAP Come è possibile diramare la tabella OLAP per esaminare le misure a diversi livelli di dettaglio

Analisi OLAP AGIP Scostamento anomalo  pochi dati che producono una media alterata Tecnica di analisi della qualità 16 Luglio 2008

Conclusioni PROTOTIPO Riuso delle informazioni acquisite dal web Adattabilità a diverse tipologie di prodotti (Alimenti, Carburanti, Servizi, etc.) Analisi ad alto valore aggiunto PROTOTIPO Flessibile Adattabilità delle sorgenti Elasticità di analisi Robusto Nessun malfunzionamento rilevato Efficiente Rapidità Puntualità Il prototipo realizzato

Sviluppi Futuri Nuovi flussi informativi Supporto agli utenti nella costruzioni di analisi Nuovi servizi di analisi avanzata Data quality Data mining