La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.

Presentazioni simili


Presentazione sul tema: "Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia."— Transcript della presentazione:

1 Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia

2

3

4 Tema 1: Integrazione di dati provenienti da sorgenti eterogenee Fase 1 Scadenza: 30 aprile 2001

5 Obiettivi della Fase 1 Effettuare lo studio e l'analisi dei nuovi requisiti che emergono sulla integrazione di dati quando si considerano sorgenti fortemente eterogenee. Studiare i requisiti per nuovi metodi di rappresentazione dei dati, tenendo conto della presenza di sorgenti semistrutturate. Analizzare i requisiti per la scoperta e la rappresentazione di proprietà intra e inter-schema delle sorgenti, sia intensionali che estensionali. Indagare i metodi per definire e specificare parametri di qualità delle sorgenti e i metodi per la riconciliazione di dati provenienti da sorgenti eterogenee.

6 Analizzare il ruolo dei meta-dati e delle ontologie in un contesto in cui si integrano sorgenti strutturate e semi- strutturate. Analizzare i metodi esistenti per il problema del query rewriting e del query answering using views. Studiare l'impatto che la presenza di diverse versioni dello schema di una sorgente può avere sul processo di integrazione. - definizione preliminare della struttura del meta- data repository per descrivere le diverse tipologie di sorgenti e di relazioni intra ed inter-schema. Obiettivi della Fase 1

7 Prodotti della Fase 1

8 Fase 2 Scadenza: 30 novembre 2001

9 Fase dedicata alla produzione dei risultati scientifici, cioe' dei metodi e delle tecniche per i vari temi del progetto. In questa fase verra' definita precisamente: la struttura del repository di meta-dati, l'insieme dei servizi che il repository dovra' offrire. Questa attivita' verra' condotta congiuntamente da tutte le unita'. OBIETTIVI COMUNI

10 TEMA 1: INTEGRAZIONE DI DATI PROVENIENTI DA SORGENTI ETEROGENEE L'obiettivo è la produzione di risultati scientifici che definiscano un quadro metodologico per l'integrazione di dati provenienti da sorgenti fortemente eterogenee. Si definirà una metodologia per la costruzione di viste riconciliate di dati semi-strutturati basata su tecniche intelligenti di tipo semi-automatico e su conoscenza di ontologie di dominio. La metodologia prevede tecniche e passi specifici per la rappresentazione ed il trattamento di sorgenti semistrutturate I risultati forniti includeranno la specifica architetturale di un prototipo che implementa la metodologia sviluppata.

11 Si definiranno metodi e tecniche per il trattamento di interrogazioni sulla vista integrata. Si definiranno algoritmi per la riscrittura di interrogazioni rispetto a viste (query rewriting e query answering using views). Si produrranno le specifiche funzionali di un "Query Manager" che supporti interrogazioni globali rispetto ad una vista virtuale integrata delle sorgenti. La struttura del meta-data repository definita nella fase 1 verra` arricchita dalle tipologie di meta-dati e meta-relazioni individuate in questa fase, con riferimento alle interrogazioni globali e al loro mapping in interrogazioni locali alle sorgenti TEMA 1: INTEGRAZIONE DI DATI PROVENIENTI DA SORGENTI ETEROGENEE

12 Verra' affronteto il problema della progettazione logica di data warehouse. Verrà studiato il problema della materializzazione di viste sulla base di un carico di lavoro complesso. Verrà analizzata l'utilità della frammentazione orizzontale e verticale delle viste materializzate, sulla base del carico di lavoro e dei vincoli di spazio. Verranno messi a punto metodi per la stima delle dimensioni delle viste candidate alla materializzazione tenendo conto dei vincoli di cardinalità. TEMA 2: PROGETTAZIONE E INTERROGAZIONE DI DATA WAREHOUSE

13 Si affronterà il problema della progettazione fisica con i modelli di costo messi a punto durante la prima fase. Il problema della scelta ottimale degli indici verrà affrontato: 1) delineando un insieme di criteri "di buon senso" 2) definendo algoritmi di tipo euristico dall'altro. Si svilupperanno tecniche di interrogazione in ambiente data warehouse attraverso l'estensione di tecniche preesistenti. Si sfrutteranno le proprietà strutturali delle interrogazioni e delle viste materializzate per ottenere un'esecuzione ottimizzata. Si sfrutteranno la proprietà di aciclicità strutturale della query riscritta per guidare il "query rewriting", rendendo in tal modo efficiente la successiva verifica di "query containment". Le scelte effettuate saranno memorizzate nel Meta-Data Repository TEMA 2: PROGETTAZIONE E INTERROGAZIONE DI DATA WAREHOUSE

14 Iniziera` la produzione dei risultati, sotto forma di trattazione teorica dei problemi evidenziati nella prima fase. Si studieranno metodi di clustering che risolvano i problemi derivanti dall'aggiornamento incrementale dei dati, e si indagheranno soluzioni basate sul concetto di similarita` di valori. Si definira` un paradigma di ricerca approssimata in grado di permettere all'utente di controllare la qualita` del risultato, anche in presenza di ricerche complesse. Verranno individuati dei sottocasi trattabili delle varianti di metaquerying individuate durante la prima fase e verranno progettati degli algoritmi efficenti per la loro implementazione. TEMA 3: DATA MINING

15 Verra` definita l'architettura di un sistema di data mining "user-centered", che dia la possibilita` di integrare sistemi diversi in un ambiente integrato ed orientato all'utente. L'architettura del sistema comprendera`: 1) componenti per la visualizzazione dell'informazione; 2) componenti per il "knowledge discovery"; 3) componenti per la gestione dei dati. Verranno studiati dal punto di vista teorico alcuni dei problemi centrali legati alla visualizzazione. Si definira' anche la modalita' di utilizzazione del repository di meta-dati al fine di guidare il processo di data mining. TEMA 3: DATA MINING

16 PRODOTTI DELLA FASE 2

17


Scaricare ppt "Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia."

Presentazioni simili


Annunci Google