D2I: Integrazione, warehousing e mining di sorgenti eterogenee di dati Tema2: Progettazione e interrogazione di data warehouse Unità: Bologna, Cosenza.

Slides:



Advertisements
Presentazioni simili
Teoria e Tecniche del Riconoscimento
Advertisements

Introduzione al datawarehouse
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
Very Small Databases (VSDB) C. Bolchini F. A. Schreiber L. Tanca Politecnico di Milano.
1 Esempi di consistenza sui limiti Non consistente sui limiti, considera Z=2, poi X-3Y=10 Ma il dominio qui sotto e consistente sui limiti: Confrontare.
La conservazione del passato attraverso il progresso tecnologico Tesi di Vittoria VulloA.A. 2010/2011 Comunicazione Innovazione Multimedialità
Tema 1: Integrazione di dati provenienti da sorgenti eterogenee
D2I - Tema 3 Analysis and comparison of methods and algorithms for data mining.
Rassegna sui metodi per query rewriting e il query answering using views.
D2I - Tema 3: Data Mining Stato di avanzamento Roma 11/10/2002.
Tema 2 - Unità di Bologna l Stefano Rizzi l Dario Maio l Matteo Golfarelli l Ettore Saltarelli.
D2I Integrazione, Warehousing e Mining di sorgenti eterogenee Tema 2: Progettazione e interrogazione di Data Warehouse Unita' coinvolte nel tema Università
BRISCOLA GO ON AVANTI. Storia I giochi di carte hanno le origini più disparate e vengono collocati in differenti epoche, la Briscola risale al La.
Clustering Mercoledì, 24 novembre 2004 Giuseppe Manco Readings: Chapter 8, Han and Kamber Chapter 14, Hastie, Tibshirani and Friedman Density-Based Clustering.
1 Sede, 11 luglio 2007 Emanuele Baldacci, Chief Economist Mercati globali: mind the gap!
11 1 Roma, 11 dicembre 2006 Laura Gasparini Garanzia su Portafogli Estero.
HERES OUR SCHOOL.. 32 years ago this huge palace was built and it was just the beginning; It is becoming larger and larger as a lot of students choose.
UNIVERSITA’ POLITECNICA DELLE MARCHE
La festa dei lavoratori è una festività celebrata il 1° maggio di ogni anno che intende ricordare limpegno sindacale ed i traguardi raggiunti in campo.
Distribuzione del numero di alleli condivisi da coppie di fratelli e di non-parenti tipizzati rispettivamente per 5, 9 e 13 markers.
Federazione Nazionale Commercio Macchine Cantiermacchine Cogena Intemac Unicea Unimot ASSOCIAZIONE ITALIANA PER LA PROMOZIONE DELLA COGENERAZIONE.
Present Perfect.
Modulo 5 Modulo 5 Inizia Basi di dati Basi di dati Access Access Esci.
Gruppo 2 17 marzo 2006 Sistemi informativi per le decisioni Mining the stock market: which measure is best? M.Gavrilov D.Anguelov P.Indyk R.Motwani.
Se non ci fossi tu … Cosa farei?.
D2I Modena, 27 Aprile 2001 Progettazione e interrogazione di Data Warehouse (Tema 2) Unità Responsabile: Cosenza Unità Coinvolte: Cosenza - Bologna.
Giovanni Biondi ICT e trasformazione della Scuola.
EMINEM CINDERELLA MEN Cinderella man Send the fellow Shady dang came to wrap the game up in cellophane, Raise hell from hell he came, But didn't come.
PINK FLOYD DOGS You gotta be crazy, you gotta have a real need. You gotta sleep on your toes. And when you're on the street. You gotta be able to pick.
4/20/20151 Metodi formali dello sviluppo software a.a.2013/2014 Prof. Anna Labella.
Tema 2: progettazione e interrogazione di data warehouse
SOTTOSISTEMA DI MEMORIA
G. Martellotti Roma RRB 16 Aprile Presentazione M&O cat A (per LHCb i M&O cat B sono gestiti autonomamente e non sono scrutinati fino al 2005/2006)
From wood the energy of the Sun. Dal legno l’energia del Sole Il legno fa parte delle biomasse ed è una delle fonti energetiche rinnovabili più utilizzata,
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Data Wharehousing OLAP Data Mining S. Costantini Università degli Studi di L’Aquila
ANNUNCIO DI SEMINARIO Il giorno Venerdi' 21 Maggio 2004 alle ore 11:30 presso l'Aula C3.4 della Facolta' di Scienze Matematiche Fisiche e Naturali dell'Universita'
Riunione conclusiva della prima fase del progetto Dipartimento di Scienze dell’Ingegneria dell’Università di Modena e Reggio Emilia.
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
Mobilità tra i Paesi del Programma KA103 A.A. 2014/2015 (KA103) Mobility Tool+ e il Rapporto Finale Claudia Peritore Roma luglio 2015.
From this year, by kind permission of Taeco S.r.l., the Working Retrievers Club Italia has the pleasure to award the prize “Big Hunter Project”. This.
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
SUMMARY High efficiency motors RIEPILOGO Motori ad alta efficienza RIEPILOGO Motori ad alta efficienza.
HANS2 Il data warehouse di HANS L’applicazione WebGIS Parleremo di …
SUMMARY Thyristors RIEPILOGO I thyristor RIEPILOGO I thyristor.
SUMMARY Different classes and distortions RIEPILOGO Le diverse classi e le distorsioni RIEPILOGO Le diverse classi e le distorsioni.
CRISI STRAORDINARIA E LEADER STRAORDINARI 25 MAGGIO 2015 Tommaso Raimondi - Presentazione 25/5/2015.
SUMMARY Real operational amplifiers RIEPILOGO Amplificatori operazionali reali RIEPILOGO Amplificatori operazionali reali.
NOTE: To change the image on this slide, select the picture and delete it. Then click the Pictures icon in the placeholder to insert your own image. ITALIAN.
Progetti 2015/2016. Proj1: Traduzione di regole snort in regole iptables Snort: – analizza i pacchetti che transitano in rete, confrontandoli con un database.
Che ora è? Che ore sono? Telling time. Fate Adesso: If you were to stop someone on the street to ask the time how would you get their attention? If you.
Buon giorno, ragazzi oggi è il quattro aprile duemilasedici.
Scheda per la rilevazione delle condizioni climatiche. abbiamo concordato di effettuare la rilevazione in una settimana concordata, alla medesima ora:
This information is confidential and was prepared by Bain & Company solely for the use of our client; it is not to be relied on by any 3rd party without.
PROGETTO COMENIUS Partenariato Scolastico Multilaterale Anno 2012/2013 CIRCOLO DIDATTICO S.G. BOSCO- BIANCAVILLA- CT.
Titolo evento Luogo, data Seminario INSPIRE Bologna, luglio 2012 Profili, strumenti ed implementazioni dei metadati Antonio Rotundo Agenzia per l’Italia.
#sqlsatPordenone #sqlsat495 February 27, 2016 SQL Server 2016 Query Store: un nuovo modo di monitorare le query Saverio Lorenzini PFE Principal Engineer.
ORGANISATION OF THE EDUCATION SYSTEM IN ITALY 2010/2011.
Lina, Paolo, Tonino, Riccardo.   An assessment of the need for a photo-production facility and its design  The neutron part should not exceed 20 pages.
#sqlsatParma #sqlsat462 November 28°, 2015 SQL Server 2016 Query Store: un nuovo modo di ottimizzare le query Saverio Lorenzini PFE Principal Engineer.
Fondamenti di Motorizzazione Ibrida P.Capaldi1 Fondamenti di Motorizzazione Ibrida Pietro Capaldi Istituto Motori C.N.R.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
2013 ACC/AHA Guidelines Treatment of Blood Cholesterol to Reduce Atherosclerotic Cardiovascular Risk in Adults.
Architetture della Informazione Anno accademico C. Batini 5
POSSIBLE ANSWERS The company is looking for a secretary/A secretarial position is vacant/A position as a secretary is vacant BBJ Co. Ltd advertised for.
Cyber Safety.
Human machine interaction
Adolf Luther Born 1912 in Krefeld, Germany. Died 1990 Krefeld.
Il condizionale.
Transcript della presentazione:

D2I: Integrazione, warehousing e mining di sorgenti eterogenee di dati Tema2: Progettazione e interrogazione di data warehouse Unità: Bologna, Cosenza

Obiettivi Progettazione e interrogazione efficiente di DW, con particolare riferimento al livello dei dati derivati, sia dal punto di vista logico che fisico tecniche efficaci per la materializzazione di viste, indici per l'accesso veloce ai dati, riscrittura di interrogazioni su viste materializzate, definizione di tecniche di ottimizzazione, basate sulla struttura delle interrogazioni.

Risultati Fase 1 Survey su “Architetture DW “(rapp. D2.R1 BO-CS) Survey su “Principali aspetti riguardanti la progettazione logica e fisica di DW” (D2.R2 - BO) Survey su “Ottimizzazione di interrogazioni e identificazioni di classi trattabili” (D2.R3 - CS)

Obiettivi Fase 2 Progettazione logica di DW: materializzazione di viste sulla base del carico, tecniche di frammentazione di viste materializzate, stima dimensioni viste, scelta degli indici (euristiche) Interrogazione di DW: tecniche innovative di interrogazione basate sull’uso di viste materializzate (casi trattabili),

Risultati Fase 2 Definizione di tecniche per scelta ottimale di indici in sistemi di data warehouse (BO) interrogazione efficiente di data warehouse: casi trattabili di query rewriting and query containment (CS)

Risultati Fase 2 Query rewriting: Tecniche per dedurre anche informazione negativa (oltre a quella positiva) Query containment and Hypertree decomposition: Acyclic queries

Risultati Fase 2 Deduzione di Informazione negativa Viste e interrogazioni contenenti negazione V1: assigned(E,P,D) :- works(E,P), project(P,D) Q1: assign(E,P) :- emp(E), proj(P), not works(E,P) V2: not_assigned(E,P) :- emp(E), proj(P), not works(E,P) Q2: ? Emp(E), proj(P), works(E,P) Risultati su c lassi trattabili e complete

Complexity of CQs NP -complete in the general case (Chandra and Merlin ’77) NP -hard even for fixed database Polynomial if Q has an acyclic hypergraph (Yannakakis ’81) LOGCFL - complete (in NC 2 ) (G.L.S. ’98) Interest in larger tractable classes of CQS

Is this query hard? nsize of the database m number of atoms in the query Classical methods worst-case complexity: O(n m ) m = 11 ! Despite its apparence, this query is nearly acyclic It can be evaluated in O(m·n 2 · logn)

Decomposition Methods Hypertree Decomposition Hinge Decomposition + Tree Clustering Cycle Hypercutset Tree Clustering w*  treewidth Cycle Cutset Hinge Decomposition Biconnected Components

Work in progress Answering queries and hypertree decompositions: A query-planner based on hypertree decompositions Choosing the best query plan (i.e., the best decomposition) exploiting data on tables, attibute selectivity, indices, etc. Further possible applications: Answering queries using views

Rapporti Tecnici D2.R4: Tecniche di progettazione logica e di interrogazione efficiente di data warehouse (CS,BO) D2.R5: Scelta ottimale di indici in sistemi di data warehouse (BO)

Obiettivi Fase 1 Stato dell’arte su: progettazione logica e fisica di DW interrogazione efficiente di DW (query containment, query rewriting, ecc.)