Data Wharehousing OLAP Data Mining S. Costantini Università degli Studi di L’Aquila

Slides:



Advertisements
Presentazioni simili
Italiano Da quando siamo passati al corso di metallurgia (3^o ) abbiamo cominciato a lavorare utilizzando i maniera didattica tecnologie di tipo hardware.
Advertisements

Lo sviluppo delle PMI tra Innovazione e Competenze. Il progetto MASTER Valentina Castello.
Sistemi per lelaborazione dellinformazione Maria Teresa Pazienza DISP - Dipartimento di Informatica, Sistemi e Produzione aa
Basi farmacologiche della terapia dell’ipertensione
Queuing or Waiting Line Models
1 Sede, 11 luglio 2007 Emanuele Baldacci, Chief Economist Mercati globali: mind the gap!
11 1 Roma, 11 dicembre 2006 Laura Gasparini Garanzia su Portafogli Estero.
Il Passato Prossimo The Past Perfect Tense.
Consumerconsumatore Smoothregolare, scorrevole, facile, ben congegnato Operationfunzionamento, gestione, conduzione European single market mercato unico.
Come nella stampa tradizionale, un giornale online può essere di informazione informazione o un periodico dedicato a una disciplina specifica.
Distribuzione del numero di alleli condivisi da coppie di fratelli e di non-parenti tipizzati rispettivamente per 5, 9 e 13 markers.
Frequency Domain Processing
Il Futuro The Future Tense.
D2I Modena, 27 Aprile 2001 Progettazione e interrogazione di Data Warehouse (Tema 2) Unità Responsabile: Cosenza Unità Coinvolte: Cosenza - Bologna.
Metodi Quantitativi per Economia, Finanza e Management Lezione n°2 Fonti Dati, le ricerche di mercato. Set-up di un questionario e costruzione di una Customer.
I giorni della settimana
Metodi Quantitativi per Economia, Finanza e Management Lezioni n° 7-8.
Taccani1 7.4 Identification ANALISI DEI PERICOLI Hazard Analysis Identificazione Valutazione Misure di Controllo Control Measures Assessment.
Capitolo 14 Il presente del congiuntivo (the present subjunctive)
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle.
Siete i proprietari di una squadra di corse NASCAR. E’ l’ultima gara di un’ottima stagione e sarà trasmessa in Mondovisione vecchio sponsor (comunque.
Un problema multi impianto Un’azienda dispone di due fabbriche A e B. Ciascuna fabbrica produce due prodotti: standard e deluxe Ogni fabbrica, A e B, gestisce.
D2I: Integrazione, warehousing e mining di sorgenti eterogenee di dati Tema2: Progettazione e interrogazione di data warehouse Unità: Bologna, Cosenza.
Corso di Statistica e Gestione delle Imprese Insegnamento: MARKETING Docente: Roberto Grandinetti Università di Padova Cap. 2 - Dal marketing di massa.
Accoppiamento scalare
Metodi Quantitativi per Economia, Finanza e Management Lezione n°1.
11 novembre 2010Parametri Acustici (ISO 3382) 1 Misura della risposta all’impulso Parametri Acustici temporali e spaziali.
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
Viruses.
THE LIGHT How does the light propagate?. 1)To verify that light propagates in straight lines 2)To compare an object with its projection on a rigid screen.
SUMMARY Quadripoles and equivalent circuits RIEPILOGO Quadripoli e circuiti equivalenti RIEPILOGO Quadripoli e circuiti equivalenti.
Secondo Circolo di Carmagnola I FRONTESPIZI DEGLI INVITI ALLE SERATE COMENIUS Invitations to the Comenius Evenings 9 febbraio febbraio giugno.
La gestione snella dei progetti Social Perché il lato pesante non può vincere sulla forza agile Ernesto Amato Project Manager & Agile Evangelist.
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
SUMMARY High efficiency motors RIEPILOGO Motori ad alta efficienza RIEPILOGO Motori ad alta efficienza.
SUMMARY Transmission and distribution of the electric energy RIEPILOGO Trasmissione e distribuzione dell’energia elettrica RIEPILOGO Trasmissione e distribuzione.
D2b Antonio Lioy Marco Vallini Politecnico di Torino Dip. Automatica e Informatica (Pisa, Giugno 2015)
SUMMARY Different classes and distortions RIEPILOGO Le diverse classi e le distorsioni RIEPILOGO Le diverse classi e le distorsioni.
SUMMARY Servo motors RIEPILOGO Servomotori RIEPILOGO Servomotori.
Alessandra De Cugis Progetto Tempi e Orari del Comune di Milano Time in the cities, a holistic approach for urban time issues, the case of Milan Paper.
Filtri del secondo ordine e diagrammi di Bode
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
A.A CORSO DI BIOINFORMATICA 2 per il CLM in BIOLOGIA EVOLUZIONISTICA Scuola di Scienze, Università di Padova Docenti: Prof. Giorgio Valle Prof.
Introduction The assets of a charity must be used to meet its statutory functions and to generate prudential social investments that offer a stable return.
Simple Sentences in Italian
La governance europea. Governance without government J. N. Rosenau e E. O. Czempiel, Governance without government: order and change in world politics,
LE PREPOSIZIONI. Le Preposizioni semplici (Simple prepositions) A preposition describes a relationship between other words in a sentence. In itself, a.
MAGAZZINI AUTOMATICI AUTOMATIC STORAGE SYSTEM. TIPOLOGIE MAGAZZINI WAREHOUSE TYPES Magazzino tradizionale Traditional warehouse Cantilever Magazzino pile.
Bike in Italy Mattia giuliani 3D Majorana Cycling is one of the greatest inventions of mankind. Already Leonardo da Vinci studied the development.
Prof. Giacomo Dalseno USARE MOODLE Differenti forme di interazione.
Buon giorno, ragazzi oggi è il quattro aprile duemilasedici.
Subject Pronouns & Verbs. When do we use subject pronouns? Subject pronouns stand in for the subject. I, You, He/She, We, They. I went to the shops. You.
Titolo evento Luogo, data Seminario INSPIRE Bologna, luglio 2012 Profili, strumenti ed implementazioni dei metadati Antonio Rotundo Agenzia per l’Italia.
A.A CORSO INTEGRATO DI INFORMATICA E BIOINFORMATICA per il CLT in BIOLOGIA MOLECOLARE Scuola di Scienze, Università di Padova Docenti: Proff.
ORGANISATION OF THE EDUCATION SYSTEM IN ITALY 2010/2011.
Crescita I: Paolo Sospiro Università di Macerata Macerata 29 Settembre 2014 Economia dello Sviluppo Università di Macerata.
Lina, Paolo, Tonino, Riccardo.   An assessment of the need for a photo-production facility and its design  The neutron part should not exceed 20 pages.
SUMMARY Checking RIEPILOGO Verifiche RIEPILOGO Verifiche.
A Tiny Voice Inside Una piccola Voce interiore By Carole Smith Gaetano Lastilla.
1. ELASTICITA’ DELLA DOMANDA potere di mercato (FISSARE IL PREZZO) ≠ da potere contrattuale (TAKE OR LEAVE OFFER CAP 3 e 4) e da potere nell’impresa (CAPACITA’
Project IOLI Practical exemple in Italy and in Sicily Il presente progetto è finanziato con il sostegno della Commissione europea. L’autore è il solo responsabile.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
Ninux.org OpenCamp Traditional Network Infrastructure: commercial wireless access Big operators –GPRS  UMTS  HSDPA “small”
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
Dyslexia activity Group 2 (Debora Q.) Lesson Outline  This activity is targeted at beginners half way through their first year but it could also work.
Do You Want To Pass Actual Exam in 1 st Attempt?.
WRITING – EXERCISE TYPES
Dichiarazione dei servizi di sito nel GOCDB
Studente : Andrea Cassarà Classe: 5AII A.S. 2014/2015 Link Sito
A comparison between day and night cosmic muons flux
Transcript della presentazione:

Data Wharehousing OLAP Data Mining S. Costantini Università degli Studi di L’Aquila

S. Costantini / Data Wharehousing2 Ringraziamenti (Acknowledgment) Part of this material is taken from: Database Systems: The Complete Book, by Hector Garcia-Molina, Jeff Ullman, and Jennifer Widom, edited by Prentice-Hall.Hector Garcia-MolinaJeff UllmanJennifer Widom URL:

S. Costantini / Data Wharehousing3 Cos’è in sostanza un Data Wharehouse? E’ una vista materializzata Aggiornata a intervalli stabiliti (a seconda dell’applicazione) E’ un cosiddetto “sistema di integrazione di dati” perché può contenere dati provenienti da vari database (detti “sorgenti”)

S. Costantini / Data Wharehousing4 Perché i Data Warehouse? Perché le query di analisi statistica ed esame dei dati per estrarne varie informazioni (dette query “OLAP”, vedi seguito) sono pesanti e diminuiscono troppo la performance del sistema. Però non necessitano della versione più aggiornata dei dati.

S. Costantini / Data Wharehousing5 Perché i Data Wharehouse Allora conviene separare le query usuali dalle query OLAP, creando per queste ultime un Data Wharehouse Per le query OLAP il modello relazionale non è ottimale, quindi nel creare un Data Wharehouse il modello dei dati viene modificato.

S. Costantini / Data Wharehousing6 Observation Traditional database systems are tuned to many, small, simple queries. Some new applications use fewer, more time-consuming, complex queries. New architectures have been developed to handle complex “analytic” queries efficiently.

S. Costantini / Data Wharehousing7 The Data Warehouse The most common form of data integration. –Copy sources into a single DB (warehouse) and try to keep it up-to-date. –Usual method: periodic reconstruction of the warehouse, perhaps overnight. –Frequently essential for analytic queries.

S. Costantini / Data Wharehousing8 OLTP Most database operations involve On- Line Transaction Processing (OTLP). –Short, simple, frequent queries and/or modifications, each involving a small number of tuples. –Examples: Answering queries from a Web interface, sales at cash registers, selling airline tickets.

S. Costantini / Data Wharehousing9 OLAP Of increasing importance are On-Line Application Processing (OLAP) queries. –Few, but complex queries --- may run for hours. –Queries do not depend on having an absolutely up-to-date database.

S. Costantini / Data Wharehousing10 OLAP Examples 1.Amazon analyzes purchases by its customers to come up with an individual screen with products of likely interest to the customer. 2.Analysts at Wal-Mart look for items with increasing sales in some region.

S. Costantini / Data Wharehousing11 Data Warehouses Doing OLTP and OLAP in the same database system is often impractical –Different performance requirements –Analysis queries require data from many sources Solution: Build a “data warehouse” –Copy data from various OLTP systems –Optimize data organization, system tuning for OLAP –Transactions aren’t slowed by big analysis queries –Periodically refresh the data in the warehouse

S. Costantini / Data Wharehousing12 Common Architecture Relational Databases handle OLTP. Local databases copied to a central warehouse overnight. Analysts use the warehouse for OLAP.

S. Costantini / Data Wharehousing13 Definition of data warehousing A data warehouse is a subject-oriented, integrated, time-variant and non- volatile collection of data in support of management’s decision making process.

S. Costantini / Data Wharehousing14 Loading the Data Warehouse Source Systems Data Staging Area Data Warehouse (OLTP) Data is periodically extracted Data is cleansed and transformed Users query the data warehouse

S. Costantini / Data Wharehousing15 Data Mining Data mining is a popular term for queries that summarize big data sets in useful ways. Examples: 1.Clustering all Web pages by topic. 2.Finding characteristics of fraudulent credit-card use.

S. Costantini / Data Wharehousing16 Data Warehouse Customers Etc… VendorsEtc… Orders Data Warehouse Enterprise “Database” Transactions Copied, organized summarized Data Mining Data Miners: “Farmers” – they know “Explorers” - unpredictable

S. Costantini / Data Wharehousing17 Market-Basket Data An important form of mining from relational data involves market baskets = sets of “items” that are purchased together as a customer leaves a store. Summary of basket data is frequent itemsets = sets of items that often appear together in baskets.

S. Costantini / Data Wharehousing18 Data Mining Flavors Directed – Attempts to explain or categorize some particular target field such as income or response. Undirected – Attempts to find patterns or similarities among groups of records without the use of a particular target field or collection of predefined classes.

S. Costantini / Data Wharehousing19 Data Mining Examples in Enterprises Government –Track down criminals (Police also) –Treasury Dept – suspicious int’l funds transfer Phone companies Supermarkets & Superstores Mail-Order, On-Line Order

S. Costantini / Data Wharehousing20 Data Mining Examples in Enterprises Financial Institutions Insurance Companies Web sites Many others…