Basi di dati distribuite Prof. M.T. PAZIENZA a.a. 2003-2004.

Slides:



Advertisements
Presentazioni simili
Modulo 5 DataBase ACCESS.
Advertisements

Il sistema italiano della qualità della tensione sulle
DBMS (DataBase Management System)
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità B1 Introduzione alle basi di dati.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità C1 Il linguaggio SQL.
Introduzione alla tecnologia OLAP: Microsoft SQL Analisys Services
Introduzione al datawarehouse
Una Introduzione alle Basi di Dati
Data Bases Distribuiti Finalità Caratteristiche Struttura Mario Capurso
Introduzione ai sistemi di basi di dati
Esercizio zSi vuole realizzare un data warehouse per una azienda che vende mobili allingrosso. zIl data warehouse deve permettere di analizzare i ricavi.
Obiettivo della tesi Percorso
Data warehousing con SQL Server
Biglietti: schema E/R.
1 Biglietti: schema E/R. 2 Biglietti: albero degli attributi.
4 – Progettazione – Introduzione e Modello E-R
Basi di Dati prof. A. Longheu 4 – Progettazione – Introduzione e Modello E-R Cap. 5 Basi di dati Atzeni – Ceri – Paraboschi - Torlone.
Realizzazione del file system
Archivio Cé necessità di immagazzinare in modo permanente grandi quantità di dati. Esempio: anagrafe dei cittadini di un comune.
Gestione dei dati e della conoscenza (agenti intelligenti) M.T. PAZIENZA a.a
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
L’uso dei database in azienda
ON LINE ANALYTICAL TRANSACTION PROCESSING (OLAP)
Tipo Documento: unità didattica 1 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
IL PATRIMONIO DI DATI - LE BASI DI DATI. Il patrimonio dei dati Il valore del patrimonio di dati: –Capacità di rispondere alle esigenze informative di.
D2I Integrazione, Warehousing e Mining di sorgenti eterogenee Tema 2: Progettazione e interrogazione di Data Warehouse Unita' coinvolte nel tema Università
Basi di dati. Vantaggi degli archivi digitali Risparmio di spazio: sono facilmente trasferibili e duplicabili Risparmio di tempo: si può accedere ai dati.
Ms. Access: corso pratico di utilizzo dello strumento
Access: Query semplici
Basi di dati Università Degli Studi Parthenope di Napoli
SQL: Lezione 7 Nataliya Rassadko
Cenni sulla Business Intelligence
Modello Relazionale Definisce tipi attraverso il costruttore relazione, che organizza i dati secondo record a struttura fissa, rappresentabili attraverso.
Daniel Stoilov Tesi di Laurea
DBMS ( Database Management System)
Progetto Di Uninfrastruttura Che Permetta La Modifica Di Dati Condivisi Distribuiti Su Più Nodi Reti di calcolatori L-S Gozzi Daniele
Introduzione alla modellazione di sistemi interattivi
INFORMATICA MATTEO CRISTANI. INDICE CICLO DELLE LEZIONI LEZ. 1 INTRODUZIONE AL CORSO LEZ. 2 I CALCOLATORI ELETTRONICI LEZ. 3 ELEMENTI DI TEORIA DELL INFORMAZIONE.
ACCESS Introduzione Una delle necessità più importanti in informatica è la gestione di grandi quantità di dati. I dati possono essere memorizzati.
MODELLO LOGICO DEI DATI
Dottorato di ricerca Nuove Tecnologie e Informazione Territorio – Ambiente Nozioni fondamentali di Basi di Dati Seminario interno.
Introduzione a Oracle 9i
1 w w w. g a t 4. c o m WI GAT WebIngelligence rappresenta una piattaforma funzionale e tecnologica per la creazione e gestione di un datawarehouse che.
EIPASS MODULO 5 Access 2007.
Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Programma del Corso.
ITCG “V. De Franchis” - PON FSE Modulo G/1 l’informatica”
Modulo 5 DataBase ACCESS. Informazioni e Dati INFORMAZIONI vengono scambiate con linguaggio scritto o parlato DATI rappresentazione di informazioni in.
I DATABASE.
Cloud SIA V anno. Introduzione ai Data Warehouse.
Progettazione Logica Il prodotto della progettazione logica è uno schema logico che rappresenta le informazioni contenute nello schema E-R in modo corretto.
Dati e DBMS DBMS relazionali SQL Progettazione di un DBMS Normalizzazione Programma del Corso di Basi di Dati.
Tema 2: progettazione e interrogazione di data warehouse
Progettazione di dati e applicazioni per il Web S. Ceri, P. Fraternali, A. Bongio, M. Brambilla, S. Comai, M. Matera Copyright © The McGraw-Hill.
Roma, 17 novembre 2003 Paolo Soriani 1 Paolo Soriani L’introduzione del controllo di gestione nelle amministrazioni I sistemi informativi Programmazione.
Sistemi di elaborazione dell’informazione Modulo 3 - Protocolli applicativi Unità didattica 1 - Domain Name System Ernesto Damiani Lezione 2 – Caratteristiche.
Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Normalizzazione Programma del Corso.
Progettazione Logica Il prodotto della progettazione logica è uno schema logico che rappresenta le informazioni contenute nello schema E-R in modo corretto.
Sistemi basati su conoscenza (agenti intelligenti) Prof. M.T. PAZIENZA a.a
Informatica Introduzione alle basi di dati Lezione 1 Scienze e tecniche psicologiche dello sviluppo e dell'educazione, laurea magistrale Anno accademico:
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Business Intelligence
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Le basi di dati.
Normalizzazione. Introduzione Nell’organizzazione tradizionale degli archivi, si verificano alcuni problemi, quali: Ridondanza dei dati (gli stessi dati.
Elementi di statistica con R e i database LEZIONE 2 Rocco De Marco rocco.demarco(a)an.ismar.cnr.it Ancona, 12 Aprile 2012.
SQLite. Introduzione a SQLite Oltre alla possibilità di memorizzare informazioni persistenti attraverso Preferences e files, Android mette a disposizione.
I DONEITÀ DI C ONOSCENZE E C OMPETENZE I NFORMATICHE ( A – D ) Un database è un insieme di record (registrazioni) e di file (archivi) organizzati per uno.
Laurea Magistrale in Informatica Architetture basi di dati A.A Docente: Prof. Carlo Batini Proprieta’ e caratteristiche strutturali dei sistemi.
Data warehouse(B.2.8) Nei database ci sono molti dati di tipo diverso e ciascuna tipologia di dato può avere un formato diverso. Alcuni provengono da legacy.
DDBMS Distributed database system. DDB Una base di dati distribuita è una collezione di dati che appartengono logicamente allo stesso sistema informativo.
Transcript della presentazione:

Basi di dati distribuite Prof. M.T. PAZIENZA a.a

DATA WAREHOUSING

Data Warehousing Il Data Warehousing è costituito dalla copia di una collezione di dati: che viene localizzata in un sito su cui si opera lasciando inalterata la collezione originale dei dati.

Data Warehousing Il Data Warehousing può essere considerato come una istanza speciale di duplicazione asincrona dei dati in cui la copia viene aggiornata non frequentemente i dati originali possono essere gestiti da un DBMS diverso su un sistema operativo diverso i dati originali appartengono in genere a proprietari diversi

Data Warehousing Il problema fondamentale del Data Warehousing è quello connesso al mantenimento della coerenza e correttezza delle informazioni nella warehouse (tabelle o viste duplicate) al variare delle informazioni di partenza.

DSS - Decision Support Systems Applicazioni che analizzano dati storici ed attuali per identificare trends, creare sommari, a fronte di un’analisi complessa dei dati provenienti anche da collezioni diverse di dati o da loro viste

OLAP - Online Analytic Processing OLAP si applicano a DBMS relazionali per gestire classi di query ad hoc (complesse) che: involvono operatori di aggregazione e group-by gestiscono agevolmente operazioni booleane anche complesse offrono funzioni di tipo statistico permettono di realizzare analisi temporali si applicano a dati multidimensionali

Data Warehouse I sistemi di Data Warehousing contengono dati ormai stabilizzati provenienti da molte sorgenti, arricchiti da informazioni di sintesi e relative a lunghi periodi di tempo. Hanno dimensioni di gran lunga maggiori delle normali basi di dati. I tempi di risposta sono ridotte grazie alla ottimizzazione dei processi di elaborazione.

Data Warehouse I DDBMS a base di sistemi di Data Warehousing, gestendo dati provenienti da molte sorgenti di tipo diverso, e dovendo offrire informazioni in tempi rapidi ed in maniera affidabile, memorizzano tabelle (metadati) in più di un sito e gestiscono schemi complessi.

Data Warehouse Problemi: Possibili inconsistenze semantiche tra i diversi db (diverse unità di misura, diversi nomi per attributi uguali, differenze nella normalizzazione e strutturazione delle tabelle) in fase di creazione e di aggiornamento nel tempo Schema complesso e di grandi dimensioni difficile da gestire e mantenere consistente con le modifiche nelle sorgenti esterne

Data Warehouse In fase di creazione ed aggiornamento i dati sono: Estratti dai db e da altre sorgenti Filtrati per minimizzare gli errori ed aggiungere informazioni, ove richiesto dallo schema ddb Trasformati per superare eventuali inconsistenze semantiche Memorizzati all’interno di viste specifiche (che sono diverse da quelle da cui provengono i dati)

Data Warehouse Ulteriori operazioni iniziali per migliorare la velocità e l’efficienza del sistema: Partizionamento Indicizzazione Eliminazione periodica di dati obsoleti Definizione di viste (anche alternative) …..

Data Warehouse Ulteriori operazioni iniziali: Sorting Generazione di sommari Produzione di dati aggregati Analisi statistiche ….

Data Warehouse Il valore di un sistema di data warehousing risiede nella varietà e ricchezza delle analisi articolate che permette di realizzare su dati disparati Supporto per i sistemi decisionali

Data Warehouse ed OLAP Necessari diverse insiemi di aggregazioni di query (viste) per rispondere velocemente a domande su collezioni molto grandi (più terabyte) di dati in tempi rapidissimi Le viste vengono pre-elaborate e si memorizzano i risultati: quando il DW viene interrogato, la query viene eseguita direttamente sui risultati precalcolti (view materialization)

View materialization Quali viste materializzare e quali indici devono essere definiti a supporto di tali materializzazioni? Dipende dal carico atteso o dalla rilevanza delle query attese. Necessità di mantenere aggiornate e consistenti (refresh) le viste materializzate (cosa aggiornare, quando aggiornare) Costi del refresh

View materialization Politica di aggiornamento delle viste: immediata / differita Costi e prestazioni diverse

Data Warehouse ed OLAP Esempi di funzioni aggregate (oltre le standard SUM, AVG)che operano su liste di valori: RANK: restituisce la posizione di una riga all’interno di una partizione che può avere righe multiple con lo stesso rank DENSE-RANK: genera rank senza gap tra righe PERCENT-RANK: fornisce la misura di di una posizione relativa di una riga all’interno di una partizione

Data Warehouse E’ una collezione di Tabelle (dati) duplicate asincronamente Viste sincronizzate asincronamente Caratterizzata da Una dimensione di dati considerevole Un elevato numero di tabelle coinvolte Una connessione logica con bdd indipendenti