Introduzione al datawarehouse

Slides:



Advertisements
Presentazioni simili
Presentazione della tesi di laurea di Flavio Casadei Della Chiesa Newsletter: un framework per una redazione web.
Advertisements

© 2007 SEI-Società Editrice Internazionale, Apogeo Unità B1 Introduzione alle basi di dati.
Windows Server 2003 Active Directory Diagnostica, Troubleshooting e Ripristino PierGiorgio Malusardi IT Pro – Evangelist Microsoft.
Reporting Services - Introduzione
ISA Server 2004 Enterprise Edition Preview. ISA Server 2004.
ISA Server 2004 Configurazione di Accessi via VPN
Giorgio Quaranta ISV Account Manager
Visual Studio Tools For Office 2005 Fabio Santini. NET Senior Developer Evangelist Microsoft Italy.
Windows Server 2003 SP1 Security Configuration Wizard PierGiorgio Malusardi IT Pro Evangelist Microsoft.
Microsoft Office Business Scorecard Manager 2005 Franco Perduca Factory Software
Introduzione ad Active Directory
Consumare Web Service Andrea Saltarello
Introduzione alla tecnologia OLAP: Microsoft SQL Analisys Services
3/27/2017 2:27 AM ©2005 Microsoft Corporation. All rights reserved.
Introduzione alla realizzazione di Data Warehouse con Microsoft SQL Server
Training Microsoft Visio Marzo, 2006
Sharepoint Gabriele Castellani
| | Microsoft Certificate Lifecycle Manager.
Branch office update – SP2. Agenda Messa in esercizio degli uffici remoti Compressione HTTP Differentiated Services Cache di BITS.
Sql Server 2005 Integration Services - Sviluppo Franco Perduca Factory Software
Biglietti e Ritardi: schema E/R
Presentazione del Progetto
Data warehousing con SQL Server
Biglietti e Ritardi: schema E/R
Biglietti: schema E/R.
1 Biglietti: schema E/R. 2 Biglietti: albero degli attributi.
ON LINE ANALYTICAL TRANSACTION PROCESSING (OLAP)
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
A.A GESTIONE E ORGANIZZAZIONE PER LA COMUNICAZIONE DIMPRESA 19 marzo 2010 Modulo: Prof. Lucio Fumagalli (canale M-Z)
La Normalizzazione. 27 January, slide 2 Le nuove tecnologie Software Tabelle, unicità e chiavi Ciascuna riga di una tabella deve esere unica Ci.
Architettura Three Tier
SAS per il Customer Value
Gestione Commesse SOLUTIONS. Design goals Miglioramento dellinterfaccia Più flessibilità operativa Supporto delle raccomandazioni dellInternational Accounting.
Job improvements SOLUTIONS. Design goals Miglioramento dellinterfaccia Più flessibilità operativa Supporto delle raccomandazioni dellInternational Accounting.
Item Tracking in NAV 5.0 SOLUTIONS. Item Tracking Perchè cambiare Problemi delle release precedenti –Difficoltà di utilizzo –Non perfetta integrazione.
1 IsaPress. 2 Obiettivo Realizzare uno strumento di facile uso per estrarre il contenuto da documenti binari di vario tipo in un formato utile per l'impaginazione.
UNIVERSITÀ DEGLI STUDI DI MODENA E REGGIO EMILIA FACOLTÀ DI INGEGNERIA DI MODENA Corso di Laurea Specialistica in Ingegneria Informatica PROGETTO E REALIZZAZIONE.
Microsoft Dynamics CRM 4.0
Roberto DAngelo Business Productivity Technology Specialist Office System come Smart Client.
GeoSoft BLU short presentation 1. GeoSoft BLU short presentation 2 Il software BLU è un prodotto software di tipo CRM (Customer Relationship Management)
Partite insieme a noi per un viaggio nel mare dei numeri del Vostro Business liberi da ogni limite…
ACCESS Introduzione Una delle necessità più importanti in informatica è la gestione di grandi quantità di dati. I dati possono essere memorizzati.
B.I. Strategy ETL A SUPPORTO DELLA BUSINESS INTELLIGENCE
Software realizzato da LCL Srl – Brescia – Italy.
1 w w w. g a t 4. c o m WI GAT WebIngelligence rappresenta una piattaforma funzionale e tecnologica per la creazione e gestione di un datawarehouse che.
1 Ly-LAB Sistema di gestione dei dati analitici di laboratorio.
Sistemi di Elaborazione delle Informazioni Mod.I.
Microsoft Office System Introduzione a XML in Office 2003.
1 AUTOMATIZZAIAUTOMATIZZAIAUTOMATIZZAIAUTOMATIZZAI S.I. SISTEMASISTEMA INFORMATIVO INFORMATIVO PROCESSOPROCESSO DECISIONALE DECISIONALE DECISIONEDECISIONE.
Pippo.
1 Data warehousing con SQL Server SQL Server è un RDBMS (Relational DataBase Management System) Analysis Services è un componente di SQL Server che offre.
I DATABASE.
Cloud SIA V anno. Introduzione ai Data Warehouse.
La Conservazione Sostitutiva e la Soluzione Una-Doc.
Tipo Documento: unità didattica 4 Modulo 14 Compilatore: Antonella Bolzoni Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione.
1 Business Intelligence Franco Perduca Factory Software Analysis Service Introduzione.
Basi di dati distribuite Prof. M.T. PAZIENZA a.a
Certificati e VPN.
By: Powered by:. Tecnologia Microsoft La soluzione CCAnalyzer utilizza la tecnologia OLAP (On Line Analytical Processing) di Microsoft presente nel software.
Extension pack per IIS7 Piergiorgio Malusardi IT Pro Evangelist
4/18/ :18 AM.
Business Intelligence
ICT e Sistemi informativi Aziendali Materiale di supporto alla didattica.
Le linee guida del nostro progetto. La situazione attuale del gruppo.
Panoramica generale di "Questo è NAV" Benvenuti Controllo Margine Crescita Introduzione Customer Evidence Dimostrazione Introduzione Customer Evidence.
Le basi di dati.
Presenta – #wpc15it1 BI005 - Real Power BI Franco Perduca Factory Software srl
CDB – Customer Database Database Anagrafico delle Aziende V.JuricicTorino 01/02/2011.
I DONEITÀ DI C ONOSCENZE E C OMPETENZE I NFORMATICHE ( A – D ) Un database è un insieme di record (registrazioni) e di file (archivi) organizzati per uno.
Data warehouse(B.2.8) Nei database ci sono molti dati di tipo diverso e ciascuna tipologia di dato può avere un formato diverso. Alcuni provengono da legacy.
Transcript della presentazione:

Introduzione al datawarehouse Franco Perduca Factory Software francop@factorysw.com

Agenda Perchè mi serve il Data Warehouse ? Caratteristiche del Data Warehouse Caricamento e trasformazione dei dati

Perchè mi serve il Data Warehouse Dati = informazione non è sempre vero Sono organizzati per una elaborazione transazionale Non forniscono dati “attendibili” Rallentano il sistema Spesso devono essere integrati con sorgenti di diversa natura

Perchè mi serve il Data Warehouse La soluzione è creare un db ad-hoc per le analisi Lo scopo è di “concentrare” tutti i dati dell’ azienda in un unico punto Integra informazioni provenienti da sorgenti diverse I dati sono trasformati / “puliti” Il disegno e’ ottimizzato per la lettura Possiamo considerarlo come un db Read-Only

Perchè mi serve il Data Warehouse E’ un progetto molto difficoltoso : Capire e identificare gli obbiettivi della analisi Trovare le informazioni e i dati sorgenti Applicare eventuali trasformazioni / normalizzazioni per consolidare i dati Essere flessibili, riuscire a gestire cambiamenti e “modifiche nella storia”

Caratteristiche del Data Warehouse Magazzino di dati a livello di impresa Insieme di strumenti per convertire un vasto insieme di dati in informazioni utilizzabili dall’utente Obiettivi: Possibilità di accedere a tutti i dati dell’impresa, centralizzati in un solo database Coerenza e consolidamento dei dati Velocità nell’accesso alle informazioni Base di partenza per OLAP

Caratteristiche del DataWarehouse Passi per la creazione del Data Warehouse Identificare gli eventi da misurare Vendite Movimentazione di magazzino Customer satisfaction Ecc. Identificare le fonti dati I dati possono arrivare da fonti diverse ed eterogenee, non strutturate (Excel,file di testo,…) Consolidare i dati Trasformazioni per eliminare le differenze Es. Lira vs. Euro Definire processo di aggiornamento Intervallo di aggiornamento del DW

Caratteristiche del Data Warehouse Data Mart Poichè il processo per la creazione di un DW è spesso lungo e difficoltoso, è possibile creare dei processi intermedi “Mini” DW tematici per rispondere ad esigenze specifiche (es. vendite, marketing, controllo di gestione ecc.) L’insieme di tutti i Data Mart costituisce il DW

Caratteristiche del Data Warehouse Componenti di un modello Data Warehouse Tabella dei fatti Contiene gli elementi da misurare es. (vendite,movimenti e transazioni ecc.) Elemento centrale del DW Misure Sono i valori che vogliamo analizzare rappresentati dalle quantità es. (importi, quantità, numero di transazioni) Sono contenute nella tabella dei fatti

Caratteristiche del DataWarehouse Tabella delle dimensioni Descrive e rappresenta l’entità di business Fornisce un contesto alle misure È il “per” nelle analisi Es. (Venduto PER cliente,Venduto PER prodotto) Dimensione E’ il contenuto della tabella dimensione Spesso è gerarchica Es. (Categoria -> SottoCategoria -> Prodotto)

Caratteristiche del DataWarehouse Comune Prodotto Tempo Unità Fatturato Tabelle delle Dimensioni Comuni Prodotti Tabella dei Fatti Misure Fatti Dimensioni

Caratteristiche del Data Warehouse DEMO

Caratteristiche del Data Warehouse La struttura è riconducibile a 2 modelli : Star Schema (a stella) Snowflake Schema (fiocco di neve)

Caratteristiche del Data Warehouse Star Schema Lo Star Schema è la modellizzazione più semplice ed efficace dei componenti di un DW Ogni tabella dei fatti è associata a N tabelle dimensionali Le relazioni gerarchiche all’interno di una dimensione (per es. anno/mese/giorno) vengono mantenute in una sola tabella dimensionale

Caratteristiche del Data Warehouse Snowflake schema Le gerarchie all’interno delle dimensioni sono mantenute in tabelle separate È leggermente più complesso di una struttura a stella È meno efficiente

Caratteristiche del Data Warehouse Staging area È una area di storage Si effettuano prime trasformazioni / verifiche Dove si effettua primo caricamento

Caratteristiche del Data Warehouse Nell’ oltp quando un attributo di una tabella anagrafica cambia il vecchio valore viene sovrascritto Cliente che cambia indirizzo o ragione sociale Potrebbe essere non accettabile nel dwh Ai fini analitici interessa la “storia” Da gestire con logiche diverse rispetto all’ Oltp Chiave surrogata Chiave applicativa Problema delle slowly changing dimension (SCD)

Caratteristiche del Data Warehouse Tre metodi per risolvere le SCD Tipo 1 sovrascrivere il valore Valore errato o non ha rilevanza analitica Tipo 2 creare nuova riga con i valori modificati Tracciare i cambiamenti , poco frequenti Tipo 3 creare struttura per tracciare cambiamento Associare tra di loro i cambiamenti , se non ho numero limitato uso parent child

Caratteristiche del Data Warehouse Per creare e gestire DWH serve un strumento di ETL Extract Transform Load Microsoft Sql Server Integration Services (ex Dts)

3/27/2017 2:28 AM Domande? © 2003-2004 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.

© 2004 Microsoft Corporation. All rights reserved. 3/27/2017 2:28 AM © 2004 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary. © 2003-2004 Microsoft Corporation. All rights reserved. This presentation is for informational purposes only. Microsoft makes no warranties, express or implied, in this summary.