Cloud SIA V anno
Introduzione ai Data Warehouse
L’informatica in azienda L’ausilio fornito dall’informatica nella gestione delle aziende da diversi decenni interessa tutti i processi aziendali. L’informatica ha trasformato tutti gli archivi delle aziende in files e cartelle elettroniche. L’informatica permette l’accesso immediato a tutto lo storico di un’azienda favorendone anche la riutilizzabilità di esso.
Strutture logiche Non basta sapere di avere le informazioni, occorre, soprattutto, essere in grado di reperirle. Per questo motivo nasce il Data Warehousing perché, anche quando si tratta di un archivio virtuale, occorre definire delle strutture logiche all’interno delle quali depositare le informazioni.
Repository Quando occorre ricercare un documento spesso si ragiona partendo dalle conoscenze personali in merito. La ricerca avviene dunque partendo da dati che si conoscono per giungere a ciò di cui non si conosce la collocazione. Questa logica è applicabile tanto ad archivi fisici quanto ad archivi virtuali. I dati di partenza non sono il database, ma ne costituiscono un necessario strumento per il reperimento delle informazioni che si vogliono trovare: sono un esempio di metadati: dati che ci permettono di risalire ad altri dati (data about data). Tutto ciò può rendere l’idea di che cosa sia un Repository la cui efficacia dipende molto dalle regole (architettura) di creazione e di organizzazione dei metadati.
Database Una base di dati può essere definita come una collezione di dati strutturati, progettati per essere usati in applicazioni differenti e da differenti utenti. In particolare, è un insieme di dati memorizzati senza ridondanze inutili per servire più di un’applicazione in contemporanea e organizzati in modo da essere indipendenti dai programmi che li usano.
Data Warehouse Un DWH nasce e si sviluppa con lo scopo di collegare i dati e le informazioni presenti negli archivi.
Data Warehouse In ogni azienda, ovviamente, le informazioni non mancano, ma si può correre il rischio che non servano. Il DWH ha voluto superare questo ostacolo raccogliendo tutti gli archivi e riorganizzandone i diversi contenuti fornendo gli elementi necessari a chi deve prendere delle decisioni. Fisicamente il DWH è esterno ai DB operazionali utilizzati quotidianamente dai sistemi transazionali da cui preleva periodicamente i dati aggiungendovi la data del giorno in cui viene effettuata la fotografia della situazione.
Data Warehouse e database operazionali I DB operazionali sono utilizzati dai sistemi dedicati all’operatività (Contabilità, Acquisti, Vendite, Produzione,...). Su di essi vengono effettuate di continuo operazioni di I/O (transazioni). Contengono poche informazioni di tipo storico. Il DWH, invece, avendo un’esigenza di analisi e non “operazionale” congela tutte le variazioni intervenute nella storia.
Accessi OLTP e OLAP Gli accessi ai DB Operazionali sono di tipo OLTP (On Line Transational Processing), mentre quelli ai DWH sono di tipo OLAP (On Line Analytical Processing). Gli accessi (OLTP) sono di tipo transazionale e oltre a leggere informazioni ne aggiungono, quindi scrivono nuovi dati su tabelle e record. Al DWH, che ha prelevato a suo tempo le informazioni utili alle analisi successive e le ha organizzate opportunamente con l’aggiunta di metadati, viene richiesto un unico accesso (OLAP) che coinvolge migliaia di record con impiego di CPU particolarmente impegnativo.
Data Mart Si può presentare la necessità di organizzare parti dei dati in maniera funzionale alle richieste di determinati settori dell’azienda: in questo caso si creano dei sottoinsiemi, degli estratti del DWH che prendono il nome di Data Mart.
Predire il futuro? Siccome l’appetito vien mangiando e l’informatica raggiunge ogni minuto che passa potenzialità maggiori, dall’analisi del passato si è cominciato a voler predire il futuro. In realtà il computer può essere un valido ausilio qualora si vogliano stimare i risultati che ci si potrebbe aspettare scegliendo ipotesi differenti. Le domande che ci si pone sono molte, e ognuna di esse necessita di una risposta, meglio se in tempi molto brevi.
Decision Support System Per ‘predire il futuro’ dal DWH nascono i DSS (Decisional Support Systems) che forniscono la possibilità di simulare scenari tenendo conto dei dati consolidati. Questi sistemi mettono a disposizione la loro potenza di calcolo e la velocità di estrazione delle informazioni, ma NON possono sostituirsi alla persona che stabilisce le ipotesi su cui lavorare che se sono completamente errate e non possono che fornire solamente risultati fantasiosi!
Business Intelligence Un ultimo accenno doveroso è a una nuova sigla che ora viene utilizzata molto più frequentemente: BI (Business Intelligence). All’inizio riguardava solamente lo strumento di estrazione e presentazione dei risultati ricavati dal nostro DWH, senza del quale, però, non si potrebbe ricavare nulla. L’accezione diffusa è quella che si tratti di un nuovo nome, decisamente più accattivante, dato al nostro DWH.
Data Warehouse e Business Intelligence