Miner 3D Sistemi Informativi per le decisioni Professore Ing. Marco Patella Anno accademico Presentazione a cura di Di Leo Valentina - Palmieri Francesco
Knowledge Discovery La maggior parte delle aziende dispone di enormi database contenenti dati di tipo operativo Queste basi di dati costituiscono una potenziale miniera di utili informazioni
Dai dati alla conoscenza dati selezionati dati processati dati trasformati pattern conoscenza DATA MINING
Miner3D è un software di analisi, visualizzazione ed esplorazione di dati multidimensionali, con un'interfaccia potente ed intuitiva, che consente anche ad utenti meno esperti di ottenere le informazioni utili per le decisioni aziendali. Miner 3D
Caratteristiche Enterprise Professional Basic Power User Interface SISISI Selector SISI Statistics SISI Principal Components Analysis (PCA) SISI K-means Clustering SI Database Connectivity SI Microsoft Excel Instant Connectivity SISISI Data Picking SISISI Movie Recorder SISISI Model Templates SISISI Synthesized Speech and Sounds SISISI Versioni e funzionalità
Come funziona? Miner 3D preleva i dati direttamente dal database aziendale o foglio di lavoro Excel per creare un modello Un alto livello di flessibilità permette all’utente di generare virtualmente una serie illimitata di combinazioni di tipi di grafici 2D e 3D L’interfaccia user-friendly consente di interagire col programma per incrementare il grado di personalizzazione L’intuizione umana rimane insostituibile per l’interpretazione dei risultati L’intuizione umana rimane insostituibile per l’interpretazione dei risultati
Caricamento Dati Excel Excel Database (SQL Server, Oracle, IBM DB2, MySQL, Access) Database (SQL Server, Oracle, IBM DB2, MySQL, Access) Data files (CSV, TXT, DBF) Data files (CSV, TXT, DBF) Unicode Unicode Clipboard Clipboard Il programma consente l’aggiornamento dei dati sia manuale, sia con il comando auto-refresh Miner 3D consente di importare diversi formati di dati:
Data Organization I dati devono essere organizzati in colonne dove la prima riga è l’identificativo e le altre contengono tipi di dati simili
Modelli La parte più critica per l’analisi è la scelta del modello maggiormente adeguato al dataset. Il software non è in grado di scegliere il modello ottimale Modelli di base: Scatter 2D / 3D Scatter 2D / 3D Bars 2D / 3D Bars 2D / 3D Lines Lines Tiles Tiles Heat map Heat map Surface Surface
Proprietà dei modelli (1) Transformation Transformation Linear Linear Exponential Exponential Logarithmic Logarithmic Scale Scale Gain Gain Bias Bias Noise Noise Opzioni di rappresentazione dei dati:
Proprietà dei modelli (2) Proprietà grafiche Color Color Size (dimension X, Y, Z) Size (dimension X, Y, Z) Height (dimension Z) Height (dimension Z) Base size (dimension X, Y) Base size (dimension X, Y) Dimension X, Y Dimension X, Y Axes X, Y, Z Axes X, Y, Z Rotation X, Y, Z Rotation X, Y, Z Shape Shape Label Label Texture Texture Proprietà audio Sound effect, frequency, volume, panning, speech Sound effect, frequency, volume, panning, speech
Selettore Il selettore è uno strumento interattivo e visivo per la creazione di query (OLAP) Comandi di selezione: Range Range Items Items Sample Sample Substring Substring
Statistiche Le statistiche base sono calcolate automaticamente al lancio del modello e possono essere personalizzate. Le statistiche base sono calcolate automaticamente al lancio del modello e possono essere personalizzate. La finestra statistiche si aggiorna La finestra statistiche si aggiorna automaticamente al variare delle selezioni operate dall’utente. Le funzioni disponibili sono: Media, Max, Min, Somma. Le funzioni disponibili sono: Media, Max, Min, Somma. Mediana, Moda, Conteggio, Deviazione standard.
Viste La sezione viste modifica lo spazio di visualizzazione del modello. Caption Caption Axes Axes Lattices Lattices Frame Frame Waterlevel Waterlevel Fonts Fonts Colors Colors Collars Collars Camera Camera
Data reduction Viene effettuata quando vengono analizzati data set troppo numerosi Row reduction Keep all rows: forza il programma a caricare l’intero data set Keep all rows: forza il programma a caricare l’intero data set K-means Clustering: clusterizza le tuple K-means Clustering: clusterizza le tuple Random selection: seleziona una percentuale o un numero di tuple da caricare Random selection: seleziona una percentuale o un numero di tuple da caricare Uniform selection: carica una tupla ogni N oppure un range di tuple Uniform selection: carica una tupla ogni N oppure un range di tuple Principal Components Analysis (PCA) Estrapola un sottoinsieme di dimensioni rilevanti per l’analisi, più semplici da visualizzare e da gestire per le proprie esigenze di reports e di calcolo. Estrapola un sottoinsieme di dimensioni rilevanti per l’analisi, più semplici da visualizzare e da gestire per le proprie esigenze di reports e di calcolo.
Funzionalità avanzate: K-means K-Means Clustering e K-Means Data Reduction offrono diverse opzioni per processare insieme di dati di grosse dimensioni. Questi metodi possono essere usati sia su cluster data sets visualizzati in 3D o per la riduzione e compressione dei databases. K-Means Clustering e K-Means Data Reduction offrono diverse opzioni per processare insieme di dati di grosse dimensioni. Questi metodi possono essere usati sia su cluster data sets visualizzati in 3D o per la riduzione e compressione dei databases. Il metodo K-Means implementato in Miner3D utilizza un algoritmo proprietario ad alte prestazioni, basato su algoritmi di filtro e di ricerca multidimensional binary search trees. Il metodo K-Means implementato in Miner3D utilizza un algoritmo proprietario ad alte prestazioni, basato su algoritmi di filtro e di ricerca multidimensional binary search trees.
Salvataggio dei risultati Modello Modello(xml) Report Report Report (html) Immagini Immagini (bmp, jpg, tif, tga, png) Video Video(avi)
Vantaggi di Miner 3D Visualizzazione dei dati Visualizzazione dei dati Semplicità d’uso Semplicità d’uso Flessibilità Flessibilità Potenza di calcolo Potenza di calcolo Interattività Interattività Personalizzazione Personalizzazione
… E ora un esempio…