Rosuda Software e Grafici Interattivi per il Visual Data Mining IVDM 2003.

Slides:



Advertisements
Presentazioni simili
IDL routine for Hot-Spot detection and effusion rate estimation
Advertisements

Centro Internazionale per gli Antiparassitari e la Prevenzione Sanitaria Azienda Ospedaliera Luigi Sacco - Milano WP4: Cumulative Assessment Group refinement.
I numeri, l’ora, I giorni della settimana
Come analizzare i dati (principali test statistici impiegati)
Cache Memory Prof. G. Nicosia University of Catania
ISTITUTO NAZIONALE DI GEOFISICA E VULCANOLOGIA IDL routine for Hot-Spot detection and effusion rate estimation.
1 12 aprile 2005 Approximate Dynamic Factor Models: sviluppi della teoria e applicazioni – parte prima Andrea Brasili Strategie e Studi – UniCredit Banca.
Teoria e Tecniche del Riconoscimento
1 SOCIAL MEDIA PLATFORM FOR MARKETERS. 2 Vitrue è una piattaforma di social marketing (SRM Dashboard) impiegata per aiutare i brand a catturare il vasto.
Statistica Descrittiva Con STATA 7
1 Teaching Cloud Computing and Windows Azure in Academia Domenico Talia UNIVERSITA DELLA CALABRIA & ICAR-CNR Italy Faculty Days 2010.
EBRCN General Meeting, Paris, 28-29/11/20021 WP4 Analysis of non-EBRCN databases and network services of interest to BRCs Current status Paolo Romano Questa.
Interazione uomo-macchina (HCI – Human-Computer Interaction)
WSDL (Web Services Description Language) Laurea Magistrale in Informatica Reti 2 (2006/07) dott. Federico Paoloni
1.E un algoritmo ricorsivo: Tutti le istanze di oggetti raggiungibili da un oggetto persistente diventano anchessi persistenti.
Web 2.0 and Libraries mj crowley 6/3/09 Un modello di auto-apprendimento collaborativo, ma anche divertente e gratificante !
L’albero della famiglia
5-1 Point to Point Data Link Control Crediti Parte delle slide seguenti sono adattate dalla versione originale di J.F Kurose and K.W. Ross (©
Metodi Quantitativi per Economia, Finanza e Management Lezione n°11.
MySQL Esercitazioni. Ripasso Connessione a MySQL. Creazione delle basi di dati e delle tablelle. Inserimento dei dati. Interrogazioni.
Raffaele Cirullo Head of New Media Seconda Giornata italiana della statistica Aziende e bigdata.
Unified Modeling Language class C {…} class B extends C {…} Esiste una notazione grafica per mostrare le relazioni di ereditarietà. Object StringC B Tutte.
Sezione: Costruttori Costruttori. Definizione dei costruttori Se per una classe A non scrivo nessun costruttore, il sistema automaticamente crea il costruttore.
prompt> java SumAverage
TIPOLOGIA DELLE VARIABILI SPERIMENTALI: Variabili nominali Variabili quantali Variabili semi-quantitative Variabili quantitative.
An Efficient Extension of Elevation Maps for Outdoor Terrain Mapping Patrick Pfaff and Wolfram Burgard Pier Francesco Palamara Corso di Visione e Percezione:
Directive 96/62/EC - Ambient Air Quality List of air pollutants in the context of air quality assessment and management.
Teoria a molti-corpi della materia nucleare. Testi di riferimento Nuclear methods and the nuclear Equation of State, International review of Nuclear Physics,
Parma, 26 gennaio 2006 E-book per bambini: esperienze a confronto Valeria Baudo.
2000 Prentice Hall, Inc. All rights reserved. 1 Capitolo 6: Classi e astrazione dati 1.Introduzione 2.Definizione delle strutture 3.Accedere ai membri.
FONDAMENTI DI INFORMATICA III WfMC-1. FONDAMENTI DI INFORMATICA III WfMC-2 WFMC Cose WfMC Workflow Management Coalition (WfMC), Brussels, è unorganizzazione.
WP 10 – Applicazioni Astrofisica – stato Leopoldo Benacchio INAF Osservatorio Astronomico di Padova Pisa maggio 03.
Players: 3 to 10, or teams. Aim of the game: find a name, starting with a specific letter, for each category. You need: internet connection laptop.
Compito desame del Svolgimento della Sezione 5: CONTROLLORI Esempio preparato da Michele MICCIO.
FUNZIONI DI GRUPPO Le funzioni di gruppo operano su un set di record restituendo un risultato per il gruppo. AVG ([DISTINCT|ALL] n) media, ignora i valori.
Componenti dell’architettura Oracle
Palermo, may 2010 F.Doumaz, S.Vinci (INGV-CNT- Gruppo di telerilevamento)
STAGE IN LINGUA INGLESE ISIS GREENWICH SCHOOL OF ENGLISH GREENWICH Data: dal al Studenti delle II-III-IV classi Docenti coordinatori:
Università degli studi di Modena e Reggio Emilia Facoltà di Ingegneria di Modena Corso di Laurea Specialistica in Ingegneria Informatica Analisi e valutazione.
I mille volti della formazione dalle-learning allemployergame Novembre 2012 I mille volti della formazione: dalle-learning allemployergame 4° Release Novembre.
I sistemi G.I.S. Una breve panoramica. G Sta per GeographicG Sta per Geographic I GIS hanno a che fare con la cartografiaI GIS hanno a che fare con la.
Fare clic per modificare lo stile del titolo Fare clic per modificare stili del testo dello schema – Secondo livello Terzo livello – Quarto livello » Quinto.
Modulo 1 bis Menù Incolla Esercitazione Un computer è quasi umano, a parte il fatto che non attribuisce i propri errori a un altro computer. (Anonimo)
Gli ambienti di apprendimento Firenze, 3 marzo 2006.
Architettura dei sistemi di elaborazione
Moduli o Form I Moduli permettono all'utente di immettere informazioni...
LE RETI INFORMATICHE.
INTERNET Antonio Papa Classe 2^ beat I.S.I.S. G. Meroni a.s. 2007/2008.
Giochi educativi on line e off line Come programmarne limpiego in classe.
Attività Formativa Sviluppo di un WORKFLOW ENGINE di Dott. Riccardo Gasperoni Alessandro Caricato Gabriele Trabucco in collaborazione con Progesi S.p.A.
Confidential Information Copyright Nextel Italia R Talk Powered by Audioconferenza wireless Quality of Japan.
L2 Elaborazione di immagini in C/C++
Un Architettura Risc - Pipeline Il Processore Deluxe - DLX
Scoprirete che su Office non si può solo contare ma anche sviluppare.
Calibrating (Partial Equilibrium) Mathematical Programming Spatial Models Open questions … (filippo arfini) III Workshop PUE&PIEC - Treia (Mc), 3-4 febbraio.
24 aprile 2002 Avvisi: Risultati 1 o Esonero: (entro) lunedi 27 disponibili nella pag. WEB, ma anche esposti nella bacheca fuori dal corridoio 2 o dente,
/ Elementi di C++ Introduzione a ROOT , Laboratorio Informatico ROOT warm up , Laboratorio Informatico Introduzione a.
Tutor: Elisa Turrini Mail:
Visual Studio Tools for Office: Developer Solutions Platform Fulvio Giaccari MCSD.NET / MCT Responsabile Usergroup ShareOffice Blog:
SUBQUERY Chi ha un salario maggiore di quello di Abel? Occorre scomporre la query in due sotto problemi: MAIN : quali impiegati hanno un salario maggiore.
Corso di Web Services A A Domenico Rosaci Patterns di E-Business D. RosaciPatterns per l'e-Business.
The Unìversal Declaratìon of Human Rìghts MìKèLa GaBrìèLLì … 3°G …ù.ù.
Negli ultimi anni, la richiesta di poter controllare in remoto la strumentazione e cresciuta rapidamente I miglioramenti nell’hardware e nel software insieme.
COSMO-LEPS verification SON 2004 precipitation new suite Chiara Marsigli ARPA-SIM – WG4.
Lezione n°27 Università degli Studi Roma Tre – Dipartimento di Ingegneria Corso di Teoria e Progetto di Ponti – A/A Dott. Ing. Fabrizio Paolacci.
Castelpietra G., Bassi G., Frattura L.
Rosuda Interactive Visual Data Mining e la Ricerca dell’Informazione Nascosta IVDM 2003.
Paradigma MVC Ing. Buttolo Marco.
Svolgimento della Sezione 5: CONTROLLORI
Transcript della presentazione:

rosuda Software e Grafici Interattivi per il Visual Data Mining IVDM 2003

rosuda IVDM 2003 Software Commerciali per il Data Mining AIM distribuito da AbTech AUTOCLASS distribuito da NASA CLEMENZINE distribuito da SPSS Database Mining distribuito da HNC Datalogic/R distribuito da Reduct Syst Information Harvesting distribuito da Ryan Ass Intelligent Miner distribuito da IBM IXL/IDIS distribuito da IntelligWare KnowledgeSeeker distribuito da FirstMarkTechn NEXTRA distribuito da Neuron Data PC-MARS distribuito da Data Patterns RECON for Data Mining distribuito da Lockheed

rosuda IVDM 2003 Software Commerciali per il Data Mining: CLEMENTINE- SPSS

rosuda IVDM 2003 Software Commerciali per il Data Mining: ROSETTA

rosuda IVDM 2003 Software Commerciali per il Data Mining: STATISTICA The most part of statistical software for Data Mining try to give a suitable final graphical representation of applied models

rosuda IVDM 2003 Software per il Data Mining: considerazioni generali -Cosa dovrebbero fare? -Cosa fanno davvero? -Quali caratteristiche sono le piú rilevanti? -Come influisce la Visualizzazione sulla ricerca dell´Informazione?

rosuda IVDM 2003 Il nostro Software per IVDM: The Rosuda`s Impressionistes

rosuda IVDM 2003 Interactive Visual Data Mining: Implementazione **Graphics manipulation = Data manipulation** Interazione condiziona non solo l´aspetto esteriore del display ma la sostanza dei dati!

rosuda IVDM 2003 Fisher Grains Data Set Produzione di Grano presso i Campi Broadbalk a Rothamsted Fisher (1924) La matrice di dati è stata transposta, di modo che ciascun anno corrisponda ad un diverso anno 18 time series osservate annualmente per un periodo di 76 anni

rosuda IVDM 2003 PC anche dati temporali

rosuda IVDM 2003 Interactive Time Series

rosuda IVDM 2003 …Collegare Tempo e Luogo

rosuda IVDM 2003 …PC in generale e Mappe

rosuda IVDM 2003 Maps, selezione e Mondrian

rosuda IVDM 2003 Cos è una mappa Dati Geografici possono essere collocati in base alla vera referenza geografica

rosuda IVDM 2003 Collegare le Mappe agli individui Da dove viene? Che tipo di criminale é? The Crime dataset and the Criminal face

rosuda IVDM 2003 The Crime dataset and the Criminal face Crime-Datatet: distribuito da JMP library, SAS -7 tipi crimini - in 50 stati USA - in un anno

rosuda IVDM 2003 Glyphs, per Individui Multidimensionali

rosuda IVDM 2003 Fisher Iris dataset 4 misure (sepal width, sepal length, petal width, petal length) su 50 piante appartenti a 3 specie diverse. Andrews, D. F., and Herzberg, A.M. (1985). Data. New York: Springer p5-8

rosuda IVDM 2003 Glyphs per strutture

rosuda IVDM 2003 Uomo o Donna? Setosa o Versicolor? Classificazione ed Alberi...

rosuda IVDM 2003 Trees, Klimt ed R Input: -Tab spaces ASCII file -Output of partition routine (rpart, cart, etc..) Output: -Interactive graphics -Trees

rosuda IVDM 2003 Interactive Trees

rosuda Interattivitá in dettaglio: basic Instruments Linking: Variables or Individuals Querying: Different levels Selection: Single or Multiple Selection Hot Selection Scaling: according to specific parameters Zooming: Zoom or Logical Zoom Rotating Sorting: Automatical, Manual IVDM 2003

rosuda Linking: Variables Individuals

rosuda Querying: Different levels In Manet variables are querable!

rosuda Selection: Single or Multiple Selection Point selection Rectanngle selection Undo Logical operation on selected items Hot Selection

rosuda Scaling: according to specific parameters

rosuda Zooming: Zoom or Logical Zoom

rosuda Sorting: Automatical, Manual

rosuda IVDM 2003 Requisiti fondamentali dell´Interattivitá Buon CHI Intuitivitá Velocitá Software intgration

rosuda IVDM 2003 Diversi concetti di Interattivitá

rosuda IVDM 2003 Tornare sempre ai dati!! - Deve essere sempre chiaro o chiaribile quali dati stanno dietro ai grafici - La Linked-Selection offre diverse viste dei medesimi dati - I Dati devono essere facili da importare - Il formato dei dati deve essere il piú semplice possibile -Bassi livelli di manipolazione agiscono sui dati - Alti livelli di manipolaziono influenzano solo il display

rosuda IVDM 2003 Quante taglie di dataset conosci? Tiny??? Small ??? Large??? Very Large??? Huge???

rosuda IVDM 2003 Definizioni di taglia... Tinycan be written on a blackboard10 2 bytes Smallfits on a few printed pages10 4 bytes Mediumfills a floppy disk10 6 bytes Largefills a tape10 8 bytes Hugerequires many tapes10 10 bytes

rosuda IVDM 2003 Prerequisiti computazionali Potente Memoria Buono sfruttamento della memoria Buoni algoritmi Alta qualitá delle immagini Importabilitá

rosuda IVDM 2003 Prerequisiti Grafici Visualizzazioni non dipendenti dalla Taglia Buoni Algoritmi Buone Implementazioni Interactivitá Interfaccia intuitiva e chiara Analisi oggettive o soggettive???

rosuda IVDM 2003 Large dataset Exploration: The Bank Dataset Dataset finanziario ottenuto da una banca tedesca Dati raccolti per ragioni tecniche senza alcuno scopo speciale Passati agli analisti per scoprire i fattori che influenzano maggiormente le transazioni Consiste di piú di 600,000 transactions in 24 variabili (80 Mb ca.)

rosuda IVDM 2003 Amount vs. Profit Le dimensioni rappresentate sono influenzate dai valori minimi e massimi rilevati Spesso si tratta di outliers

rosuda IVDM 2003 Amount vs. Profit Non è effetto di uno Zoom! L´immagine è stata riparametrizzata I valori anomali sono stati tagliati

rosuda IVDM 2003 Amount vs. Profit: Cluster? Non nel senso classico… Tuttavia speciali relazioni fra i dati sono identificabili e ragionevolmente giustificabili

rosuda IVDM 2003 Informazioni o Informatione ??? L´Informazione ottenuta dai dati è molto piú che la semplice giustapposizione di singoli dettagli o la somma di singole informazioni

rosuda IVDM 2003 Una schematica Classificazione dei dati Number of Observations: -A few -Many Kind of Observations: -Categorical -Continuous Number of Variables: -One-two -A few -Many -Infinite

rosuda IVDM 2003 Come li rappresentereste? Number of Observations: -A few -Many Kind of Observations: -Categorical -Continuous Number of Variables: -One-two -A few -Many -Infinite Scatterplot Trellis Display Barchart Mosaic Plot Parallel Coordinate

rosuda IVDM 2003 Rosuda: analisi interattiva per ogni tipo di dati -Soluzioni Interattive differenziate ed Ottimali -Design Consistente -Buon CHI -Gamma di soluzioni tale da consentire una completa EDA -Ottimizzazione delle risorse informatiche e delle tecniche statistiche

rosuda IVDM 2003 No Conclusion, c´è ancora parecchio da fare! Commenti? Consigli? Domande? bibliografia