VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre 2007
Virtual Observatory Neural Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 VO-Neural (Virtual Observatory Neural) è un tool di data mining, basato pricipalmente su reti neurali e ottimizzato per essere utilizzato su data set astronomici di grandi dimensioni. E’ preferibile ad altri tool per due ragioni 1.è stato testato in molti campi diversi (astrofisica, sismologia, monitoraggio ambientale e bioinformatica) 2.include tutte le opzioni di cui si abbisogna per applicazioni scientifiche
VO-Neural in Astrogrid Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 La versione 1.0 del pacchetto VO-Neural (VO-Neural_MLP) mette a disposizione una MultiLayer Perceptron (MLP). Input neurons: para- metri di entrata Layers hidden: strati Interni della rete Output: file di uscita
VO-Neural in Astrogrid Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 Il tool VO-Neural_MLP è disponibile tra quelli di AstroGrid e permette 4 modalità di funzionamento: TRAIN – che svolge una procedura di train su un data set scelto dall'utente creando una nuova rete neurale e, nel caso sia richiesto, facendo la validazione. TEST – che valuta le performance della rete comparando i suoi risultati con risultati a priori. FULL – è l'unione dei metodi TRAIN e TEST. RUN – applica una rete esistente ad un nuovo data set di cui non si conoscono i risultati a priori.
VO-Neural_MLP step by step Giovanni d’Angelo - Martina Franca 12 – 23 Novembre Preparazione da parte dell'utente dei data set per i diversi esperimenti da effettuare 2.lanciare il workbench di AstroGrid 3.immettere login e password ed entrare nel proprio Myspace 4.inserire il data set scelto nel Myspace 5.selezionare “Task Launcher” e scrivere “voneural” nel campo ricerca 6.selezionare uno dei metodi: TRAIN, TEST, FULL, RUN 7.inserire I parametri di input 8.fare partire il job 9.la finestra “VO Lookout - Tasks” visualizza lo stato del job 10.alla fine del job, nel Myspace dell'utente, si troverà un file.zip che contiene tutti gli output compresi I file di log.
VO-Neural_MLP screencast Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007
VO-Neural_MLP in GRID Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 Vista la grande mole dei data set, i problemi di multiutenza e quindi il carico computazionale, non è ottimale l'utilizzo di una singola macchina su cui fare girare la rete neurale. Da queste considerazioni è immediato pensare all'utilizzo del pacchetto VO-Neural su GRID. Il problema è quindi quello di interfacciare AstroGrid, su cui in questo momento gira perfettamente VO-Neural, con l'infrastruttura GRID, in modo da permettere il suo uso tramite workbench o portale.
VO-Neural_MLP in GRID Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 La questione principale è legata a problemi di autenticazione: 1.in AstroGrid l'autenticazione avviene prima facendo parte di una community e successivamente con login e password. Questa è di tipo Single Sign On (SSO): da accesso a tutte le risorse AstroGrid (Myspace, visualizzatore di immagini, tools, ecc.) fin quando la connessione all'infrastruttura di AstroGrid rimane attiva. 2.In GRID si può usare una certificazione di tipo SSO, si ha accesso a tutte le risorse disponibili, ma i certificati sono per singolo utente che deve avere un permesso personale. In più la certificazione ha una scadenza temporale.
VO-Neural_MLP in GRID Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 I problemi da risolvere sono i seguenti: 1.capire se è possibile la compatibilità tra le certificazioni di AstroGrid e GRID 2.valutare la possibilità di creare un programma (in TOMCAT) che permetta la comunicazione tra AstroGrid e GRID 3.capire se è necessario l'autenticazione di ritorno da GRID a VO-Neural quando il job è finito. 4.certificato per singolo utente in GRID da trasformare in certificati per comunità
Conclusioni Giovanni d’Angelo - Martina Franca 12 – 23 Novembre 2007 VO-Neural funziona sull’infrastruttura Astrogrid, ma data set massivi, multiutenza e carico computazionale non favoriscono il suo utilizzo su singola macchina Utilità di utilizzare VO-Neural nell’infrastruttura GRID. Necessità di risolvere le incompatibilità tra AstroGrid e GRID Utilità di utilizzare VO-Neural nell’infrastruttura GRID.