17th International Conference on Computing in High Energy and Nuclear Physics 21 - 27 March 2009 Prague Esperienza di un portale “application oriented”

Slides:



Advertisements
Presentazioni simili
Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
Advertisements

Workshop CNAF – Bologna 8 Luglio 2011 FARO Accesso Web a risorse e servizi remoti in ambiente Grid/Cloud A. Rocchi, C. Sciò, G. Bracco, S. Migliori, F.
FESR Trinacria Grid Virtual Laboratory PROGETTO “MAMMO” Sviluppo e ottimizzazione di algoritmi adattativi, specificatamente di Artificial.
Implementazione di TRIP ai LNF Commissione Calcolo e Reti 31 maggio 2007 Massimo Pistoni.
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
FlowLineXL Flowline XL e' il sistema integrato per la gestione del recruitment tramite web per enti e societa' di selezione Fornito in modalita' ASP (application.
POLITECNICO DI MILANO FACOLTA’ DI INGEGNERIA SEDE DI CREMONA TESI DI DIPLOMA IN INGEGNERIA INFORMATICA RELATOREAUTORI Prof. Vittorio TrecordiDemicheli.
HLRmon per IGI: nuove funzionalità Enrico Fattibene INFN – CNAF
VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre.
Cassetto Previdenziale per Liberi Professionisti iscritti alla Gestione Separata Manuale Utente.
Facile da usare Un'interfaccia amministrativa completamente rinnovata, iniziare con Drupal è più facile!
Corso per Webmaster base
Chi siamo Dei Partners efficienti, con un servizio innovativo per recuperare crediti, tempo, serenità, senza più preoccuparsi di nulla. Una squadra di.
SCoPE - Stato dei Lavori
Vulnerability Assessment
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Office WPC049 Strumenti di supporto e analisi per Office 365
Crea il tuo sistema aziendale sul web a partire dei fogli Excel che usi. ShareXLS
Summary di (quasi) tutti gli utenti non presentati…
Il Sistema Operativo Gestione dei Processi
EMBYON
Monitoring e loadbalancing dei servizi Grid
NegoziCS packing list fidelitycard ordini merceinsaldo www ® software
Commissione Calcolo e Reti
Generazione di codice dinamico per la realizzazione di catene di servizi componibili Matteo Fazi – matr
Applicazione web basata su web service e web socket
Dati in rete Appunti.
Breve report su corso RedHat Enterprise Virtualization (RH318)
FlowLineXL Flowline XL e' il sistema integrato per la gestione del recruitment tramite web per enti e societa' di selezione Fornito in modalita' ASP (application.
REX - Istruzioni tipo IKEA
Commissione Calcolo e Reti
Guido Cuscela INFN-Bari
Terza Lezione → Navigare nel file System → parte 2
Applicazioni Bioinformatiche in Ambiente Grid
Sicurezza e Grid Computing
GridFlex: gestione di software
Meccanismi di caricamento e aggiornamento dei dati
Il Binding Nicolò Sordoni.
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
PROGETTO ATTI.CO.
Attvità Computing – Inverno 08/09
Portal Architecture Data Management
INDICO Parte 1 01/07/2018 Francesco Serafini.
PI2S2 Regional Operation Centre Sistema di Supporto Sistema di Monitoring Rita Ricceri Consorzio Cometa Tutorial per Site Administrator Messina,
Giordano Scuderi Unico SRL Catania
Giordano Scuderi Unico SRL - Messina,
Corso di Ingegneria del Web e Applicazioni A A
Job Application Monitoring (JAM)
PROGETTO “COMDO” Supporters : AnnaMaria Muoio, Marcello IaconoManno
* Il Sistema Operativo GNU/Linux * Sistema Operativo e Applicazioni
Asynchronous JavaScript and XML
PROGRAMMAZIONE BASH – ISTRUZIONE IF
PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno
Servizi web per la bioinformatica strutturale
analizzatore di protocollo
Sviluppo di un'applicazione web per l'utilizzo del framework SparkER
Recupero polizze assicurative
Ardis e il sistema qualità
Corso di Ingegneria del Web A A Domenico Rosaci 1
RES PowerFuse® e RES WISDOM®
Italsoft srl Guida allo Sportello Italsoft srl
Predisposizione e presentazione della domanda di nullaosta
STAT-RI WEB OPERATIVI.
ADO Per gestire i database con tecnologia ASP si utilizzano strumenti ADO (ActiveX Data Objects): un'architettura che fornisce oggetti.
Scheduling in Linux (Kernel 2.4 e 2.6)
Cassetto Previdenziale per Liberi Professionisti iscritti alla Gestione Separata Manuale Utente.
Italsoft srl Guida allo Sportello Italsoft srl
Predisposizione e presentazione della domanda di nullaosta
Scheduling (Schedulazione)
CLOUD.
Transcript della presentazione:

17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague Esperienza di un portale “application oriented” per bioinformatici Guido Cuscela INFN-Bari

Argomenti Il target: –L’utente –Le applicazioni L’interfaccia web –Caratteristiche –Funzionalità 17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague

Il target di JST L’utente: –Non conosce o ha scarsa conoscenza della tecnologia Grid –Non possiede un certificato personale Le applicazioni: –File di input e output di grosse dimensioni –Tempi di esecuzione elevati –Possibilità di suddividere in un numero anche molto elevato di task elementari O(10'000) 17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague

Obiettivi Fornire un tool che consenta: –Registrazione dei file di input su SE –Utilizzo di tutte le risorse disponibili alla VO di bioinformatica (bio, biomed) –Monitoring delle proprie sottomissioni –Fault tolerance –Recupero degli output da un link web Ogni interazione con la Grid deve essere trasparente all’utente 17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague

Workflow 17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague The user creates the tasks using the GUI A daemon running on the UI check if any Free task has been created The UI daemon submit jobs on the Grid More than one RB used to perform the submission The wrapper requests the TaskListDB for a task to execute updates the task status logs the monitoring information Output registered on a SE chosen in a list of SEs in base to their availability A UI daemon retrieves output from the SEs The daemon send the output to a web server Web Server

Funzionalità (1) Il database centrale contiene la “task queue” in modo che tutti i job sottomessi siano uguali (pull mode) Le task vengono create in modo automatico nel db dall’utente con i file di input caricati tramite interfaccia web L’utente decide come suddividere la sua applicazione tramite gli stessi file di input: –Il numero di task determina i job sottomessi a grid –Un numero troppo grande di job può diminuire l’efficienza della sottomissione (fallimenti, latenza WMS, tempi di trasferimento dati non ottimi) –Un numero basso di job determina tempi di esecuzione dei singoli job troppo lunghi e riduce il vantaggio della parallelizzazione 17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague

Funzionalità (2) Le applicazioni già disponibili nell’interfaccia suggeriscono all’utente una serie di parametri di default E’ possibile personalizzare il comportamento dell'applicazione in fase di sottomissione

Funzionalità (3) L’interfaccia è basata sulle XSLT (trasformate XSL) Le pagine creano un file xml che permette di generare l’eseguibile da sottomettere Il JST riceve dall’interfaccia l’eseguibile e il jdl per effettuare la sottomissione La modularità interfaccia-JST-grid permette di aggiungere facilmente nuove applicazioni: –JST agisce come un wrapper sul moddleware Grid –Piccole modifiche nell’interfaccia per le diverse applicazioni (numero diverso di input, command line …) –Le modifiche all’interfaccia non influenzano il funzionamento di JST e viceversa

Input di grosse dimensioni Un “blastx” necessita di un file di input di sequenze FASTA nell’ordine di 10GB Non fattibile caricare i file via http –Limiti di upload –Tempi di upload eccessivi L’unica soluzione è registrare i file su storage element  JST è poi responsabile delle repliche sui closeSE –Tipicamente un utente bioinformatico non sa come eseguire tale procedura –Intervento degli sviluppatori o utilizzo del certificato da parte degli utenti –Limitazioni nel tipo di applicazioni portabili

Input di grosse dimensioni-soluzione Necessario fornire agli utenti un modo semplice per traferire i file su SE in modo trasparente Il trasferimento deve: –Disporre di un client per ogni tipo di piattaforma (Windows/MacOS/Linux) –Prevedere un meccanismo di autenticazione –Fornire buone performance su reti con grosse latenze Installato un server WEBDAV per gestire grossi input e il recupero degli output

Il server WEBDAV Nel interfaccia l’utente può definire eventuali file da registrare su Grid Occorre fornire: –LFN: logical file name con cui verrà registrato sul catalogo il file (la stringa viene suggerita) –url WEBDAV: indica la destinazione del file da caricare –La sottomissione dei job inizierà solo quando tutti i file necessari saranno caricati sul server Ogni operazione sul server webdav richiede un’autenticazione (stesse credenziali dell’interfaccia di JST)

Funzionalità (4) L’utente è guidato fino all’invio della mail che notifica il successo della sottomissione Se è necessario registrare dei file l’utente riceverà la lista e le istruzioni

Sottomissione a Grid Uno o più demoni running sulle UI controllano periodicamente il database centrale cercando nuove sottomissioni Se la sottomissione prevede la registrazione di file sulla grid: 1.Vengono recuperati dal db le url e gli lfn dei file 2.Vengono scaricati tutti i file dal server webdav 3.Viene effettuato un lcg-cr dei file su uno SE predefinito Lo scheduling dei job effettua un load balancing –JST tiene traccia dei job sottomessi ai vai CE –Quando viene raggiunta la soglia massima di job in coda ad un CE, questo viene inserito in una black-list fino a quando il numero di job non tornerà sotto soglia

Monitoring Tempo vs Task completati(done)

Monitoring Task completati Task free Task running

Monitoring Distribuzione dei job

Recuper dell’output Un demone specifico running sulle UI controlla periodicamente se ci sono sottomissioni completate (tutti i task della sottomissione devono avere stato “done”) Tutti gli output vengono recuperati e caricati sul server WEBDAV Viene inviata una mail all’utente con l’url dell’output

Conclusioni Statistiche: –~ jobs sottomessi sulla grid italiana –~488 giorni di CPU time –11 siti diversi utilizzati Semplicità di integrazione di nuovi applicativi –Già disponibili: Gene Analogous Finder, CLUSTERING, CSTminer, BLAST, PAML,BLASTX,BLASTN Facilità di integrazione della GUI e di JST in altri portali –JST è già stato utilizzato in passato in portali come GRB e GENIUS WEBDAV ha fornito un modo efficiente per gestire file di grandi dimensioni Completamente mascherata la complessità della grid Non solo le applicazioni di bioinformatica possono essere eseguite con l’interfaccia JST –È necessario che l’applicazione sia suddivisibile in task indipendenti

Riferimenti Link: – – grid/index.php/Main/JobSubmissionToolhttp://webcms.ba.infn.it/cms-software/cms- grid/index.php/Main/JobSubmissionTool Persone coinvolte: –Guido Cuscela : –Giacinto Donvito: