C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova -Ist. Naz. di Fisica Nucleare via F. Marzolo, Padova -ITALY 2 INFN-CNAF -Viale Berti Pichat, 6/ Bologna (Italy) 3 INFN-Bari -Bari University, Via Orabona 4, Bari 70126, Italy 4 INFN-Legnaro -Lab. Naz. di Legnaro, viale dell’Universit´a n. 2, Legnaro (PD) ITALY Introduzione Per le diverse comunità che operano in ambiente Grid è indispensabile un sistema di monitoraggio delle proprie risorse sia per controllarne l’utilizzo che per individuare il verificarsi di eventuali problemi su di esse. Oltre a questo, per i membri di queste comunità, come ad esempio le VO di BioinfoGRID e LIBI, è fondamentale essere sempre a conoscenza dello stato delle applicazioni che eseguono in un qualsiasi sito della Grid. GridICE si propone quindi come strumento che possa essere utile a varie tipologie di utenti, interessati a diversi aspetti del monitoring. Il progetto GridICE in questo senso fornisce un’interfaccia web sviluppata per fornire un monitoring di griglia praticamente completo. Questo tool é stato sviluppato seguendo nel tempo le necessità degli utenti e gli sviluppatori di GridICE che continuano ad aggiungere nuove funzionalità per soddisfare le varie richieste. Ad esempio,importante sarà la prossima integrazione ed allineamento con le ultime release del software di LEMON, aspetto che consentirà un più facile sviluppo di nuove funzionalità e di fornire un monitoring ancora più completo. Quadro generale Numero di siti che compongono la Grid e la loro locazione; quantità di risorse disponibili (n. di CPU, WN, ecc…) Job monitoring Il job monioting rappresenta un requirement degli esperimenti. Gli eventi vengono generati da sensori installati sulle macchine (script perl o programmi c). I dati relativi ai job sono sintetizzati nella tabella a fianco. Tutti i sensori collezionano dati in maniera periodica. Gli eventi vengono immagazzinati in un db PostgreSQL per formare statistiche aggregate. I dati estratti dal database vengono codificati in appositi file XML. Questi file vengono tradotti in XSL- XHTML per pubblicare le informazioni aggregate sul web. Conferenza Nazionale Italian e-Science 2008 IES maggio Universita’ degli di Studi di Napoli Federico II Accesso personalizzato alle informazioni in base al proprio ruolo nella grid Recenti sviluppi hanno consentito a GridICE di fornire agli utenti un nuovo e più semplice modo di accedere alle informazioni raccolte dal sistema di monitoring. Questo meccanismo è basato sull’utilizzo dei certificati personali e dei ruoli VOMS che gli utenti rivestono. Condizione necessaria affinché avvenga l’accesso personalizzato alle informazioni di GridICE sono: l’utente deve avere un valido certificato rilasciato dall'INFN-CA. l’utente deve essere registrato con un gruppo/ruolo VOMS. I ruoli con cui un utente puo’ essere registrato nel VMOS e per i quali GridICE prevede un accesso personalizzato sono: Il sensore LRMSInfo il sensore LRMSInfo fornisce informazioni aggregate del LRMS (Local Resource Manager System). Esempi di Informazioni prodotte dal nuovo sensore LRMSInfo sono il numero di CPU disponibili per i job di grid, il carico medio della farm, la memoria fisica utilizzata e disponibile, il numero di job in esecuzione e in coda. Amministratore del sito: potra’, per esempio, vedere, solo per il proprio sito, l’uso delle risorse da parte di tutti gli esperimenti; utile per capire se ci sono degli usi impropri da parte di alcuni utenti/esperimenti Gestore della VO: l’utente riconosciuto con questo ruolo potra’ vedere dei report grafici personalizzati per il proprio esperimento come per esempio lo stato dei job di una particolare VO divisa per tutti i siti ; utile per osservare quali sono le risorse piu’ affidabili e performanti per la sua VO. Semplice utente grid. Questo tipo di utente troverà notevole beneficio nel visualizzare in maniera immediate solo le informazioni relative ai propri job. Per esempio questo grafico a torta è utile per vedere in modo più diretto e immeditato lo stato dei propri job. Exit status = 0 => job ok Exit status !=0 => job fallito Un’altra informazione utile al VO manager è la possibilità di visualizzare sotto forma di tabella l’uso delle risorse da parte degli utenti con una granularità maggiore rispetto a quella della semplice VO. Ad esempio il VO manager potrà vedere il dettaglio del gruppo all’interno della VO utile per distinguere fra job di simulazione, di analisi e di servizio.