Grid operations Luciano Gaido (INFN-Torino) Incontro con i referee di INFN-GRID CNAF, 29 agosto 2007
Attività In estrema sintesi (inutile ripetere i dettagli): Grid di produzione: Risorse Servizi Controllo e gestione (turni) Release INFNGRID Monitoring Accounting (DGAS) Supporto Servizio di preproduzione Experimental services Framework esperimenti Sinergie con JRA1/SA3 Training (sinergia con NA3)
Attività Altri servizi generali: Partecipazione al Cic-on-Duty (COD): A. Cavalli A. Pagano Partecipazione al Ticket Processing Management: Luca Vaccarossa Alessandro Paolini Sara Bertocco Danilo Dongiovanni Partecipazione all’EGEE Support Committee (ESC): Federico Nebiolo Partecipazione al Security Group EGEE: Riccardo Brunetti Partecipazione al gruppo sul Service Level Definition (SLD): A. Paolini Failover per alcuni servizi (CIC porttal GSTAT, SFT admin) @ CNAF
Partner Activity Review di EGEE Il 27 aprile c’è stata al CERN la Partner Activity Review (PAR-3) per la federazione italiana: https://edms.cern.ch/document/794168 La preparazione è stata piuttosto faticosa ma alla fine ne è valsa la pena perche’ il giudizio e’ stato molto positivo.
Introduction Slide da present. per PAR-3 IT federation 1 country 5 Partners: INFN ENEA SPACI-UNILE SPACI-UNINA SPACI-UNICAL 5 more RCs: Istituto Tecnologie Biomediche – CNR/BARI (LIBI Project) PERUGIA University Istituto Linguistica Computazionale CNR-PISA Scuola Normale Superiore – PISA ESA-ESRIN Slide da present. per PAR-3
14 linux (+ 96 AIX under certification) Resources IT federation resources: CPUs provided committed INFN about 4350 2000 ENEA 14 linux (+ 96 AIX under certification) 152 SPACI 135 128 Total about 4500 2280 STORAGE: 950 TB Disk Storage (and 240 more TB are being allocated) Tape Storage: 734 TB Slide da present. per PAR-3
VOs Supported VOs: 20 Global: atlas alice babar biomed cms cyclops 12 Regional: argo bio infngrid enea ingv gridit inaf theophys virgo pamela libi egrid 20 Global: atlas alice babar biomed cms cyclops dteam esr euchina euindia eumed geant4 gear lhcb magic ops zeus cdf compchem planck Slide da present. per PAR-3
Accounting DGAS (Distributed Grid Accounting System) è utilizzato sulla grid di produzione italiana per l’accounting delle risorse: le informazioni sono raccolte in un database (HLR) e possono essere aggregate in vari modi: la granularità arriva fino al singolo job eseguito sulla grid; la confidenzialità delle informazioni è garantita dall’utilizzo di vari livelli di autorizzazione per l’accesso agli Usage Record; l’architettura è completamente distribuita per assicurare flessibilità e scalabilità. Attualmente sono attive 12 HLR di primo livello ed una di secondo livello per l’aggregazione dei dati delle HLR di primo livello. E’ stata sviluppata una interfaccia tra DGAS ed Apel, e l’invio automatico al GOC dei dati del T1 e dei T2 è stato attivato.
Accounting Realizzata interfaccia web per l’accesso ai dati di accounting: Per accedere è necessario un certificato personale valido
Accounting HLRmon è stato sviluppato da: Stefano dal Pra (CNAF/PD) Giuseppe Misurelli (CNAF) Enrico Fattibene (CNAF) Felice Rosso (CNAF) Giuseppe Patania (TO) Federico Pescarmona (TO) Grazie anche agli sviluppatori di DGAS (A. Guarise e R. Piro) e a G. Patania e a R. Brunetti per l’enorme mole di lavoro per il controllo e la validazione di DGAS.
Alcuni dati: tutta la grid (1.1.07- 31.7.07)
Alcuni dati: CDF (giorni critici)
Alcuni dati: CDF (prima del 1 marzo)
Alcuni dati: CDF (dopo il 4 marzo)
Alcuni dati: grid, senza CDF (1.1.07- 31.7.07) JOB per site
Alcuni dati: grid, senza CDF (1.1.07- 31.7.07) CPU per day
Alcuni dati: grid, senza CDF (1.1.07- 31.7.07)
Alcuni dati: grid, senza CDF (1.1.07- 31.7.07)
Alcuni dati: tutta la grid (1.5.07- 31.7.07)
Alcuni dati: tutta la grid (1.5.07- 31.7.07)
Alcuni dati: LHC (1.1.07- 31.7.07)
Alcuni dati: LHC (1.1.07- 31.7.07)
Alcuni dati: LHC (1.1.07- 31.7.07)
Alcuni dati: Tier-1 (1.6.07- 31.7.07)
Alcuni dati: Tier-1 (1.6.07- 31.7.07)
Considerazioni MoU: già sottoscritto da: Bologna, Cagliari, Catania, Frascati Milano, Parma, Roma2, Torino in fase di sottoscrizione: Bari, Ferrara, Perugia, Roma3 sollevati problemi dai T2 di CMS problema di personale (sembra risolubile) a Firenze
Considerazioni Accounting: il controllo della correttezza dei dati di DGAS è stato lungo e faticoso (per I T2) e…. non finisce mai problemi nell’invio automatico (R-GMA funziona male!) insufficiente sensibilità da parte di (alcuni) site manager per l’accounting (tutorial…..) Necessario salto di qualità: maggiore cura a livello locale provare un nuovo meccanismo per l’invio automatico diminuzione PM per SA1 in EGEE3: necessario ridefinire attività (con JRA1/SA3/NA4)
Persone
Persone A queste bisogna aggiungere alcune persone che lavorano in altri progetti: Cristina Aiftimiei Stefano dal Pra .......... E, naturalmente, i site manager dei siti della grid di produzione
Cecchini: 4 meeting EuGridPma Richieste 2008: Missioni e consumo Sito persone/FTE Missioni Int (k€) Missioni Est. (k€) Consumo (k€) Note BA 3 pers., 1 FTE 5,0 4,5 2 BO 1,5 CA 2,0 CT 1 pers. 3,0 4 CNAF 7 pers, 6.5 FTE 6,0 37,5 FE FI 8,0 GE LE LNL MI 2 pers., 2 FTE Cecchini: 4 meeting EuGridPma NA 4 pers. PD 3 pers., 3 FTE 13,0 PG PR PI RM1 1 pers., 1 FTE RM2 RM3 TO 4 pers., 3 FTE 19,5 TS Totale 57,0 109,5 58
Richieste 2008: inventariabile sezione Richiesta (K€) note bari 4 server SRM (2.5), switch (1.5) bologna 12 6 nodi (sost. Hw obsoleto) cagliari catania 2.5 server SRM CNAF 50 25 nodi per experimental services ferrara 3.5 switch HP2848 firenze 6 2 TB disco legnaro 2,5 milano napoli perugia 1.5 switch parma 8 4 nodi pisa roma1 roma2 3 nodi + 2 TB (sost. Hw obsoleto) torino 8.5 server SRM (2.5), HLR (3), test HA (3) TOTALE 132,5
Richieste 2008: stazioni di lavoro sezione richiesta (k€) note bari 1.5 2 stazioni milano 3 rinnovo desktop padova 11 rinnovo PC pisa 2 svecchiamento desktop roma3 1 stazione di lavoro torino 4.5 3 stazioni lavoro Totale 23
Richieste 2008: TOTALE Sito Missioni Int (k€) Missioni Est. (k€) Consumo (k€) Inventariabile stazioni Totale sito BA 5,0 4,5 2 4,0 1,5 17,0 BO 12,0 15,5 CA 2,0 16,0 CT 3,0 4 2,5 14,0 CNAF 6,0 37,5 50,0 97,5 FE 3,5 7,0 FI 8,0 17,5 GE LE LNL 2,5 12,5 MI NA PD 13,0 11,0 32,0 PG PR 11,5 PI RM1 RM2 RM3 1,0 TO 19,5 5,5 39,5 TS 0,0 Totale 57,0 109,5 58 132,5 23,0 380