La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Grid.infn.it The INFN Grid Project Stato del Tier-2 di Catania Roberto Barbera Università di Catania e INFN Incontro con i.

Presentazioni simili


Presentazione sul tema: "Grid.infn.it The INFN Grid Project Stato del Tier-2 di Catania Roberto Barbera Università di Catania e INFN Incontro con i."— Transcript della presentazione:

1 grid.infn.it The INFN Grid Project Stato del Tier-2 di Catania Roberto Barbera Università di Catania e INFN Incontro con i referee di INFN Grid Catania,

2 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Sommario Stato del Tier-2: –Logistica e servizi; –Consumi elettrici; –Prestazioni in termini di disponibilità ed affidabilità; –Analisi dei problemi e loro soluzioni; –Nuovo sistema di monitoraggio e statistiche di utilizzo; –Confronto tra accounting locale e HLRMon; Stato acquisti con fondi s.j. 2008; Richieste su fondi s.j. 2009; Impianto fotovoltaico; Personale afferente al Tier-2; Conclusioni.

3 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Catania Computing Room (1/2) 3D Model of Catania Data Center Full Area: ~200 m 2 Area # 1 10 racks / 40 kW UPS/PDU Area # 2 80 kW UPS/PDU Area # 2 13 racks Area # 2 80 kW Air Cond. with ~110 kW external chiller External 350 kVA Diesel power generator

4 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Catania Computing Room (2/2) Area # 2 Area # 1 Security system Area # 2 Fire estinguisher system

5 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, RACK SE 1 Gbps 4 Gbps 10 Gbps GARR Catania Local Area Network SAN Area #1 Area #2

6 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Panoptes LAN Monitoring (basato su Nagios, NTOP, ecc.) Autori: R. Catania, E. Giorgio, G. Passaro, G. Ricciardi, G. Sava Esempio di sinergia Grid-Centro di Calcolo

7 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Consumi elettrici di Catania (INFN + COMETA) Il consumo annuale è pari a ~115 k; Esso è imputabile per il 60% allINFN e per il 40% a COMETA

8 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Ordine di spegnimento del Direttore

9 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, CPU e kSI2K per VO a Catania Sito di produzione INFN Grid Catania Sito TriGrid di INFN Catania

10 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Risorse pledged per il Da fine Maggio 2009 Catania ha ~18% dei kSI2K totali ~135 kSI2K hanno più di 4 anni !

11 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Profilo detà delle CPU Nessuna delle CPU di Catania è più giovane di 2 anni detà!

12 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Statistiche dei job di ALICE (1/2) (prese da MonaLisa: 1/10/08-4/9/09) 84.6% La frazione di job running a Catania è proporzionale alla frazione di kSI2K.

13 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, % Statistiche dei job di ALICE (2/2) (prese da MonaLisa: 1/10/08-4/9/09) 21.5%

14 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Availability del T-2 di Catania SLA DIP1DIP2 DIP4

15 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Reliability del T-2 di Catania SLA DIP1DIP2 DIP3 DIP4

16 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP1 – Problemi allSE (1/3) LSE ALICE::Catania::DPM viene commissionato alla fine di Febbraio 2008; Dopo circa un mese di utilizzo:

17 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP1 – Problemi allSE (2/3) Allinizio di Settembre 2008 lSE contiene il 44.2% di tutta la produzione relativa a PDC08 ma si riempie completamente e diventa inutilizzabile per successive produzioni (il numero di job a Catania diminuisce); A metà Novembre 2008, dopo lapprovazione da parte del Consiglio Direttivo dello sblocco del s.j. 2007, viene indetta la gara per acquistare dello storage aggiuntivo; A Dicembre 2008 uno dei disk server dello storage si guasta e diminuisce lavailability del Tier-2 (il GRIS di sito comincia a fare i capricci);

18 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP1 – Problemi allSE (2/3) A Gennaio 2009 viene consegnato lo storage aggiuntivo ma i driver giusti non sono disponibili per SL3 e passano alcune settimane per poterli avere e far partire loperazione di estendere la partizione GPFS; Lo storage viene ricommissionato solo a fine Gennaio 2009 ma si riesce comunque ad avere il 5.3% di tutta la produzione PDC09 (che, in assoluto, è comunque 3 volte più grossa di PDC08); Meno file sullSE di Catania comportano quindi anche meno job di analisi sul CE; Da allora, comunque, sorgono i problemi relativi allinterfaccia software tra DPM e xrootd, comuni anche agli altri grossi siti con molti accessi concorrenti.

19 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP2 – Problemi al CE A fine Febbraio 2009 si decide, per omogeneizzare il LRMS del Tier-2 e di COMETA, di fare lupgrade di LSF alla versione 7.0.3; Ciò ci ha fatto incappare nel bug 47245;47245 Dopo innumerevoli test (con lavailability del T-2 che andava giù!) viene trovato un workaround semi- automatico che permette al CE di tornare a funzionare; il bug è stato ufficialmente chiuso solo il 19 Agosto 2009!!

20 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP3 – Riconfigurazione delle policy di scheduling (1/2) Dopo lo spegnimento di parte delle macchine, fatto a fine Maggio 2009, e le critiche ricevute nellincontro del 12 Giugno 2009, viene decisa una nuova politica di allocazione delle risorse; Prima (uso della pre-emption per i job di ALICE e di OPS): La pre-emption libera immediatamente la CPU ma non la memoria e questo può portare a crash della macchina se il job sospeso ne occupava una grossa frazione; Inoltre, gli utenti possono stancarsi di vedere i loro job sospesi, cancellarli, e non voler più usare il Tier-2 di Catania.

21 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP3 – Riconfigurazione delle policy di scheduling (2/2) Dopo (assegnazione fissa di core a code relative a VO): –Un certo numero di cores sono stati assegnati in modo fisso ai job di ALICE mentre il resto è condiviso tra i job delle altre VO; –In tal modo quando un job viene eseguito sul WN trova tutta la memoria libera.

22 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, DIP4 – Problema allimpianto di raffreddamento dellarea #1 Lunedì 3 Agosto 2009, alle circa, lintasamento di un filtro dellimpianto di condizionamento dellarea #1, unito al cedimento di una guarnizione di teflon, causa una grossa fuoriuscita dacqua in sala macchine da un tubo ad alta pressione; Il sistema di controllo di APC manda lallarme immediatamente ma, quando il personale interviene (~20 dopo lallarme), ci sono già parecchie centinaia di litri dacqua per terra; si procede quindi allarresto di emergenza dellerogazione di energia elettrica; La sala macchine viene accuratamente asciugata ma lincidente comporta un fermo imprevisto di 3 giorni. Alla riaccensione, nessun danno viene registrato allinfrastruttura.

23 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Nuovo sito di monitoraggio del T-2 di Catania (http://grid.ct.infn.it/t2-monitoring)

24 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Statistiche di utilizzo (1/3) (monitor locale di LSF – ultimi 12 mesi) Il Tier-2 di Catania è il sito di INFN Grid che supporta in assoluto più VO.

25 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Statistiche di utilizzo (2/3) (monitor locale di LSF – ultimi 12 mesi) 114 anni di CPU in 1 anno; ~30% di efficienza; In linea con EGEE.

26 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Statistiche di utilizzo (3/3) (monitor locale di LSF – ultimi 12 mesi) È in corso un confronto tra i dati del monitoring locale e quelli pubblicati da HLRMon. Si vedano le successive tre slide.

27 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Analisi dei dati pubblicati da HLRMon (1/3) Il calcolo dei grafici di WCT e CPT di HLRMon sono basati sul valore della variabile SI00Mean: –SI00Mean GlueHostApplicationSoftwareRunTimeEnvironment: SI00MeanPerCPU Osservazione #1: a rigore, SI00Mean andrebbe pubblicato per coda (cioè per CE) mentre invece è attualmente ammesso un valore unico per tutto il sito; ciò può inficiare i dati di accounting anche sensibilmente; Tenendo conto delle macchine accese/spente e, quindi, dei core (192) e dei kSI2K (297) disponibili per ALICE, il valore di SI00Mean per il Tier-2 di Catania è, ad oggi, 1547; Erroneamente, sul BDII era pubblicato il valore 2000 che è stato corretto; Osservazione #2: gli attuali valori di fondo scala di HLRMon non tengono conto di assegnazioni statiche di core a VO, come avviene sul Tier-2 di Catania, e quindi sono misleading.

28 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Analisi dei dati pubblicati da HLRMon (2/3) (grafici aggiornati al 7/9/09) kSI2K-day CPT per VO/day Last 30 days

29 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Analisi dei dati pubblicati da HLRMon (3/3) (grafici aggiornati al 7/9/09) kSI2K-day CPT per VO/month Last year

30 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Sito TriGrid_Catania (1/2) Nel 2008 il sito TriGrid_Catania ha egregiamente contribuito alle produzioni di ALICE:

31 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Sito TriGrid_Catania (2/2) Per ragioni legate allesecuzioni delle altre applicazioni del progetto TriGrid VL, la versione di gLite installata sul sito TriGrid_Catania è stata congelata e, ad un certo momento, una modifica di AliEn lo ha reso inutilizzabile; Da una certa versione, AliEn non supporta più il GRIS ma solo il BDII; in AliEn 2.17, rilasciata durante lestate, S. Bagnasco ha generalizzato gli script allo scopo di consentire un supporto ai siti che usano ancora il GRIS; Adesso che il progetto TriGrid VL è terminato, il sito è sotto riconfigurazione per entrare a far parte di nuovo del Tier-2 di ALICE e si stat testando la patch della versione 2.17.

32 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Stato acquisti fatti con fondi s.j Con i 96 k (IVA inclusa) del fondo s.j sono stati acquistati: –N. 1 IBM DS4700 con 96 TB di spazio disco; –N. 2 server di front-end per GPFS IBM x3655; –N. 2 switch FC per SAN; –N. 1 switch CISCO GE; Lhardware è stato tutto consegnato a fine Luglio 2009: –Lo storage è già in fase di installazione con GPFS+SToRM+ xrootd; –Lunedì 14 Settembre il CISCO 4948 verrà collegato a 10 Gb/s al CISCO 4507 che funge da border router; –Maggiori dettagli saranno forniti durante la visita di oggi pomeriggio.

33 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Richieste su fondi s.j Sul fondo s.j si richiedono a Catania 110 k per lacquisto del seguente hardware: –135 kSI2K di potenza di calcolo (17.5 k); –58 TB di storage (52.2 ); –1 UPS Symmetra PX 48 kW (40 k); Lacquisto dellUPS si è reso necessario per potenziare larea #1 della sala macchine e procedere ad un improcrastinabile riordino dellhardware al fine di migliorare le performance di accesso ai dati: –Maggiori dettagli saranno forniti durante la visita di oggi pomeriggio.

34 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Impianto fotovoltaico (1/3) Lidea è quella di coprire il tetto del Dipartimento di Fisica e Astronomia con un campo fotovoltaico totalmente integrato:

35 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Impianto fotovoltaico (2/3) Superficie occupabile: ~2200 m 2 ; Angolo di azimut rispetto al Sud: 26°; Valore di occupazione della superficie: 8.5 m 2 per kWp; Potenza installata minima: 190 kWp –Perdite dovute agli ombreggiamenti: <6%; Producibilità minima: 1435 kWh/(kWp·anno) ossia poco più di 270 MWh/anno; Costo chiavi in mano stimato: 1 M, oltre IVA. Calcoli effettuati con Sole advanced 2.0 ed i dati di irraggiamento e le temperature medie mensili UNI10349.

36 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Impianto fotovoltaico (3/3) È stato ultimato il progetto preliminare di massima; È stato definito un possibile capitolato dappalto e sono stati informati sia la GE che gli Uffici competenti dellAC dellINFN; È stata richiesta allUniversità di Catania la concessione di utilizzo per 25 anni del tetto del Dipartimento di Fisica e Astronomia; giusto ieri è giunta comunicazione ufficiosa dellOK da parte dellUfficio Tecnico di UniCT.

37 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Personale afferente al Tier-2 (non è ivi compreso il gruppo di ricerca) Personale permanente: –Giuseppe Andronico (Tecnologo, responsabile del Centro di Calcolo, 30%). –Roberto Barbera (P.A., responsabile del T-2, 50%); –Patrizia Belluomo (CTER del Centro di Calcolo, 20%) –Giuseppe Platania (CTER del Centro di Calcolo, 50%); –Carlo Rocca (CTER del Centro di Calcolo, 20%); –Giuseppe Sava (CTER del Centro di Calcolo, 20%); Personale a contratto: –Salvatore Monforte (Art.23 fino al , stabilizzando, 50%); –Rosanna Catania (Art.2222 di COMETA dal 1/9/2009 fino al 30/6/2010, 100%); –Elisa Ingrà (Borsista INFN fino al , 50%); –Gianluca Passaro (Art.2222 di COMETA dal 1/9/2009 fino al 30/6/2010, 100%); –Alberto Pulvirenti (Ass. Ric., 30%); –Andrea Cortellese (Borsista INFN da 11/2009 per 2 anni, 20%); –Fabrizio Pistagna (Borsista INFN da 11/2009 per 2 anni, 20%); –Riccardo Rotondo (Borsista INFN da 11/2009 per 2 anni, 20%)

38 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Conclusioni (1/2) Il Tier-2 di Catania è il sito di INFN Grid che supporta più VO; Tra queste, ALICE non è quella che ha il modello di calcolo più semplice e scalabile (es.: una VObox per cluster!); Le prestazioni del Tier-2 di Catania sono proporzionali alle risorse di calcolo in esso disponibili ed al loro grado di obsolescenza; Le cause di alcuni problemi di affidabilità e disponibilità avuti nel corso del 2009 sono state individuate ed analizzate: in molti casi non sono riconducibili a problemi locali ma piuttosto a deficienze del middleware; soluzioni efficaci sono state trovate in tutti i casi nei più brevi tempi possibili; Le statistiche di utilizzo basate sul sistema di monitoring ed accounting locale sono in contrasto con quanto pubblicato da HLRMon: alcune cause sono state individuate ed è in corso unanalisi puntuale delle discrepanze;

39 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Conclusioni (2/2) Gli acquisti fatti con i fondi del s.j sono stati effettuati e lhardware è in fase avanzata di commissioning; Le richieste sui fondi s.j sono in linea sia con le necessità dellEsperimento che con quelle della sede locale; un Tier-2 non può considerarsi a costo zero sine die; Il personale permanente afferente al Tier-2 andrebbe potenziato; è urgente lassegnazione a Catania di almeno ununità di personale con contratto a tempo indeterminato (attualmente si può contare sul 50% di un Art. 23 stabilizzabile); Limpianto fotovoltaico è stato definito ma, quando verrà realizzato, non rappresenterebbe la panacea in quanto potrà coprire poco meno dei costi attuali legati ai consumi elettrici; Senza un apporto finanziario esplicito e costante da parte dellINFN, il Tier-2 di Catania è da considerarsi a crescita zero –(a meno degli sviluppi tecnologici riguardanti laumento di potenza di calcolo delle CPU a parità di potenza elettrica consumata).

40 Enabling Grids for E-sciencE Catania, Incontro con i referee di INFN Grid, Thank you very much! Any Questions ?


Scaricare ppt "Grid.infn.it The INFN Grid Project Stato del Tier-2 di Catania Roberto Barbera Università di Catania e INFN Incontro con i."

Presentazioni simili


Annunci Google