Aggiornamento sullo stato del Tier-2 di Catania Salvatore Monforte (salvatore.monforte@ct.infn.it) INFN Catania Responsabile Servizi di Calcolo e Storage del Tier-2 Incontro con i referee di ALICE Catania, 12.09.2012
Sommario Infrastruttura di base LAN e SAN Job timing Efficienze Attività future Richieste straordinarie urgenti Catania, Incontro con i referee di ALICE, 12.09.2012 - 2
Catania Computing Room 3D Model of Catania Data Center Area # 2 80 kW UPS/PDU Full Area: ~200 m2 Area # 1 10 racks / 40 kW UPS/PDU Area # 2 13 racks Nel 2010 è stato aggiunto in Area # 1 un secondo UPS/PDU da 48 kW, scalabile fino a 160 Area # 2 80+20+20 kW Air Cond. with~110 kW external chiller External 350 kVA Diesel power generator Catania, Incontro con i referee di ALICE, 12.09.2012 - 3
Catania LAN Area #2 Area #1 RACK RACK SAN RACK SE SE 4948 RACK RACK 1 Gbps 4507 4 Gbps 10 Gbps Area #1 GARR-X Catania Incontro con i referee di ALICE, 12.09.2012 - 4
Catania SAN (dopo la riconfigurazione del 20-26 Luglio) 10 Gbps 4948 4507 10 Gbps GARR-X Computing Farm LAN 1Gbps MTU=1500 prod-se-01 / xrootd server IBM DS4200 2Gbps trunk redundancy path GPFS 249TB LAN 1Gbps MTU=9000 Fiber Channel 4Gbps 2Gbps trunk aliserv0x 1 solo xrootd server (al momento) Catania, Incontro con i referee di ALICE, 12.09.2012 - 5
Test di I/O su GPFS con bonnie++ (v. 1.03e) A cluster scarico Catania, Incontro con i referee di ALICE, 12.09.2012 - 6
Job timing (Running – Saving) – Catania sites (dal 27/7 all’11/9) TriGrid_Catania Job di analisi Job di simulazione Avg = 197.4 min Avg = 704.6 min Catania, Incontro con i referee di ALICE, 12.09.2012 - 7
Job timing (Running-Saving) – Catania site only Catania (ultimi 12 mesi) Avg = 197.4 min Avg = 204.1 min Catania, Incontro con i referee di ALICE, 12.09.2012 - 8
Efficienza per ALICE – Catania sites (dal 27/7 all’11/9) TriGrid _Catania è diskless per ALICE Catania, Incontro con i referee di ALICE, 12.09.2012 - 9
Efficienza per ALICE – Catania site only (3/6-19/7 vs. 27/7-11/9) Prima Dopo Avg = 24.86 % Avg = 58.56 % Catania, Incontro con i referee di ALICE, 12.09.2012 - 10
Efficienza per ALICE (dal 27/7 all’11/9 – tutti i Tier-2) Catania, Incontro con i referee di ALICE, 12.09.2012 - 11
Efficienza per ALICE (ultimi 6 mesi – tutti i Tier-2) Catania, Incontro con i referee di ALICE, 12.09.2012 - 12
Efficienza per ALICE (ultimi 12 mesi – tutti i Tier-2) Catania, Incontro con i referee di ALICE, 12.09.2012 - 13
Correlazione tra efficienza e throughput 1 Gbps iotop di xrootd su Catania SE Catania, Incontro con i referee di ALICE, 12.09.2012 - 14
Conclusioni Le modifiche apportate alla configurazione della SAN e l’accesso a GARR-X a 10 Gbps hanno comportato un aumento dell’efficienza del Tier-2 di Catania di più di un fattore 2 nelle ultime 6 settimane; La correlazione tra efficienza e throughput ci suggerisce le seguenti ulteriori modifiche alla configurazione: Trunking delle interfacce di rete dell’SE di Catania verso il CISCO 4948 Aumento del numero di server xrootd (è già stata preparata una configurazione con 1 redirector e 8 server) È previsto un downtime nella settimana 17-21 Settembre per fare le suddette modifiche e rifare i test a farm scarica con diversi tool (iozone, fio, gpfsperf) I nuovi valori di efficienza saranno inviati ai referee ed eventualmente mostrati in una prossima riunione Catania, Incontro con i referee di ALICE, 12.09.2012 - 15
Richieste straordinarie urgenti Abbiamo la necessità di sostituire: 20 dischi dello storage (la parte non più coperta da servizio di assistenza e manutenzione) per un costo totale di circa 6.000 € (IVA inclusa) Cominciamo ad avere problemi a garantire la ridondanza del filesystem 30 moduli batteria dei due UPS più vecchi, per un costo totale di circa 20.000 € (IVA inclusa) Abbiamo un «time-on-battery» inferiore al minimo possibile per effettuare uno shut-down ordinato in caso di malfunzionamento del gruppo elettrogeno Se possibile, vista l’urgenza, si chiede di anticipare la spesa al 2012 Catania, Incontro con i referee di ALICE, 12.09.2012 - 16