CCR 14-15/03/2006 Status Report Gruppo Storage CCR
GPFS Completata installazione sulle infrastrutture del Tier1: –600 nodi, 4 server con file system di 22 TB su una testa StorageTek Flexline connessa in FC Problemi: –integrazione della installazione con i sistemi automatizzati del Tier1 (quattor) –problemi intrinseci di sicurezza di GPFS Release installata: su kernel 2.4.x Eseguiti test preliminari di accesso al file system. Nelle prossime due settimane sono programmati test di prestazioni di accesso diretto al file system dalla intera farm
StoRM (SRM/GPFS) Rilasciata versione (fine gennaio), prevista la (migliorie, stesse funzionalita’) in settimana Sviluppatori nella task force (WLCG ed SC4) per l’interoperabilita’ con altre implementazioni (dCache e DPM) Testate le funzionalita’ principali SRM v2 (preallocazione, rilettura con pinning) sulla infrastruttura di GPFS al Tier1 (limitata ad 80 client) Entro due settimane saranno eseguiti test su larga scala (vedi GPFS) Da pianificare test StoRM-StoRM via WAN (installazione in corso a Bari) Richiesta disponibilita’ ad effettuare test di interoperabilita’ via WAN: Mi, LNL, Pi e Ba disponibili, accordi da prendere nella prossima settimana Osservazione importante: SC4 richiede SRM V1, mentre V2 e’ opzionale. StoRM non implementa la SRM V1 (che non verra’ sviluppata), quindi i siti di SC4 dovranno implementare dCache o DPM (eventualmente StoRM in affiancamento).
dCache Installata versione (upgrade da problematico per conversione database e LCG) al Tier1 (4 server, 50 TB via FC, 35 client), e Bari (3 server, 6 TB 3ware, 40 client) –problemi nell’upgrade per conversione db e successivo upgrade LCG –problemi evidenziati sotto carico prolungato su XFS, risoloti con upgrade kernel (2.4.32) Effettuati test sia con tool specifici per prestazioni ed apertura files che con job sviluppati a partire da un applicativo di CMS (saturazione della banda verso i server) Test su WAN (LNL-CNAF e Ba-CNAF): saturata banda Ba (100 Mbps), non LNL (fino a 400 Mbps): risuiltato da capire Test anche su link verso CERN e FNAL: saturazione verso CERN, con FNAL la latenza maggiore abbassa le prestazioni. Vanno ripetuti i test con LNL per identificare il problema (prossima settimana) Vanno eseguiti test sulla completa infrastruttura al Tier1 (da definire la tempistica) Si ritengono interessanti test write/read concomitanti
DPM Installazione minimale a BA, piu’ grande a LNL (1 server, 4 TB, 20 client), versione Testate le funzionalita’ SRM v2, che presentano diversi problemi (PrepareToGet non fa pinning, AbortRequest durante una preallocazione non rilascia lo spazio allocato se non dopo un restart del pool) sia a Ba che a LNL Test di prestazioni a LNL (quasi saturo il GE) con I/O sequenziale. DPM strategico per alcuni (tutti?) Tier2 –Mostrato interesse LNL, Mi, Pi, Na(*) e Ba a test di scala al Tier1 (da prendere accordi al workshop) –I test di prestazioni proseguiranno sui siti candidati Tier2 di Pi, LNL, Ba
Revisione tempistiche progetto realizzazione di tool di misura delle prestazioni di accesso allo storage sia diretto che attraverso interfaccia SRM realizzazione di un tool di verifica delle funzionalita’ delle implementazioni della interfaccia SRM per la versione 2 realizzazione di applicazioni simili a job di analisi dati di un esperimento LHC, finalizzate allo stress dell’accesso alla infrastruttura di storage test di misura di prestazioni e funzionalita’ in scala ridotta per le soluzioni di storage basate su dCache, DPM, StoRM/GPFS test di misura di scalabilita’ delle soluzioni, per le prestazioni e per le funzionalita’, ad una scala di ~1000 worker node su uno storage di qualche decina di TB test di misura di prestazioni e funzionalita’ sulla stessa scala ottenuti attraverso l’accesso allo storage da parte di job di tipologia simile ad una analisi dati di un esperimento LHC La tempistica deve essere necessariamente rivista dopo il workshop del 20/03/2006 (dipende da accordi con personale Tier1 e disponibilita’ delle loro risorse)
iSCSI Due settimane di ritardo –problemi di porting di tool di misura –anticipazione attivita’ valutazione prodotti in conto visione (occasione di avere un Promise VTrack M500i) in corso
Nuove attivita’ attivita’ in collaborazione con netgroup per valutare impatto configurazioni di TCP/IP sulle prestazioni (in particolare via WAN) –da discutere con netgroup alla prossima riunione del netgroup attivita’ in collaborazione con gruppo HA –interesse per ridondanza sui servizi di database e servizi di export (NFS, demoni SRM) –e’ attivita’ specifica di gruppo HA: il gruppo storage collaborera’ in quella sede (23 marzo la prima riunione del gruppo)