6/1/2016ATLAS Milano1 Agenda :
6/1/2016ATLAS Milano2 Agenda : A)AGGIORNAMENTO SITUAZIONE RELIABILITY SITO -potrebbe essere utile discutere le nostre performance del mese di gennaio/febbraio/marzo : possiamo fare una analisi post-mortem dei problemi e capire cosa e' successo ? -e' corretta l'impressione che il nostro storage sia in qualche modo più’ fragile di altri ? L’hardware non e’ certamente di qualita’ elevata ma per noi ogni problema hardware si trasforma in una catastrofe globale. -La speranza era sempre stata che UN SOLO storage fosse responsabile di tutto. In realta’ almeno 3 storage hanno avuto problemi ( vero ? ). -Dobbiamo organizzare dei turni di monitoring con esperti 'on-call' per essere più' efficaci e rapidi nella risoluzione dei problemi ?
6/1/2016ATLAS Milano3 Agenda : B) AGGIORNAMENTO SITUAZIONE STORAGE -Se l’opzione transizione a DPM non e’ sensata, discussione sullo stato della riconfigurazione gpfs, stato delle migrazioni, etc Ci aspettiamo miglioramenti di performance/reliability ? E’ percorribile l’opzione di 1 filesystem per storage ( -> dpm like ? ) -La riorganizzazione fatta con il situ UP ha creato rallentamenti e timeouts con perdita di efficienza del sito. Per concludere le riconfigurazioni in atto più' velocemente dobbiamo chiedere un downtime 'lungo' ( diciamo 1 settimana, 1 mese, 2 mesi ?? aiuterebbe )? -stato messa in linea del nuovo LOCALGROUPDISK : questa secondo me e’ una priorita’. Potremmo pensare di tenere su LOCALGROUPDISK e le macchine proof/tier3 anche se il T2 e’ in manutenzione.
6/1/2016ATLAS Milano4 Agenda : C) AGGIORNAMENTO STUDI VELOCITA' TRASFERIMENTO -aggiornamento sugli studi di performance nei trasferimenti : si osservano dei miglioramenti dopo l'installazione dei nuovi griftp servers ? Ci sono altre operazioni che possiamo fare ? -la velocità' di scrittura ( 200 MB/s ) sembra essere il massimo consentito vista la configurazione gpfs che abbiamo ( vero ? ). -Cosa ci aspettiamo dalla ottimizzazione in corso ? Perché' i siti DPM viaggiano 3 o 4 volte più' veloci ? -si capisce perché' abbiamo problemi con alcuni siti in particolare ?
6/1/2016ATLAS Milano5 Agenda : D) DISCUSSIONE SVILUPPI FUTURI Approfittando del long shutdown 1 volevo affrontare tutte le questioni aperte nella prospettiva di un tier2 che dovra' lavorare ( ed espandersi ? ) per anni. Dobbiamo considerare l'ipotesi di una migrazione a DPM come gli altri Tier2 ? Abbiamo buffer ? Possiamo radere tutto a zero e ripartire ? -il nostro gpfs sembra essere più' fragile ( almeno con l'hardware E4 ) di dpm -il nostro gpfs sembra essere limitato in velocità' di trasferimento di dpm -al CNAF ce l'hanno e non hanno ( a quanto ne so ) questi problemi, ma l’hardware e’ di categoria superiore -come si configurerebbe l'analisi interattiva utenti con dpm ? -possiamo pensare un sistema misto dpm e gpfs ? -sarebbe possibile gestire una transizione di questo tipo ?