Dip. di Fisica & INFN - Univ. Del Salento Review Calcolo CSN2 D. Martello Dip. di Fisica & INFN - Univ. Del Salento CSN2 Napoli 30-11-2009
Sommario Un po' di storia … La struttura di Calcolo INFN (LHC) I modelli di Calcolo di CSN2 e l’utilizzo delle risorse
Un po' di Storia … Tradizionalmente il calcolo degli esperimenti di CSN2 era considerato trascurabile rispetto ai costi dell’esperimento e non richiedeva impegni significativi in termini organizzativi. La problematica principale riguardava (e riguarda in molti casi tuttora) le simulazioni. Gia’ ai tempi dei primi esperimenti presso i LNGS (MACRO) il grosso dello sforzo era concentrato sulle simulazioni. L’avvento di esperimenti come VIRGO e ARGO ha aumentato la rilevanza del calcolo in CSN2. Molti esperimenti hanno iniziato a considerare il calcolo come una parte dell’esperimento stesso (CSN1) La nascita di LHC ha spinto INFN a riorganizzare le sue strutture di calcolo e a far nascere realta’ come il CNAF e i Tier2
Un po' di Storia … L’INFN ha spinto tutti gli esperimenti a calcolare al CNAF per quanto possibile fornendo le risorse CNAF gratuitamente alle CSN. Cio’ era possibile grazie a al fondo speciale di ~ 21.5 M€ che l’INFN aveva stanziato per il CNAF. Molti esperimenti di CSN2 vengono “motivati” a calcolare al CNAF. Nel 2007 ci si rende conto che il fondo non e’ sufficiente per soddisfare tutte le esigenze di LHC e dal 2008 le risorse aggiuntive da allocare al CNAF non-LHC devono essere a carico delle commissioni. Con il bilancio 2009 il fondo si esaurisce. Dal 2010 anche le risorse aggiuntive LHC vanno a carico delle commissioni (CSN1-CSN3) Dati i tempi tipici di una gara CNAF il collegio dei referee suggerisce all’INFN di istituire un fondo tampone (2 M€) per permettere al CNAF di gestire le gare in temi utili per LHC. L’INFN assegna per il 2010 2M€ “extra” per CNAF-LHC (+ BFactory?) Questo NON e’ il fondo tampone richiesto dai referee, ma il meccanismo parte ugualmente.
La struttura a Tier Inizialmente presenti e logicamente motivati i Tier3 scompaiono in Italia Tier3
La struttura a Tier Oltre ad un centro di calcolo regionale (Tier1) il modello di calcolo LHC prevede la creazione di alcuni centri di calcolo “minori” destinati all’analisi dati degli esperimenti. Questi centri (Tier2) sono associati allo specifico esperimento (per cui avremmo Tier2 di Atlas o di CMS anche fisicamente nella stessa sede). Nel modello di calcolo LHC tali centri sono dotati di potenza di calcolo e di disco, ma non di unita per l’archiviazione di massa (tape). INFN e le relative CSN coinvolte hanno deciso che la logistica per la realizzazione di questi centri non doveva gravare sulle commissioni. I centri sono stati realizzati con fondi di sezione, fondi universitari, progetti vari e contributi ordinari da dotazioni.
I Modelli di Calcolo di CSN2 Inquadrare i modelli di Calcolo degli esperimenti di CSN2 all’interno dell’infrastruttura messa a punto dall’INFN non e’ cosa banale. CSN2 ha esperimenti estremamente eterogenei con problematiche molto diverse situati in regioni geografiche lontane. Non tutti gli esperimenti sono riusciti a inserirsi proficuamente nel modello a Tier proposto da LHC. L’idea del calcolo distribuito, però, e’ stata utile in molte situazioni. In particolar modo si presta bene ad affrontare il problema delle simulazioni in molte tipologie di esperimenti: software di simulazione comune, installazione semplice, esperienza gia’ accumulata (una scuola?). Per molti esperimenti c’e’ tutt’ora la “volontà” di allocarsi le risorse in sede anche se non chiaramente necessarie ed a fornire con riluttanza dettagli che le giustifichino.
Status del CNAF
Status del CNAF
Il Piano per il CNAF
Chi Utilizza il CNAF
AMS2 Schema di Calcolo Attualmente l’esperimento non prevede l’utilizzo di GRID Struttura a Tier JFK CERN Ricostruzione e backup (Tier0) CASTOR CNAF CASTOR Master Copy e Simulazioni MonteCarlo (Tier1) Sez. Sez. Sez. Sez. Sez. Analisi finali (Tier3)
AMS2 Finanziamento (k€) 2008 2009 2010 CNAF 1 5 52 Altro <5 <5 <5 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 25 23 1613 Disco (TB) 9 8+9 7 Nastro (TB) 30 39.2 33.5
ARGO-YBJ Schema di Calcolo Uso di GRID per le simulazioni Tibet Pechino CNAF Ricostruzione, backup e Simulazione (Tier0) CASTOR Analisi ad alta statistica e Simulazioni (Tier2) Napoli Roma3 Sez. Sez. Sez. Sez. Sez. Analisi finali (tier3)
ARGO-YBJ Finanziamento (k€) 2008 2009 2010 CNAF 47 30 34 NA-RM3 30 30 15 Altro <10 <10 <10 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 150 309 2007 Disco (TB) 120 125 107 Nastro (TB) 380 320 286
MAGIC Schema di Calcolo L’esperimento usa saltuariamente GRID per le simulazioni Canarie Barcellona Ricostruzione e backup dei dati (tier0) CNAF MonteCarlo (Tier2) Sez. Sez. Sez. Sez. Analisi finali (Tier3)
MAGIC Finanziamento (k€) 2008 2009 2010 CNAF 4 19 0 Altro <5 <5 <5 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 80 69 5768 Disco (TB) 20 42 39 Nastro (TB) 30 47 22
FERMI Schema di Calcolo L’esperimento usa GRID per le simulazioni e la distribuzione dei dati SLAC Ricostruzione e backup dei dati (Tier0) CNAF Simulazioni MonteCarlo e analisi (Tier1) Sez. Sez. Sez. Sez. Sez. Analisi finali (Tier3)
FERMI Finanziamento (k€) 2008 2009 2010 CNAF 6 56 14 Altro 63 32 67 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 150 24 452 Disco (TB) 60 10 Nastro (TB) 40 0
PAMELA Schema di Calcolo Pamela utilizza la GRID per simulazioni e analisi I dati dalla russia arrivano al CNAF dove avviene il backup Russia CASTOR Ricostruzione e backup (Tier0) CNAF Sez. Sez. Sez. Sez. Le analisi e le simulazioni vengono eseguite in sezione anche attraverso GRID (Tier2)
PAMELA Finanziamento (k€) 2008 2009 2010 CNAF 6 37 3 Altro 5 43 55.5 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 70 56 1075 Disco (TB) 48 41 23.5 Nastro (TB) 48 44 40
VIRGO Schema di Calcolo Utilizzo di GRID per alcune analisi ad alto utilizzo di CPU Primo backup dei Dati a Cascina (Tier0) Cascina backup CASTOR GRID Lione CNAF Processamento e Analisi (Tier1) RM1 Sez. Sez. Sez. Sez. Sez. Nelle sezioni solo analisi finali (Tier3)
VIRGO Finanziamento (k€) 2008 2009 2010 CNAF 98 206 218 RM1 50 10 0 Altro 33 32 14 Risorse al CNAF nel 2009 Previsto Assegnato Usato Picco (solo CPU) CPU (kSi2k) 1000 303 2297 Disco (TB) 300 314 187.5 Nastro (TB) 300 163 155
Ricostruzione e backup (tier0) AUGER Finanziamento (k€) 2008 2009 2010 CNAF 0 0 57 LNGS 6 0 0 Altro 0 <5 <5 Argentina L’esperimento usa GRID per le simulazioni Lione backup Ricostruzione e backup (tier0) Simulazioni Monte Carlo e analisi intense (Tier1) CNAF Sez. Sez. Sez. Sez. Analisi finali (tier3)
OPERA Finanziamento (k€) 2008 2009 2010 Altro 31 40 48 Utilizzo di GRID molto difficile Sez. Sez. Sez. Scanning delle emulsioni e analisi finale (tier3??) Giappone CNAF Master Copy del DB delle emulsioni (tier0??) Lione
ICARUS Finanziamento (k€) 2008 2009 2010 Altro 18 0 <5 Approccio tradizionale. Un centro di calcolo presso la sede dell’esperimento piu’ risorse in sede per analisi finale. Non si prevede utilizzo di GRID LNGS Sez. Sez. Sez. Sez.
WARP Finanziamento (k€) 2008 2009 2010 LNGS 0 0 50 Altro 13.5 0 <5 Approccio tradizionale. Un centro di calcolo presso la sede dell’esperimento piu’ risorse in sede per analisi finale. Non si prevede utilizzo di GRID LNGS Sez. Sez. Sez. Sez.
Indagine 2007 LNGS Molti esperimenti richiedono di collocare le loro risorse di calcolo presso i Laboratori Nazionali del Gran Sasso. Questa tendenza può essere giustificata per gli esperimenti che sono al Gran Sasso. Si ritiene ragionevole che il Gran Sasso possa svolgere un ruolo importante per il calcolo per gli esperimenti di gruppo 2. Affinché cio’ sia realizzabile occorre che siano verificate alcune condizioni fondamentali: Disponibilità del Laboratorio a svolgere questo ruolo Disponibilità del personale Disponibilità delle infrastrutture (spazi, potenza elettrica, impianti di condizionamento, etc.) Disponibilità economica
CSN2 L’investimenti in Calcolo k€ 2008 2009 2010 CNAF CSN2 64 147 160 CNAF +Virgo 162 353 378 Altre sedi 295 233 300 Totale CSN2 359 (82%) 380 (61%) 460 (65%) Totale +Virgo 457 (65%) 586 (40%) 678(44%) “Costringere” gli esperimenti a presentare modelli di calcolo e a confrontarsi con altri anche nell’organizzazione del calcolo permette di ottenere significative economie ma anche di dare la giusta rilevanza all’analisi e gestione e dei dati e simulazioni introducendo dei protocolli e degli schemi che standardizzano molti processi di analisi. In passato alcuni progetti non hanno mai completato alcune analisi in quanto il lavoro era affidato alla buona volontà di qualche PhD che per la sua tesi iniziava e portava a termine un filone di analisi. In molti casi il lavoro terminava con la “scomparsa” del PhD. Spesso era difficile se non impossibile continuarlo anche se un nuovo studente era disponibile in un’altra sede. La sistematicità degli studi non era sempre soddisfacente.