1 Computing di BaBar Fabrizio Bianchi Universita’ di Torino e INFN Sez. di Torino Roma, 20 novembre 2007
2 Sommario Overview del computing di BaBar Contributo INFN Attivita’ 2008 Previsioni per il
3 Overview del Computing di BaBar Attivita’ : Produzione: Prompt Reconstruction, Simulation Production, Skimming Analisi Distribuito su diversi centri: SLAC, IN2P3, Gridka, RAL-Manchester, Padova, CNAF SP utilizza anche GRID e farm di calcolo universitarie
4 PR: typical single run processing Hours after the end of run recording Run taking PC 2 Importing conditions at Padova ER 44 Exporting ROOT to SLAC Prompt Calibration a SLAC, Event Reconstruction a Padova
5 Simulation Production Sforzo distribuito su ~20 siti. Eventi generati vengono trasferiti a SLAC e qui skimmati e distribuiti ai centri di analisi Si sono prodotti fino a 260 Milioni di eventi / settimana
6 SP: contributo INFN ~10% del totale Farm di Roma (G. Cavoto, R. Faccini) INFN-GRID: E. Luppi, D. Andreotti (Ferrara), A. Fella (CNAF) Siti coinvolti: CNAF, Ferrara, Napoli, Padova, Catania, Bari, Perugia, Pisa. Server Xrootd per CDB e BKG installati a: CNAF, Ferrara, Padova, Pisa. ProdTools installati sulla UI (User Interface) del CNAF e integrati con l'ambiente GRID.
7 Skimming Gli eventi vengono selezionati in ~200 stream. Un evento puo’ essere selezionato in piu’ stream Fattore di espansione dei dati: 4-5 Deep Copy o Pointer Skim per ottimizzare dimensione dati e velocita’ di accesso Skimming a SLAC (~90%), Gridka, RAL-Manchester (su GRID), Padova (in background rispetto ad ER)
8 Farm di Padova Attivita’: ER e skimming Manpower: R. Stroili, P. Solagna, G. Castelli, A. Crescente + ER shifters Hardware: 330 nodi di calcolo: fino a 2 fb -1 / giorno (ER) 22 data servers: 31TB spazio disco Due librerie L700, capacita` 1400 cassette, fino a 560TB di dati Nuovo Hardware in arrivo: 30 macchine biprocessori quad core Una libreria da 500 slot Per le altre librerie: quattro drive LTO4
9 CNAF Netto miglioramento dei servizi. Downtime nel 2007 comparabili con altri centri Qualche preoccupazion per i lavori strutturali 2008 Attivita’: Analisi ed SP su GRID D-mixing osservato al CNAF Manpower: A. Fella, L. Ligioi + altro personale CNAF
10 CNAF SP accede ai working nodes via GRID, job analisi via LSF (N.B.: non ci sono wn riservati a BaBar) Hardware dedicato: 17 servers: databases, aree utenti, scratch, data import, software di esperimento 6 nuovi servers in arrivo per rimpiazzare macchine obsolete ~250 TB di spazio disco per i dati 150 TB aggiuntivi finanziati nel 2008
11 CNAF: uso della farm
12 Altri Contributi INFN Skim production: T. Cartaro (Trieste) Skim software: G. Marchiori (Pisa) Analysis software: A. Lazzaro (Milano) Data Quality Manager: S. Tosi (Genova) Run Quality: M. Pelliccioni (Torino) Operation Manager: FB
13 Decisioni e nuovi sviluppi Ci sara’ il reprocessing e la risimulazione dei dati di run1-6 Aprile-dicembre 2008 SP usera’ Geant4v8 + improvement ai generatori Phaseout di Objectivity quasi completo Risparmio sulle licenze
14 Objectivity Phaseout Status Fully migrated, and Objectivity no longer used in R22: Online “ambient” database (history of detector control values) Configuration database (running on mySQL in IR-2, read-only ROOT copies elsewhere) “Spatial” and “temporal” databases used in rolling calibrations ROOT read-only conditions database (CDB) is default for all applications at all sites, except: SLAC uses Objectivity for CDB in online, PC, and skimming Some scaling issues remain with the ROOT CDB for skimming To do: Understand scaling of ROOT CDB for skimming Deploy writable mySQL CDB in online, PC
15 Attivita’ fino a dicembre fb -1 test di release 24: entro fine novembre 60 fb -1 test di release 24: entro 15 gennaio Ricostruzione e simulazione dei dati di run7 (previsti 270 fb -1 ): in parallelo con la presa dati Bootstrap reprocessing dei primi ~10 fb -1 di run7: entro aprile Skimming run7: in parallelo con la presa dati Reprocessing e risimulazione di run1-6: aprile-dicembre 2008 Skimming run1-6: in parallelo con reprocessing Obbiettivo: dataset finale in tempo per le conferenze invernali 2009
Alta’ intensita’ di Analisi Dataset finale disponibile Migrazione di FTE da attivita’ di servizio ad analisi Compensa diminuzione membri della collaborazione Produzione prevista: Skimming sostanziale nel 2009 e piu’ limitato nel 2010 (nuove analisi) Limitata SP
? Attivita’ decrescente di analisi Le collaborazioni LEP stanno ancora pubblicando Dopo il 2011 si prevede che le attivita’ di analisi saranno supportate solo a SLAC
18 Computing Professional Accordo (stabilito < 1999): 6.5 OCF, 8 DOE, 8 non-DOE Meno corrispondente alla realta’ con il passare degli anni: Task effetivamente necessari differenti dalla lista originaria Contributo addizionale di SLAC (fino ad 11 FTE) Personale nei Tier Crescenti difficolta’ a riempire le posizioni necessarie a runnare il computing di BaBar (sia CP che Fisici) Revisione del meccanismo dei CP (G. Dubois-Felsmann, M. Morandin, R. Mount) presentato all’IFC di luglio 2007, approvato per il 2008
19 Computing Professional: 2007 Identificati i task necessari Alcuni nella lista tradizionale Altri nuovi Personale TierA ed altri ~10 FTE non inclusi
20 Computing Professional: 2008 ed oltre Proposta: 25% SLAC, 25% OCF, 50% head count Non ci sono costi aggiuntivi per l’INFN
21 Necessita’ hardware post 2008 Le attivita’ di produzione cessano nel 2008, salvo coda nel Si prevede una attivita’ di analisi ai livelli 2008 nel , a decrescere negli anni seguenti Sara’ sufficiente sostituire una frazione dell’hardware divenuto obsoleto All’IFC di febbraio verra’ presentato un modello per calcolare questi costi Ordine di grandezza 700 (2009), 450(2010), 300(2011) KUSD Per confronto, nel 2008 il costo e’ ~2700 KUSD
22 Contributo INFN Padova cessera’ il supporto di BaBar con la fine dello skimming CNAF continuera’ ad essere un centro di analisi CPU sono condivise Le necessita’ di spazio disco si ridurranno a TB dal 2010 (saranno 400 TB nel 2008) Stima (rozza) contributo INFN per il computing (in aggiunta al mantenimento del CNAF): 70 (2009), 50 (2010), 40 (2011) KUSD N. B.: A questi numeri vanno aggiunte le altre voci del CF
23 Conclusioni Ci stiamo preparando per ottenere il massimo dal run7 e produrre il campione finale di dati in tempo per le conferenze invernali del 2009 Prevediamo un intenso periodo di analisi nel ed una attivita’ decrescente a partire dal 2011 All’IFC di febbraio verra’ presentato un modello dettagliato per il calcolo dei costi