Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoRebecca Coppola Modificato 8 anni fa
1
Domenico Elia1 Calcolo ALICE: stato e richieste 2014 Domenico Elia Riunione CSN III / Torino, 17.9.2013 Commissione Scientifica III Torino, 17 Settembre 2013
2
Domenico Elia2Riunione CSN III / Torino, 17.9.2013 Calcolo ALICE Sommario Brevi note sullo stato del calcolo: raw data e MC 2012 (e 2013) modifiche alla politica di storage (ongoing) efficienza CPU (improving, ora a livello degli altri esp. LHC) stato dei siti Tier-2 italiani (ragioni di disuniformità comprese) prossima “Review dei Tier-2” (richiesta della GE) prospettive nuova call FP8 H2020 (e-Infrastucture) Richieste finanziarie 2014: ricognizione CPU e Storage disponibili, dismissioni richieste inventariabile per Tier-1 e Tier-2 altre richieste (centri minori e missioni) Costituzione comitato italiano calcolo ALICE (backup slides)
3
Domenico Elia3Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Dati raccolti nel 2012 (e 2013) Presa dati pp @ 8 TeV e p-Pb @ 5.02 TeV: ~ 300 M eventi pp min bias + rare triggers (high p T EMCAL) ~ 2 M eventi p-Pb min bias (pilot run) ~ 130 M eventi p-Pb a Febbraio 2013 (in conto “2012”) Volume dati e storage: ~ 1.65 PB RAW data trattamento standard: custodial copy su tape al Tier-0 replica ai Tier-1, solo su disco Ricostruzione e MC: completa ricostruzione (pass2 e 3) di tutti i dati p-Pb 32 cicli MC p-Pb disponibili (~400 M evts, vari trigger e generatori) 7.5 PB since start of LHC
4
Domenico Elia4Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Modifiche alla politica di storage Obiettivo: ridurre impiego di spazio disco risorsa critica, ancor più in prospettiva degli incrementi futuri obiettivo non facile, almeno nel modello di calcolo ALICE Politica in atto da Giugno 2013: riduzione delle repliche ESD e AOD (sia data che MC): 2 x ESD e 2 x AOD (in precendenza 3 x) ricognizione ed eliminazione repliche di produzioni obsolete riduzione a singola replica di produzioni “abbastanza vecchie” Condizioni per corretto funzionamento del x2 replica: efficienza degli SE (altrimenti perdita di analysis performance) spostare gran parte dell’analisi su AOD
5
Domenico Elia5Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Impiego della Grid 2012-2013
6
Domenico Elia6Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Efficienza CPU Efficienza migliorata nel corso dell’ultimo anno: interventi a basso livello su data buffering migrazione attività da end-user (analisi caotica) su “LEGO trains” quality checks sugli Analysis Tasks, uso di AOD etc p-Pb data taking aumento attività di analisi caotica riduzione efficienza ~10% (atteso anche in coincidenza di conferenze maggiori) Performance soddisfacente Essenzialmente a livello degli altri esperimenti ad LHC
7
Domenico Elia7Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Efficienza siti italiani: Tier-2 Andamento generale Tier-2 riflette quello complessivo Disuniformità in gran parte comprese, ora ridotte: configurazione storage elements (servers GPFS XROOTD) forte correlazione con la disponibilità di storage e dati recenti ottimizzazione e continuo monitoraggio resta tra gli obiettivi e.g. Bari: alto livello di saturazione del disco Catania: ridotto storage (e ridotta CPU) Variazioni principalmente dovute alla tipologia di jobs (analisi caotica/organizzata/MC) e, da sito a sito, alla disponibilità dei dati
8
Domenico Elia8Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Prospettive breve/medio termine Attività prevista (in corso) 2013-2014: proseguimento analisi, in primis dati pp 2012 e p-Pb 2013 reprocessing dati 2010-2011 (pp e Pb-Pb), nuova calibrazione applicazione nuova politica storage, miglioramento efficienza definizione nuovo CM (progetto O 2 ), TDR calcolo (Ottobre 2014) Specifico sul fronte italiano: studi di fisica per upgrade (TRD ITS) proseguimento attività di monitoraggio dei Tier-2 attività di sperimentazione con le Analysis Facilities (To, Ts) preparazione documento per review Tier-2 (next slide) contributo partecipazione call e-Infrastucture FP8 (next to next)
9
Domenico Elia9Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Review dei Tier-2 Richiesta della GE il 3/9 ai responsabili calcolo LHC: redigere un documento di max 10 pagine per sito “in collaborazione con i responsabili di sito, di concerto con i direttori delle Sezioni coinvolte” da completare entro il 15 Novembre pv Contenuto: Storia del Tier-2 e sue particolarità (sinergie etc) Dettaglio risorse, infrastutture, funzionamento e performance Sostenibilità per il 2015 e oltre Risorse umane, eventuali criticità etc Termine della review atteso per Febbraio 2014
10
Domenico Elia10Riunione CSN III / Torino, 17.9.2013 Stato del calcolo in ALICE Progetti europei del FP8 (H2020) Nuova call FP8 (Horizon 2020): Excellence Science, Industrial Leadership, Societal changes per HEP partecipare sarà probabilmente più difficile che in FP7 bandi previsti per Dicembre 2013 Progetti sulla call per e-Infrastructure (call 3): possibilità di far finanziare una parte dei progetti di calcolo forte interesse del CERN impatto sul calcolo WLCG in futuro aspetti promettenti (di interesse per ALICE): Cloud Computing, Long-term data preservation, Centers of excellence etc iniziativa INFN: gruppi di lavoro all’interno del CdGA per condurre “un’analisi preliminare dell’interesse scientifico e tecnologico dell’INFN […], esaminando le possibilità concrete di poter competere nelle call”
11
Domenico Elia11Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Situazione CPU e DISCO Italia Ricognizione delle risorse: esercizio complicato ma indispensabile: diverse fonti (Monalisa, spreadsheets su Google-Docs etc) necessario per valutazione risorse obsolete, scambio con i referees grazie ai responsabili dei siti per la collaborazione! CPU attualmente in produzione: Tier-1: 18599 HS06 (pledge 2013) Tier-2: 28163 HS06 + 1960 Cagliari (pledge 2013: 30000) Storage: Tier-1: 1700 TB DISCO / 3700 TB TAPE (pledge 2013) Tier-2: 1699 TB + 70 Cagliari (pledge 2013: 2400 TB) + ~650 TB dalla gara 2013 (prossima slide)
12
Domenico Elia12Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Situazione CPU e DISCO Italia Assegnazione 2013: solo disco e overhead ai Tier-2: 310 k€ (850 TB + 30 k€ ov.) anticipo acquisto a TO, già in produzione: 202 TB (fine 2012) gara 2013 (restanti ~650 TB): gara congiunta ALICE + CMS (~350 k€ in tutto, ~230 k€ per ALICE) necessaria gara europea (tempi un po’ più lunghi) capitolato in GE in pochi giorni, risorse disponibili entro fine anno (hope) ottimo risultato di una gara recente (Luglio) per ATLAS (DELL) ALICE: 3 blocchi da ~240 (+120-240?) TB (BA, PD-LNL e CT) restanti 10 k€ per completamento quota TO quota overhead: ~30 k€ per rete, server aggiuntivi etc in corso valutazione con i siti, storni (da TO) entro fine mese
13
Domenico Elia13Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Situazione CPU e DISCO Tier-2 Situazione complessiva attuale Tier-2 (+ Cagliari*): CPU:30123 HS06 (incluso dismessi in linea: 35751 HS06) DISCO: 1769 TB(2030 TB) BariCatania LNL- Padova TorinoCagliariTotale HS06 8984311082647805196030123 TB 450 258357 634701769 HS06/TB 20.0 12.123.1 12.328.017.0 Full 95.4%82.9%96.0%87.3%98.5% In produzione (escluso obsoleti 2013) Aprile 2013 * Risorse di Cagliari incluse poiché fanno parte del pledged. Altri centri locali, senza risorse pledged: Bologna e Trieste.
14
Domenico Elia14Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Dismissioni 2014 (e 2015) Anno di dismissione BariCatania LNL- Padova TorinoCagliariTotale HS06 2014741620351168981011600 TB 201492 032 720196 HS06 201515681075128014008406163 TB 2015300 065 8150496 Situazione complessiva Tier-2 nel 2014*: CPU:30123 – 11600 = 18523 HS06 DISCO:1769 + 648 – 196 = 2221 TB * Nell’ipotesi di dismettere (e non sostituire) quanto va obsoleto nel 2014. In neretto: numeri ripresi nella tabella richieste slide 17.
15
Domenico Elia15Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Sintesi RRB di Aprile 2013 Crescita 2013-2014 entro 10%, sensibile aumento del disco nel 2015. Previsioni 2015 da rivedere: esame dettagliato RRB Ottobre 2013. Fair share 2014: 19.5% per CPU e DISCO ai T1/T2 (21.6% nel 2013)
16
Domenico Elia16Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Richieste 2014: Tier-1 CPU Tier-1 (HS06) DISK Tier-1 (TBn) Pledged – dismiss. T1: vedi global plan ** Valutazioni ALICE 2014 214501970 Delta 13328219 Stima costo (k€) 159.976.7 Overhead T2 (k€) Totale (k€) 236.6 Stima costi: 12 € / HS06 e 350 € / TBn Richiesta per Tier-1 sottomessa centralmente dal CNAF * Dismissioni e calcolo risorse: vedi piano interno del Tier-1 (prossime)
17
Domenico Elia17Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Richieste 2014 D. Lucchesi, CSN3 18.6.2013 Needs 2014 (fair share 19%)
18
Domenico Elia18Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Richieste 2014 D. Lucchesi, CSN3 18.6.2013 Needs 2014 (fair share 19%)
19
Domenico Elia19Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Richieste 2014: Tier-1 e Tier-2 CPU Tier-1 (HS06) DISK Tier-1 (TBn) CPU Tier-2 (HS06) DISK Tier-2 (TBn) Pledged – dismiss. T1: vedi global plan 185232221 Valutazioni ALICE 2014 214501970 370502496 Delta 1332821918527275 Stima costo (k€) 159.976.7222.396.3 Overhead T2 (k€) 40.5 Totale (k€) 236.6359.1 Stima costi: 12 € / HS06 e 350 € / TBn Overhead Tier-2: 6% CPU + 5% DISCO (rete) + 7% del totale (server aggiuntivi) Richiesta per Tier-2 sottomessa presso la sede di Bari Richiesta locale Trieste (per AF): 16 k€ (dettaglio slide 20)
20
Domenico Elia20Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Richieste 2014 nel DB: Tier-2 Dismissioni CPU (HS06)DISK (TBn)Richiesta (k€) Bari741692121.0 Catania2035024.5 Padova-LNL11683225.5 Torino9817237.0 Crescita netta totale Tutti i Tier-2692779111.0 Overhead Tutti i Tier-240.5 Totale richieste359.5 Dettagliate dismissioni per sito e crescita netta/overhead totale ALICE: suggerito per gestire più facilmente il contributo ReCaS (backup)
21
Domenico Elia21Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Contributo ReCaS (Tier-2) 2014 CPU (HS06)DISK (TBn) Pledged – dismiss. 185232221 Valutazioni ALICE 370502496 Delta 18527275 Stima costo (k€) 222.396.3 Totale (k€) 318.6 ReCaS (k€) 256.4 CSNIII (k€) 62.2 risorse per la crescita netta ALICE e le dismissioni dei siti BA, CT a carico CSN3: dismissioni per i siti non-ReCaS (TO, PD-LNL) e overhead Dettaglio richiesta Tier-2: CPU + DISK:318.6 k€ Overhead: 40.5 k€ Totale:359.1 k€ da ReCaS per CPU + DISK:256.4 k€ da CSNIII:102.7 k€
22
Domenico Elia22Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Altre richieste: AF e missioni Richieste AF Trieste: potenziamento AF (analisi parallela interattiva, via PROOF) CPU (quad-node, 2 CPU x 6 core = 48 core):7 k€ DISCO (1 TBn x core = 48 TBn):9 k€ Missioni (Bari, resp. nazionale): Missioni (Torino, deputy): 8.5 k€ 17.5 k€
23
Domenico Elia23Riunione CSN III / Torino, 17.9.2013 Backup slides
24
Domenico Elia24Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Contributo ReCaS (Tier-2) 20142015 CPU (HS06)DISK (TBn)CPU (HS06)DISK (TBn) Pledged – dismiss. 185232221308872000 Valutazioni ALICE 370502496 390003140 Delta 1852727581131140 Stima costo (k€) 222.396.397.4398.8 Totale (k€) 318.6496.2 ReCaS (k€) 256.4 306* CSNIII (k€) 62.2 190* * Massimo sfruttabile in ipotesi di pledge tutto a CT (solo rimpiazzi altrove) Considerata la rilevante crescita netta 2015, sensibile sbilancio tra i siti.
25
Domenico Elia25Riunione CSN III / Torino, 17.9.2013 Richieste finanziarie Risorse acquisibili con ReCaS Qualche dettaglio (anche G. Carlino @ CSNI + Pisa 3 Maggio): parte della attrezzature (“gara unica”: 1984 k€) per LHC risorse CPU e DISCO “gara unica” nei siti T2 ALICE: BA (ALICE e CMS): 457 k€ CT (ALICE): 441 k€ assunzione per 2014: risorse “ALICE-all” + dismissioni CT CT 8962 HS06 + 79 TB 107.5 + 27.7 k€ = 135.2 k€ dismissioni BA BA 7416 HS06 + 92 TB 89.0 + 32.2 k€ = 121.2 k€ per 2015 discorso prematuro (RRB Ott, risparmi gara, altri PON ?) : BA: 457 - 121 (ALICE 2014) - 205 (CMS 2014) = 131 k€ CT: 441 - 135 (ALICE 2014) = 306 k€ 256.4 k€
26
Domenico Elia26Riunione CSN III / Torino, 17.9.2013 Attività in ALICE durante LS1: completare TRD (copertura da 60 100%) installazione DCAL (opposto in azimuth al calorimetro esistente) modifica TPC readout speed (3 kHz in pp, 300 Hz in Pb-Pb) Running scenario 2015-2017: standard years: Aprile-Novembre, pp + Pb-Pb (o p-Pb) Modifiche ai parametri del CM: aumento track multiplicity (maggiore energia e pileup) conseguente aumento CPU ricostruzione e raw data size ~25% stima risorse 2015 in discussione RRB Ottobre 2013 Prospettive Calcolo ALICE Prospettiva 2015-2017
27
Domenico Elia27Riunione CSN III / Torino, 17.9.2013 Prospettive Calcolo ALICE Previsioni post-LS2: nuovo CM Aumento consistente del flusso di dati (~10 2 ) contenimento delle risorse (calcolo e storage) necessarie: necessità di ridisegnare interamente il framework di calcolo Concetti ispiratori: Cloud computing Online + Offline (O 2 )
28
Domenico Elia28Riunione CSN III / Torino, 17.9.2013 Prospettive Calcolo ALICE Previsioni post-LS2: nuovo CM Aumento consistente del flusso di dati (~10 2 ) contenimento delle risorse (calcolo e storage) necessarie: necessità di ridisegnare interamente il framework di calcolo Concetti ispiratori: Cloud computing Online + Offline (O 2 ) Progetto O 2 : avviato a Marzo 2013 organizzato in CWGs integrerà DAQ/HLT/Offline, TDR ad Ottobre 2014
29
Domenico Elia29Riunione CSN III / Torino, 17.9.2013 Rivoluzione al Tier-0 (CERN): divisione Online/HLT/Offline perderà in parte significato ricostruzione in parte effettuata online in ambiente eterogeneo (FPGA, GPU, Multi-core CPU) e comunque tutta al CERN Attività ai siti esterni (Tier-1 e Tier-2) : simulazione MC e analisi (più possibile organizzata) in corso R&D su Cloud e Analysis Facilities “on demand” Principali novità in AliRoot 6.x: dovrà girare su sistemi eterogenei, almeno in parte (GPU etc) dovrà supportare rivelatori che operano in readout continuo dovrà supportare la fast simulation dovrà essere più veloce (x10) e usare meno memoria Prospettive Calcolo ALICE Previsioni post-LS2: nuovo CM
30
Domenico Elia30Riunione CSN III / Torino, 17.9.2013 Proposta Comitato Calcolo Motivazione e contenuto Riunione gruppi INFN del 14.3.2013: mandato al nuovo responsabile nazionale (triennale) richiesta istituzione di un gruppo per la gestione del calcolo: su proposta del nuovo responsabile nazionale e dei suoi predecessori supporto alla gestione e verifiche nell’ambito del calcolo italiano ALICE suggerito dal crescente numero di ambiti di azione e rappresentanza Contenuto della proposta: in agenda: https://agenda.infn.it/conferenceDisplay.py?confId=6554 https://agenda.infn.it/conferenceDisplay.py?confId=6554 grazie a Massimo e Alberto per la collaborazione! punti essenziali: richiamo dei diversi ambiti in cui opera il responsabile calcolo proposta di composizione del comitato calcolo deputy e coordinatore riunioni del comitato: finalità e frequenza, ipotesi preliminari
31
Domenico Elia31Riunione CSN III / Torino, 17.9.2013 Proposta Comitato Calcolo Ambiti di azione nel Calcolo Rapporti in ordine sparso di impegno richiesto: coordinamento computing ALICE al CERN Tier-1 e Consiglio di Gestione (CNAF) Tier-2 (BA, CT, PD-LNL, TO) e altri siti locali (BO, CA, TS) CCR e Consiglio di Gestione Allargato progetti nazionali/europei altri esperimenti ad LHC coordinamento ALICE Italia e CSN3 Particolare rilievo attuale ed in prospettiva: interazione con progetti PON/PRIN per risorse calcolo LHC coinvolgimento negli sviluppi legati al nuovo CM
32
Domenico Elia32Riunione CSN III / Torino, 17.9.2013 Proposta Comitato Calcolo Composizione e ruoli ALICE INFN Computing Board (AICB): composizione: Responsabile nazionale:D. Elia (chair) Deputy:S. Bagnasco Coordinatore Tier-2:S. Piano Membri ex-officio:R. Nania (resp. nazionale ALICE) M. Masera, A. Masoni (prec. resp. Calcolo) R. Barbera, A. Dainese, D. Di Bari (resp. Tier-2) altri membri:rappresentanti di ciascun istituto (referenti calcolo) referenti calcolo: responsabili siti per Tier-2 e centri locali Deputy e Coordinatore Tier-2: coinvolgimento su tutto il progetto, focus preliminare: S. Bagnasco: CdG e CdGA Tier-1, interfaccia CERN e siti italiani S. Piano:Coordinamento Tier-2 e centri locali minori
33
Domenico Elia33Riunione CSN III / Torino, 17.9.2013 Proposta Comitato Calcolo Riunioni e finalità Riunioni AICB: convocate con frequenza trimestrale (o quadrimestrale) impiego di una mailing list dedicata principali temi, in ordine sparso: discussione e aggiornamento informazioni dal CB ALICE discussione e aggiornamento attività di sviluppo nuovo CM verifica stato e risorse dei siti con relativa pianificazione discussione richieste e interazione con progetti PON/PRIN verifica piano di acquisizione/distribuzione risorse e gestione gare AICB allargato: esteso a tutti coloro che operano nei siti: alice-it-t2@lists.infn.italice-it-t2@lists.infn.it riunioni più frequenti (bi-settimanali) consuetudine già sperimentata, da consolidare
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.