Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoFranca Carrara Modificato 8 anni fa
1
COMMENTI SU RICHIESTA ESIGENZE DI RETE 2015-2018(-20) IN CSN3 Rosario Turrisi Riunione CCR, Roma, 8 settembre 2014
2
ESPERIMENTI IN CSN3 2 2 4 4 3 3 1 1 636 ric/tec (+tecnici), 477.7 FTE (0.75 FTE/pers) ALICE Studio della produzione del QGP in collisioni tra ioni pesanti ultrarelativistici EXOCHIM Collisioni tra Ioni pesanti stabili ed esotici alle energie del tandem ed intermedie Struttura iperfine dell’idrogeno muonico e raggio e.m. del protone FAM-RD 8/9/2014ROSARIO TURRISI 2
3
ALCUNE OSSERVAZIONI FTE: 478/211 TOT/GRID Finanziamento 2013 (k€): ALICE: 330, altri: ~108, tra cui PANDA AGATA/GAMMA JLAB12 EXOCHIM 31 25.5 21 14 =21±29… 142 1300 220410 198 125 Gruppi di varie dimensioni: dai 2.3 FTE di ULYSSES ai 142 di ALICE …inseriti in collaborazioni di varie dimensioni (da alcune unità alle 1330 di ALICE)! La dimensione della collaborazione non è un indice della strategia di calcolo Spesso I piccoli gruppi collaborano mettendo a comune idee, risorse umane, hardware Quadro frammentato, diversi linguaggi, paradigmi, filosofie di storage… …ma funziona (quasi) tutto molto bene! 8/9/2014ROSARIO TURRISI 3
4
ESIGENZE DI RETE DI ESPERIMENTI DI PICCOLA/MEDIA TAGLIA Piccola/media taglia ≅ 20 FTE – la maggior parte delle sigle Tipico workflow dell’esperimento: progetto (tempi variabili) eventuale costruzione/upgrade/adattamento/commissioning del rivelatore (da qualche mese a qualche anno) misure (1-2 settimane ciascuna, ~5-6 per anno) copia dati su supporti di backup vari (tipicamente dischi esterni) da ~0.1 ~1 TB per misura (raw data) trasferimento dei raw data e/o dati ridotti tra le sedi partecipanti alla misura (~5 sedi tipicamente) Nessuno ha presentato richieste particolari, se non riguardanti: la possibilità di accedere ai dati da remoto (copia) la possibilità di fare analisi/grafica (realtime) da remoto la possibilità di utilizzare il sistema x col software y in maniera ‘’stabile’’ 8/9/2014ROSARIO TURRISI 4
5
ESIGENZE DI RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino GAMMA/AGATA JLAB12 PANDA 8/9/2014ROSARIO TURRISI 5
6
AGATA ADVANCED GAMMA TRACKING ARRAY 180 hexagonal crystals3 shapes 60 triple-clusters all equal Inner radius (Ge) 23.5 cm Amount of germanium 362 kg Solid angle coverage 82 % 36-fold segmentation 6480 segments Singles rate ~50 kHz Efficiency: 43% (M =1) 28% (M =30) Peak/Total:58% (M =1) 49% (M =30) 6660 high-resolution digital electronics channels Detectors operated in position-sensitive mode Digital EDAQ + Pulse Shape Analysis + -ray Tracking Coupling to ancillary detectors for added selectivity 8/9/2014ROSARIO TURRISI 6 Stesso gruppo italiano di GAMMA/GALILEO, esperimenti in fase di presa dati e/o upgrade
7
Event Builder Tracking Physical Analysis Merge Data Readout FE Electronics Ancillary Detector(s) Preprocessing PSA FEE Readout Preprocessing PSA FEE Readout Det#1Det#2Det#N············Det#3 ············ * ~ 95 % of CPU time spent in the PSA * * Disk Write Rates * Raw ~100 MB/s (total) * PSA ~5 MB/s (total) * Tracked ~10 MB/s Each box represents one task managed by the ADA distributed computing system NARVAL (or by off-line C++ emulators) Data processing implemented in C++ and loaded as shared libraries in the NARVAL environment Data formatting and flow managed by the adf C++ library STRUCTURE OF COMPUTING SYSTEM Local Level (detectors don’t know of each other) Global Level 8/9/2014ROSARIO TURRISI 7
8
8/9/2014ROSARIO TURRISI 8
9
AGATA: ESIGENZE DI STORAGE/RETE Le esigenze di calcolo di AGATA sono legate all'analisi della forma dei segnali prodotti dai rivelatori al germanio (Pulse Shape Analysis, PSA) un'analisi abbastanza pesante in termine di CPU effettuata in tempo reale dalla farm di acquisizione (a Legnaro/GSI/GANIL), composta da ~30 macchine per un totale di 250 (LNL) o 500 (GSI) cores Se la PSA in tempo reale è stata effettuata correttamente, le necessità di calcolo successive sono abbastanza modeste Maggior impegno attuale: gestione dei 150 TB/y (dati raw) Soluzione attuale: storage su GRID (VO AGATA): 350 TB @ Lione, 150 TB @ CNAF La singola misura produce ≤ 30 TB raw data, previsti ~300 TB in 2.5 y Trasferimento a Lyon+CNAF Successivo trasferimento verso LNL, PD, MI, FI Analisi/display da remoto, accesso dei raw da tutte le sedi Non dichiarano attualmente particolari problemi, auspicano un’alta reattività dei sistemi alle attività del punto precendente 8/9/2014ROSARIO TURRISI 9
10
ESIGENZE DI STORAGE/RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino GAMMA/AGATA JLAB12 PANDA 8/9/2014ROSARIO TURRISI 10
11
JLAB12: GLI ESPERIMENTI Upgrade in corso per permettere a CEBAF di raggiungere 12 GeV (2x) 3 sale sperimentali con rivelatori dedicati + una quarta in costruzione Hall A polarimetro + spettrometri, in programma estensione range cinematico, alta luminosità Hall B target polarizzato + spettrometro a grande accettanza CLAS CLAS12 per 10 35 cm -2 s -1 Hall C misure in coincidenza ad alta risoluzione con 2 spettrometri, HMS+nuovo ad angolo variabile Hall D misure di brehmsstralung: γ, PID, coincidenza con particelle cariche (nuova sala) 8/9/2014ROSARIO TURRISI 11
12
JLAB COMPUTING MODEL Modello attuale, da rivedere per JLAB12 Una analisi: ~400 GB su disco ( + ~ 50% per simulazione) La simulazione è distribuita al 50% tra JLAB e farm locali ‘’T0’’ + ‘’T1’’ ad es. a Norfolk I dati (latency da alcuni anni ad alcuni mesi, JLAB12->15y) sono elaborati a JLAB -> produzione dei ‘’dst’’ 3 mesi presa dati -> ~3 mesi ricostruzione comnservata la possibiltà di upstream (~10% dei dati da riprocessare) dst= 4-impulsi + banche dei singoli rivelatori Copia locale dei dst (occupano ~ 1/10 dei raw) Localmente: ‘’filtratura’’ dei 4-impulsi per l’analisi finale Attualmente si discute se fare il salto direttamente alla Cloud Saltare la transizione a Root e ai protocolli GRID o GRID-like CLOUD, JAVA-based future? 8/9/2014ROSARIO TURRISI 12
13
JLAB12 – IN SINTESI Profilo temporale: inizio presa dati nel 2015, in maniera consistente, prospettiva di 5 anni con aumento 3x nel 2016, 1.1x nel 2017, poi stabile Modello produzione: dati conservati e ridotti a JLAB, trasferimento JLAB-Italia (Ge, LNF, LNS) di DST e MC trasferimento interno modesto Stima della banda massima, nelle ipotesi di sopra, più: trasferimento in 6 mesi nessuna fattore di sicurezza/efficienza indicato il valore medio 8/9/2014ROSARIO TURRISI 13 AnnoRaw data (TB) DST (TB) Frazione DST trasferiti DST trasferiti (TB) Banda (Mb/s) 20158202500.25026 201623007000.17038 201725507700.17640 201825507700.17640
14
ESIGENZE DI STORAGE/RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino GAMMA/AGATA JLAB12 PANDA 8/9/2014ROSARIO TURRISI 14
15
PANDA: LA SFIDA DEL RATE… H.Xu, Introduction to PANDA Trigger and Data Acquisition System, TIPP11, Chicago 8/9/2014ROSARIO TURRISI 15
16
8/9/2014ROSARIO TURRISI 16
17
Timelines - TDRs Central Tracker, MVD and EMC TDRs are approved Deadline for other detectors: 2015 DAQ and Computing: end 2016
18
Timelines – Detector Installation No fixed time schedule (order of the civil construction is still under discussion) Currently: Moving in the cave area Mid 2018 Detectors ready for data End 2019
19
Based on Belle/BaBar experience No real numbers from running LHC (only estimate) Continuous data stream not considered More realistic Panda software Experience from running LHC An updated Computing cost table FAIR Computing TDR Computing Model? After 6 years we are revising all the numbers and the model. The process has just started. Everything should be approved by PANDA before the FAIR TDR
20
In One Year at Tier0 Prompt reconstruction (gen0)40kcore for 6 months Offline reconstruction (gen1) 40kcore for 6 months 40k core for each year GEN0 RAW2.8 PB ESD3.9 PB AOD0.9 PB GEN1 AOD0.9 PB GEN0+GEN1 8.5PB (1RAW, 1ESD, 2AOD) GEN0 RAW2.8 PB AOD0.9 PB GEN1 AOD0.9 PB GEN0+GEN1 4.6PB (1RAW, 2AOD) On Disk On Tape 1 RAW copy, 1 AOD copy for each gen Still missing other stuff…
21
Simulations? Simulation time is x2 complete reconstruction time Simulation disk space is x10 AOD, but I am confident we can shrink to x5 Assuming 1:1 MC data/real 40k cores to simulate 1/2 of real the statistics promptly in 6 months 40k cores to simulate the remaining 1/2 statistics in the other 6 months 2/3 correction (beam duty cycle) -> other 27k cores? SIMULATION MC4.5 PB AOD0.9 PB 1 Generation 5.4PB On Disk On Tape SIMULATION MC4.5 PB AOD0.9 PB Final Generation 5.4PB
22
PANDA: SITUAZIONE ATTUALE Per i prossimi 3 anni non ci sarà attività con impatto di rilievo sulle risorse di rete Per I seguenti 2 anni, dipende da: come sarà definito il Computing Model (prevista approvazione a fine 2016) come parteciperà l’Italia (TIER1?) – impegno finanziario iniziale ~150 k€ da impiegare di conseguenza L’entità dell’impegno dell’INFN in FAIR è ancora in discussione 8/9/2014ROSARIO TURRISI 22
23
CONCLUSIONI Richieste di rete in CSN3: l’esperimento più esigente è ALICE PANDA ha un computing model simile, su tempi diversi JLAB12, GAMMA/AGATA vengono subito dopo, con esigenze compatibili con le risorse attualmente disponibili gli altri esperimenti non hanno manifestato richieste particolari, anche perché non hanno mai incontrato serie limitazioni da questo punto di vista Commento a latere: le esigenze di CSN3 non risiedono tanto nella singola richiesta di prestazioni di picco nella banda passante o nello storage quanto nella necessità di uniformare o far convivere una varietà di SO e software di esperimento, con accesso quasi-interattivo a dati (in quantità ragionevoli, anche non locali, su un modello da definire, in modo da far fronte nel miglior (=più efficiente e più economico…) modo possibile, per far fronte (anche) a: la diminuzione del personale dedicabile al calcolo l’evoluzione della struttura (anche sociale!) degli esperimenti Si comincia a sentire l’esigenza di una politica di data preservation 8/9/2014ROSARIO TURRISI 23
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.