La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

COMMENTI SU RICHIESTA ESIGENZE DI RETE 2015-2018(-20) IN CSN3 Rosario Turrisi Riunione CCR, Roma, 8 settembre 2014.

Presentazioni simili


Presentazione sul tema: "COMMENTI SU RICHIESTA ESIGENZE DI RETE 2015-2018(-20) IN CSN3 Rosario Turrisi Riunione CCR, Roma, 8 settembre 2014."— Transcript della presentazione:

1 COMMENTI SU RICHIESTA ESIGENZE DI RETE 2015-2018(-20) IN CSN3 Rosario Turrisi Riunione CCR, Roma, 8 settembre 2014

2 ESPERIMENTI IN CSN3 2 2 4 4 3 3 1 1 636 ric/tec (+tecnici), 477.7 FTE (0.75 FTE/pers) ALICE Studio della produzione del QGP in collisioni tra ioni pesanti ultrarelativistici EXOCHIM Collisioni tra Ioni pesanti stabili ed esotici alle energie del tandem ed intermedie Struttura iperfine dell’idrogeno muonico e raggio e.m. del protone FAM-RD 8/9/2014ROSARIO TURRISI 2

3 ALCUNE OSSERVAZIONI  FTE: 478/211 TOT/GRID  Finanziamento 2013 (k€): ALICE: 330, altri: ~108, tra cui PANDA AGATA/GAMMA JLAB12 EXOCHIM 31 25.5 21 14 =21±29… 142 1300 220410 198 125  Gruppi di varie dimensioni: dai 2.3 FTE di ULYSSES ai 142 di ALICE  …inseriti in collaborazioni di varie dimensioni (da alcune unità alle 1330 di ALICE)!  La dimensione della collaborazione non è un indice della strategia di calcolo  Spesso I piccoli gruppi collaborano mettendo a comune idee, risorse umane, hardware  Quadro frammentato, diversi linguaggi, paradigmi, filosofie di storage… …ma funziona (quasi) tutto molto bene! 8/9/2014ROSARIO TURRISI 3

4 ESIGENZE DI RETE DI ESPERIMENTI DI PICCOLA/MEDIA TAGLIA  Piccola/media taglia ≅ 20 FTE – la maggior parte delle sigle  Tipico workflow dell’esperimento:  progetto (tempi variabili)  eventuale costruzione/upgrade/adattamento/commissioning del rivelatore (da qualche mese a qualche anno)  misure (1-2 settimane ciascuna, ~5-6 per anno)  copia dati su supporti di backup vari (tipicamente dischi esterni)  da ~0.1 ~1 TB per misura (raw data)  trasferimento dei raw data e/o dati ridotti tra le sedi partecipanti alla misura (~5 sedi tipicamente)  Nessuno ha presentato richieste particolari, se non riguardanti:  la possibilità di accedere ai dati da remoto (copia)  la possibilità di fare analisi/grafica (realtime) da remoto  la possibilità di utilizzare il sistema x col software y in maniera ‘’stabile’’ 8/9/2014ROSARIO TURRISI 4

5 ESIGENZE DI RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO  ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino  GAMMA/AGATA  JLAB12  PANDA 8/9/2014ROSARIO TURRISI 5

6 AGATA ADVANCED GAMMA TRACKING ARRAY 180 hexagonal crystals3 shapes 60 triple-clusters all equal Inner radius (Ge) 23.5 cm Amount of germanium 362 kg Solid angle coverage 82 % 36-fold segmentation 6480 segments Singles rate ~50 kHz Efficiency: 43% (M  =1) 28% (M  =30) Peak/Total:58% (M  =1) 49% (M  =30) 6660 high-resolution digital electronics channels Detectors operated in position-sensitive mode  Digital EDAQ + Pulse Shape Analysis +  -ray Tracking Coupling to ancillary detectors for added selectivity 8/9/2014ROSARIO TURRISI 6 Stesso gruppo italiano di GAMMA/GALILEO, esperimenti in fase di presa dati e/o upgrade

7 Event Builder Tracking Physical Analysis Merge Data Readout FE Electronics Ancillary Detector(s) Preprocessing PSA FEE Readout Preprocessing PSA FEE Readout Det#1Det#2Det#N············Det#3 ············ * ~ 95 % of CPU time spent in the PSA * * Disk Write Rates * Raw ~100 MB/s (total) * PSA ~5 MB/s (total) * Tracked ~10 MB/s Each box represents one task managed by the ADA distributed computing system NARVAL (or by off-line C++ emulators) Data processing implemented in C++ and loaded as shared libraries in the NARVAL environment Data formatting and flow managed by the adf C++ library STRUCTURE OF COMPUTING SYSTEM Local Level (detectors don’t know of each other) Global Level 8/9/2014ROSARIO TURRISI 7

8 8/9/2014ROSARIO TURRISI 8

9 AGATA: ESIGENZE DI STORAGE/RETE  Le esigenze di calcolo di AGATA sono legate all'analisi della forma dei segnali prodotti dai rivelatori al germanio (Pulse Shape Analysis, PSA)  un'analisi abbastanza pesante in termine di CPU  effettuata in tempo reale dalla farm di acquisizione (a Legnaro/GSI/GANIL), composta da ~30 macchine per un totale di 250 (LNL) o 500 (GSI) cores  Se la PSA in tempo reale è stata effettuata correttamente, le necessità di calcolo successive sono abbastanza modeste  Maggior impegno attuale: gestione dei 150 TB/y (dati raw)  Soluzione attuale: storage su GRID (VO AGATA): 350 TB @ Lione, 150 TB @ CNAF  La singola misura produce ≤ 30 TB raw data, previsti ~300 TB in 2.5 y  Trasferimento a Lyon+CNAF  Successivo trasferimento verso LNL, PD, MI, FI  Analisi/display da remoto, accesso dei raw da tutte le sedi  Non dichiarano attualmente particolari problemi, auspicano un’alta reattività dei sistemi alle attività del punto precendente 8/9/2014ROSARIO TURRISI 9

10 ESIGENZE DI STORAGE/RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO  ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino  GAMMA/AGATA  JLAB12  PANDA 8/9/2014ROSARIO TURRISI 10

11 JLAB12: GLI ESPERIMENTI  Upgrade in corso per permettere a CEBAF di raggiungere 12 GeV (2x)  3 sale sperimentali con rivelatori dedicati + una quarta in costruzione  Hall A polarimetro + spettrometri, in programma estensione range cinematico, alta luminosità  Hall B target polarizzato + spettrometro a grande accettanza CLAS  CLAS12 per 10 35 cm -2 s -1  Hall C misure in coincidenza ad alta risoluzione con 2 spettrometri, HMS+nuovo ad angolo variabile  Hall D misure di brehmsstralung: γ, PID, coincidenza con particelle cariche (nuova sala) 8/9/2014ROSARIO TURRISI 11

12 JLAB COMPUTING MODEL  Modello attuale, da rivedere per JLAB12  Una analisi: ~400 GB su disco ( + ~ 50% per simulazione)  La simulazione è distribuita al 50% tra JLAB e farm locali  ‘’T0’’ + ‘’T1’’ ad es. a Norfolk  I dati (latency da alcuni anni ad alcuni mesi, JLAB12->15y) sono elaborati a JLAB -> produzione dei ‘’dst’’  3 mesi presa dati -> ~3 mesi ricostruzione  comnservata la possibiltà di upstream (~10% dei dati da riprocessare)  dst= 4-impulsi + banche dei singoli rivelatori  Copia locale dei dst (occupano ~ 1/10 dei raw)  Localmente: ‘’filtratura’’ dei 4-impulsi per l’analisi finale  Attualmente si discute se fare il salto direttamente alla Cloud  Saltare la transizione a Root e ai protocolli GRID o GRID-like  CLOUD, JAVA-based future? 8/9/2014ROSARIO TURRISI 12

13 JLAB12 – IN SINTESI  Profilo temporale:  inizio presa dati nel 2015, in maniera consistente, prospettiva di 5 anni con aumento 3x nel 2016, 1.1x nel 2017, poi stabile  Modello produzione:  dati conservati e ridotti a JLAB, trasferimento JLAB-Italia (Ge, LNF, LNS) di DST e MC  trasferimento interno modesto  Stima della banda massima, nelle ipotesi di sopra, più:  trasferimento in 6 mesi  nessuna fattore di sicurezza/efficienza  indicato il valore medio 8/9/2014ROSARIO TURRISI 13 AnnoRaw data (TB) DST (TB) Frazione DST trasferiti DST trasferiti (TB) Banda (Mb/s) 20158202500.25026 201623007000.17038 201725507700.17640 201825507700.17640

14 ESIGENZE DI STORAGE/RETE PER ESPEIRMENTI CON CALCOLO A IMPATTO PIÙ ELEVATO  ALICE: assimilato agli altri esp. LHC, v. presentazione G. Carlino  GAMMA/AGATA  JLAB12  PANDA 8/9/2014ROSARIO TURRISI 14

15 PANDA: LA SFIDA DEL RATE… H.Xu, Introduction to PANDA Trigger and Data Acquisition System, TIPP11, Chicago 8/9/2014ROSARIO TURRISI 15

16 8/9/2014ROSARIO TURRISI 16

17 Timelines - TDRs Central Tracker, MVD and EMC TDRs are approved Deadline for other detectors: 2015 DAQ and Computing: end 2016

18 Timelines – Detector Installation No fixed time schedule (order of the civil construction is still under discussion) Currently: Moving in the cave area Mid 2018 Detectors ready for data End 2019

19 Based on Belle/BaBar experience No real numbers from running LHC (only estimate) Continuous data stream not considered  More realistic Panda software  Experience from running LHC  An updated Computing cost table  FAIR Computing TDR Computing Model? After 6 years we are revising all the numbers and the model. The process has just started. Everything should be approved by PANDA before the FAIR TDR

20 In One Year at Tier0 Prompt reconstruction (gen0)40kcore for 6 months Offline reconstruction (gen1) 40kcore for 6 months 40k core for each year GEN0 RAW2.8 PB ESD3.9 PB AOD0.9 PB GEN1 AOD0.9 PB GEN0+GEN1 8.5PB (1RAW, 1ESD, 2AOD) GEN0 RAW2.8 PB AOD0.9 PB GEN1 AOD0.9 PB GEN0+GEN1 4.6PB (1RAW, 2AOD) On Disk On Tape 1 RAW copy, 1 AOD copy for each gen Still missing other stuff…

21 Simulations? Simulation time is x2 complete reconstruction time Simulation disk space is x10 AOD, but I am confident we can shrink to x5 Assuming 1:1 MC data/real 40k cores to simulate 1/2 of real the statistics promptly in 6 months 40k cores to simulate the remaining 1/2 statistics in the other 6 months 2/3 correction (beam duty cycle) -> other 27k cores? SIMULATION MC4.5 PB AOD0.9 PB 1 Generation 5.4PB On Disk On Tape SIMULATION MC4.5 PB AOD0.9 PB Final Generation 5.4PB

22 PANDA: SITUAZIONE ATTUALE  Per i prossimi 3 anni non ci sarà attività con impatto di rilievo sulle risorse di rete  Per I seguenti 2 anni, dipende da:  come sarà definito il Computing Model (prevista approvazione a fine 2016)  come parteciperà l’Italia (TIER1?) – impegno finanziario iniziale ~150 k€ da impiegare di conseguenza  L’entità dell’impegno dell’INFN in FAIR è ancora in discussione 8/9/2014ROSARIO TURRISI 22

23 CONCLUSIONI  Richieste di rete in CSN3:  l’esperimento più esigente è ALICE  PANDA ha un computing model simile, su tempi diversi  JLAB12, GAMMA/AGATA vengono subito dopo, con esigenze compatibili con le risorse attualmente disponibili  gli altri esperimenti non hanno manifestato richieste particolari, anche perché non hanno mai incontrato serie limitazioni da questo punto di vista  Commento a latere:  le esigenze di CSN3 non risiedono tanto nella singola richiesta di prestazioni di picco nella banda passante o nello storage quanto nella necessità di uniformare o far convivere una varietà di SO e software di esperimento, con accesso quasi-interattivo a dati (in quantità ragionevoli, anche non locali, su un modello da definire, in modo da far fronte nel miglior (=più efficiente e più economico…) modo possibile, per far fronte (anche) a:  la diminuzione del personale dedicabile al calcolo  l’evoluzione della struttura (anche sociale!) degli esperimenti  Si comincia a sentire l’esigenza di una politica di data preservation 8/9/2014ROSARIO TURRISI 23


Scaricare ppt "COMMENTI SU RICHIESTA ESIGENZE DI RETE 2015-2018(-20) IN CSN3 Rosario Turrisi Riunione CCR, Roma, 8 settembre 2014."

Presentazioni simili


Annunci Google