Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste1 Calcolo per CDF-Italia per il Run 2 Nulla e incerto come il.

Slides:



Advertisements
Presentazioni simili
E835 & Hera-B Concezio Pisa, 21/12/2004. E835 (aka Jet-FNAL) timeline dell'esperimento –Presa dati conclusa nel Alcune analisi tuttora in corso.
Advertisements

Run I Distribuzione inclusive di Min Bias (Mult. Carica, Pt). Correlazioni dello stato finale ( -Mult) + mini-jet (soft hard physics). Campioni utilizzati:
Trieste, 8 Febbraio 2005M. P.Giordani 1 Trigger Dileptonico per Ricerche di Fisica Esotica Responsabilità del gruppo CDF-Udine: disegno, aggiornamento.
CSN1 2 Aprile 2003 P. Morettini 1 Relazione sulla CCR La riunione di Commissione Calcolo e Reti del 6 Marzo è stata in parte dedicata alla discussione.
CSN1 - Roma 28 Gennaio 2002 Calcolo per CDF Stefano Belforte - INFN Trieste1 Sommario Novita da Settembre 2001 Critica dellesistente: Review CDF Central.
Progetto Speciale Prototipo Tier1 F. Ruggieri INFN – CNAF I Workshop CMS Italia del SW e Computing Roma 22 Novembre 2001.
Introduzione alle attivita Software e Computing di Atlas Napoli M. Biglietti – G. Carlino – F. Conventi - A. Doria – L. Merola - A. Migliaccio Software:
1 La farm di ATLAS-Napoli 1 Gb/s 7 nodi con 2 CPU PIII a 1 GH, RAM 512 MB, 2 schede di rete a 100 Mb/s. Server con 2 CPU PIII a 1 GH, RAM 1 GB, 2 schede.
Aspetti critici rete LAN e WAN per i Tier-2
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
Introduzione Cosa è un Sistema Operativo ?
WP 14 Grid Applications for Geophysics Istituto Nazionale di Geofisica e Vulcanologia INGV Progetto FIRB Grid.it Documento di rimodulazione.
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
Vincenzo Vagnoni per il gruppo di Bologna
Istituto Nazionale di Fisica Nucleare Roma,12 febbraio 2001 Netgroup meeting Situazione attuale e attivita futura - R.Gomezel 1 Netgroup meeting Situazione.
Michele Michelotto INFN-Padova
LNL M.Biasotto, Bologna, 13 dicembre La farm di Legnaro Massimo Biasotto – INFN LNL.
LNL M.Biasotto, Bologna, 18 ottobre La farm CMS di Padova - Legnaro Proposta di acquisto hardware 2° semestre 2001.
LNL M.Biasotto, Bologna, 19 marzo La farm CMS di Padova - Legnaro Proposta di acquisto hardware 1° semestre 2001.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
CDF Meeting - Pisa 29 agosto 2003 Calcolo Stefano Belforte - INFN Trieste1 Stato e prospettive calcolo nazionale Cosa ce Cosa ci sara per il 2004 Cosa.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
Meeting: CDF - Referees 8 settembre 2003 Calcolo CDF Stefano Belforte - INFN Trieste1 Calcolo 2003/4: bottom lines 2003 abbiamo analizzato i dati ! Risorse.
Stefano Belforte INFN Trieste 1 necessita' CDF al Tier1 2 feb 2004 CDF stato e necessita Poco cambiato dal 18 Dicembre 2003.
Commissione Nazionale 1 Castel Gandolfo 11 Set Piano di Calcolo per CDF Run2a Stefano Belforte - INFN Trieste1 Organizzazione analisi per il Run.
Commissione Calcolo Napoli, 29 Giugno 1999 Strategie e necessita di CDF Stefano Belforte - INFN Pisa1 CDF nel Run II ( …) Cominciamo dalla.
15 Aprile 1999Stefano Belforte - INFN Pisa1 Piano per il Calcolo di CDF Meeting con Referees di Gr. I 15 Aprile 1999.
13-may-031 Calcolo CDF Richiesta sblocco s.j. per Accelerare migrazione farm (analisi e MC) da FNAL al CNAF incluso piccolo status report ed uno sguardo.
Benigno Gobbo – INFN Trieste 1 CSNI 21 maggio 2001 Stato della farm di COMPASS-TS CSNI Roma, 21 maggio 2001 Benigno Gobbo INFN Trieste
Stato del computing Andrea Sciabà Riunione del consorzio INFN Firenze, 7 settembre 2001 Farm italiane Produzione Monte Carlo b/ Progetti di GRID.
* * Data Challenge 04 Stato dei centri di produzione in Italia.
NSEC Keepod. Protezione Continua dei Dati
Works in progress.  Semplificazione e maggiore efficienza della gestione  Risparmio (nel medio periodo)  Riallocazione delle risorse (hardware e timesheet)
Manutenzioni e Mezzi di Calcolo Paolo Morettini – INFN Genova Valerio Vercesi – INFN Pavia CSN1 - Catania Settembre 2002.
L. Perini Riunione CSN1, Frascati Il Calcolo di CDF: Relazione dei referees Fabrizio Gagliardi, Laura Perini e Valerio Vercesi.
L. Perini Riunione CSN1, Catania Il Calcolo di CDF: Relazione dei referees Laura Perini e Valerio Vercesi.
3 Aprile CSN1 P. Capiluppi Tier2 CMS Italia.
6 Febbraio 2006CSN1 - Roma1 MEG : relazione dei referees P. Cenci R. Contri P. Morettini M. Sozzi.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
CSN Maggio 2005 P. Capiluppi Il Computing Model (LHC) nella realta’ italiana u I Computing models degli esperimenti LHC gia’ presentati a Gennaio.
Attività d’analisi dei gruppi CDF di UD e TS Massimo Casarsa Sez. INFN di Trieste Trieste, 8 Febbraio 2005 ► Attività del Gruppo di Udine: M.P. Giordani,
Sistemi operativi di rete Ing. A. Stile – Ing. L. Marchesano – 1/18.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
15/05/2007CSN1 Roma Presidenza1 KLOE: referee* KLOE Calcolo (referee calcolo) KLOE2 Tabelle con proposte di assegnazione * M. Livan, P. Paolucci, P.C.
1 Calcolo e software G. Bagliesi 23/3/01 Riassunto riunione calcolo Bologna 19/3/01 B/tau : futuri miniworkshop.
Federico Ruggieri INFN-CNAF Commissione Scientifica Nazionale I Lecce 24 Settembre 2003 Il Progetto TIER1 Status Update.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
Riunione Servizi Servizio Calcolo e Reti 13 settembre 2004 Silvia Arezzini.
CDF I referee Roma, 16 Maggio Tevatron OK Fisica Stanno pubblicando –Bene Nostre principali preoccupazioni su B s -mixing –Sulla base dei loro.
CDF Calcolo Another brick in the wall Paolo Morettini CSN1 Lecce Valerio Vercesi Settembre 2003.
Roberto Covati INFN di Parma. Workshop CCR/INFN GRID Palau maggio Sommario VmWare Server (in produzione dal 2004 al 2008) VmWare Infrastructure.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
D. Martello Dip. Fisica - Lecce Sintesi piani esperimenti CSN2 CNAF 7-marzo-2007.
Referaggio CALCOLO Esperimenti non LHC G. Carlino, D. Lucchesi, V. Vagnoni CSN1 – Lecce 30 Settembre 2015.
Claudio Grandi Workshop CCR 2015 Claudio Grandi INFN Bologna.
19 Ottobre 2012ATLAS Milano1 Stato delle risorse locali di calcolo L. Carminati, L. Perini, D. Rebatto, L. Vaccarossa.
1 ALICE I ITER2 DI ALICE IN ITALIA Bologna, 6 marzo 2007 M. Masera
19/4/2013 D. Menasce, M. Serra - Referaggio Progetti INFRA e WLCG 1.
G. Maggi 24/1/2006 Il Progetto del TIER2 di Bari Giorgio Maggi.
KLOE - Referee Paolo Checchia, Luca Lista, Ezio Menichetti, Pierluigi Paolucci con l’aiuto sostanziale di Luca dell’Agnello, Mauro Morandin CSN1.
ATLAS NAPOLI Software & Computing e il Tier-2 Gianpaolo Carlino INFN Napoli Il gruppo ATLAS di Napoli Le attività Software & Computing Il prototipo Tier-2.
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
The INFN Tier-1: progetto di ampliamento Cristina Vistoli – INFN CNAF Referee Meeting Sep
Silvia Arezzini 2 luglio 2014 Consiglio di Sezione per Preventivi.
ATLAS Italia – Sestri Levante, 15 Giugno 2010 G. Carlino – Richieste Run Efficiency = time for physics / total time LHC Efficiency = time with colliding.
Il calcolo per l’esperimento GERDA Luciano Pandola INFN, Laboratori del Gran Sasso Riunione della CSN2, LNF Frascati, 29 Novembre 2011.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
Transcript della presentazione:

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste1 Calcolo per CDF-Italia per il Run 2 Nulla e incerto come il calcolo A parte la durata del Run 2 Run 1 ( ) Vax 780 Vax Cluster VM/370 Vax Stations big SGI 9trk Exabyte 8220 Exabyte 8500 STK (Redwood) winchester HSC disks local SCSI regole doro: flessibilita acquisti Just In Time la fisica al primo posto: sistemi semplici e robusti Una certezza CDF NON HA SPESO ANCORA NULLA PER IL CALCOLO DEL RUN2, solo PC desktop dalle dotazioni. Lhardware del Run 1 (Alpha) non e supportato per il Run 2.

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste2 Quadro Generale data set LHC-like 5 anni prima: 1 PB di dati. 200 TB di Physics Analysis Data (PAD). 10 million-$s analysis facility a FNAL per gestirli non pensiamo di replicare il data set in Italia lanalisi si sviluppa su data set selezionati in base al trigger alto Pt : 100 ~ 1000 GByte basso Pt: 1 ~ 10 TByte il fisico lavora soprattutto sulle n-tuple: 1 ~ 5 GByte compito ideale per un PC linux

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste3 CDF data sets Lizs table

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste4 Lanalisi: per via gerarchica CDF Italia workshop a Padova 6/7 Dicembre 1999: esaminato il flusso di dati in alcune analisi italiane del Run 1 estrapolato alle dimensioni dei data sets per il Run 2 (x20) canalePADNtuple t 6j0.5 TB8 GB B mesons2.4 TB~40GB W/Z H 4j1.2 TB20 GB W lj (include top)0.4 TB 2 GB min bias0.06 TB20 GB altrettanto per il Monte Carlo numero di iterazioni delle selezioni: DST PAD ~3 volte (a Fnal) PAD Ntuple ~6 volte (a Fnal) re-tuning dei cuts su piccoli campioni e affinamento Ntuple : ~100

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste5 p-pbar : tanti canali, tanta variabilita da 2 a 20 TB di dati da 100 ev/sec a 100 sec/ev nella simulazione da 1 GeV a 100 GeV di Pt tipico da pochi mesi (raffinamento di un SUSY search) a molti anni (massa W, sezione durto top, nuova fisica) di lavoro i bisogni cambieranno nel tempo ! a CDF non ci sono analisi istituzionali ogni nuovo studente puo aprire un nuovo capitolo i bisogni (e le richieste) di hardware per lanalisi del gruppo Italiano dovranno seguire levoluzione dei gruppi di analisi

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste6 La preparazione al Run2: un esempio (Padova) sviluppo software (OO) di tracking in SVXII e COT, con applicazione di algoritmi veloci per la possibile applicazione a livello 3 di trigger. P. Gatti, A. Ribon, P. Azzi studi di trigger per W/Z+H 4jets. Su dati del RunI, e, per ora, con software del runI, con il pacchetto di estrapolazione al RunII. M. P. Giordani, L. Scodellaro, P. Azzi, T. Dorigo simulazione del sistema di trigger SVT, anche con layer 00. Applicazioni fisica del B e dei bosoni pesanti. Usando dati e simulazione del RunI, simulazione del RunII, simulazione standalone per SVT. D. Lucchesi, I. Fiori, T. Dorigo analisi del runI ed estrapolazione al RunII per B_s J/Psi eta. D. Lucchesi, R. Rossin algoritmi di reti neurali per lidentificazione di b-jets S.Bettelli, A.Sidoti (Trento)

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste7 Come si prepare Fermilab (bisogni stimati nel 1977) Le richieste al laboratorio per tutti (finale/adesso) farm per ricostruzione e (un po di) MC 150/50 PC dual CPU 500MB rack-mount (1.1 GL) robotic tape library da 1pByte per TUTTO il data set 20 8mm Exabyte Mammoth 2 (drive+media = 2.4 GL) 4 Sony AIT2 per il run di Settembre/Ottobre Emass/ADIC robot (2 GL) FC-SAN (1.5 GByte/sec) con 30/10 TByte disk (1.5 GL) + 10 TB inglesi Central Analysis Facility per users analys multiprocessor servers per 90K/30K Mips (5 GL) ora: 64-CPU Origin2000 = 1/3 del totale a 1/2 il costo Gibabit Ethernet verso i desktops nelle baracche system management

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste8 FCC Stephans picture

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste9 Esperienza del Run 1 Lanalisi ufficiale e diretta dai convenor dei gruppi di analisi, full time residents a Fermilab per diversi anni Gli Italiani hanno potuto lavorare grazie alla disponibilita di risorse riservate a Fermilab utilizzabili autonomamete: disco (soprattutto sul sistema centrale) CPU (Vax/Alpha negli uffici e code batch sul sistema centrale) Il lavoro in Italia: una pena laccesso ai nastri, gli ultimi anni si preferiva usare (dallItalia) il robot STK di Fnal e copiare i dati sulla rete. bene MC e PAW una fatica continua, ma gestibile aggiornamento codice e data base una fatica da non ripetere la gestione di 10 Vax Stations, 30 dischi, 10 unita nastro di varie taglie/eta/efficienza critico laccesso allultima versione, incluso codice e dati in aree private fondamentale runnare a FNAL

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste10 I contro dellanalisi in Italia Costo economico: robot, nastri, SAN... >>1 GLit Costo umano: la gestione non e solo system management ad horas, ci vuole professionalita ed esperienza tecnica e dirigenza scientifica (quali dati, quale codice, quali risorse, validazione delle copie locali) Stress: si rincorre sempre, i nuovi dati ed i codice sono disponibili sempre prima a Fermilab che in Italia Inadeguatezza: si lavora sempre con risorse inferiori a quelle disponibili a Fermilab cercando di adattare strumenti sviluppati per un ambiente diverso Insicurezza: ce sempre il pericolo che qualcosa rompa la compatibilta col centro remoto, ogni acquisto porta una nuova versione del sistema operativo... Il vero problema: come garantire, a se ed alla collaborazione, che lanalisi remota e riproducibile al laboratorio senza effettivamente replicarla al Fermilab.

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste11 La nostra strategia: tenere la CPU vicina ai dati. 3 colonne portanti Fermilab Feynman Computer Center (FCC) per: accesso allintero data set accesso immediato alla versione corrente di software/dati/DB system management professionale con tools software ed hardware dedicati sviluppati ad hoc aggiungere un po di hardware e ~ trasparente saricare su FNAL il costo di software, manutenzione, operazione risorse locali in Italia per analisi ripetute su piccoli data set analisi interattive wan network per trasferimento n-tuple (~1GByte) remote job entry/control al FCC

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste12 Rete vs. Computers Si risparmia un data center italiano da 200TB ($$$$!) Previsioni di utilizzo per solo CDF per trasferimento dati con gli USA: 4 Mbit/sec nel Mbit/sec nel Mbit/sec nel Serve una rete migliore molto migliore di quella del Run 1 Garr - US Research: 45 Mbit/sec ora, 155 planned: ~OK Remote monitoring e lavoro interattivo a FNAL pochi bytes, ma altra priorita: QOS (R&D in corso con Fermilab in gruppo V (Quadis/GRID) Banda di rete garantita e prenotabile (GRID ?)

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste13 Accesso ai dati dallItalia Dove stanno i dati. Struttura a 3 livelli. Data set completo (1 PByte) : FNAL ~n-tuple ( 100GByte): disco locale data sets finali ( pochi TByte): server sulla LAN o in una altra sezione INFN (GARR-B) per i data sets di uso frequente. Come si accedono: disco locale: tutto ovvio. ogni altra cosa: batch job per produrre le n-tuple, copia delle n- tuple sul disco locale: da un server italiano: copia via rete da FNAL: via rete fino a pochi GBytes, poi Federal Express

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste14 CPU/Disco I bisogni di data storage sono chiari Le necessita di CPU non sono mai stimabili correttamente il software e un gas libero, lespansione delle eseguibile (memoria occupata, CPU, spazio disco) e limitata dalle risorse disponibili in ogni caso la logistica deve occupare poco tempo, la fisica tanto niente home-made-farms un job per task per persona = una CPU per fisico corrisponde allestrapolazione dal Run 1 bisogna comunque riparlarne quando i numeri sono solidificati ora il software sta appena prendendo forma (CDF tradition): 20 eventi/secondo solo lettura senza tracking 3 eventi/secondo per generazione (ISAJET) 1 evento/minuto per simulazione, lo stesso per ricostruzione siamo lontanti dal goal.

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste15 Corollario Lanalisi satura qualunque set di risorse Non esiste la cifra giusta Piu computers = meno fatica (se la gestione e semplice) Dato un qualunque totale di risorse finanziare spendere efficientemente risparmiare quanto possibile comprare piu CPU e piu disco meglio avere piu hardware a FNAL dove linvestimento e piu efficiente e si fatica di meno ovviamente fino a che totale < 10 GLit.

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste16 Quale hardware ITALIA (ntuple) sezioni piccole: 1 PC + 100GB disco + 8mm sezioni grandi: 4-CPU servers, 4 8mm drives, ~1 TByte RAID ~7 MLit/anno per ogni fisico che fa analisi (LINUX !) ITALIA (PADs) ~5 TB disco RAID, 8mm, CPU da stimare FNAL servers nel Computing Center connessi a tape robot e RAID disk pool (garantiscono accesso immediato al data set completo) 10 TB disk, ~15% di Mips = Mips PC negli uffici: come in Italia ~1.5ML/anno/tavolo SIMULAZIONE (PC FARMs) Italia o Fnal: stesso costo (O(100MLit)), cambia la fatica, da discutere al momento del bisogno

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste17 Il Piano Sistema distribuito, espandibile. Dettagli adattati/bili. Constraints di unitarieta: quadro temporale: computers = acquisto just-in-time nulla nel 2000 poco nel 2001 molto nel 2002 altrettanto nel 2003 upgrades periodici e manutenzione (10% allanno) regole di somma (solito caveat sulla CPU): ~50 CPU in Italia (servers + desktops da analisi) due PC per ogni ufficio a FNAL: ~30 tot hardware al FNAL Comp.Center comune per tutti: ~ Mips (450SpecInt95) + ~ 10 TByte RAID drives 8mm (nastro) in Italia e Fermilab (~20+10)

Commissione Nazionale 1 11 Settembre 2000 Calcolo per CDF Stefano Belforte - INFN Trieste18 Indicativamente, se le stime di CPU di 3 anni fa (estrapol. dal Run 1) reggono e se in Italia possiamo stare con Linux 2001: anno zero, partiamo piano sfruttando lhardware di Fermilab 200 MLit in Italia, 100MLit a Fnal (2TB disco) eventuali aggiunte da discutere in corso danno da qua in poi si puo sbagliare (in meno) di un fattore : il primo fb-1: Italia: 3TB disco, CPU da definire O(~300 MLit) Fnal: 3TB disco, Mips O(~500 MLit) 10~20 nodi per Monte Carlo Farm (anywhere) O(~100MLit) 2003: completato 1 PetaByte di dati Italia: 4TB disco, altra CPU O(~300 MLit) Fnal: 5TB disco, Mips O(~500 MLit) 10~20 nodi MLit MC Farm (anywhere) O(~100MLit) 2004: analisi a pieno ritmo sara in discesa... se non arrivano nuovi dati !