Calcolo in BaBar: stato attuale e prospettive Francesco Safai Tehrani, INFN Roma per BaBar Italia.

Slides:



Advertisements
Presentazioni simili
E835 & Hera-B Concezio Pisa, 21/12/2004. E835 (aka Jet-FNAL) timeline dell'esperimento –Presa dati conclusa nel Alcune analisi tuttora in corso.
Advertisements

Run I Distribuzione inclusive di Min Bias (Mult. Carica, Pt). Correlazioni dello stato finale ( -Mult) + mini-jet (soft hard physics). Campioni utilizzati:
23/01/01Alberto Masoni – GR1 - Roma1 I MODELLI DI CENTRI REGIONALI POSIZIONE DI ALICE ITALIA CENTRO ITALIANO: CPU 450 KSI95, DISCO 400 TB (INSIEME TIER-1.
Computing: Attività 2010 Reprocessing e ri-simulazione dati Run7 Extra-production di dati MC alla Y(4S) 10 x cross section bb e cc, 2 x cross section u.
Computing: Attività 2009 Reprocessing e ri-simulazione dati Run7 Extra-production di dati MC alla Y(4S) 10 x cross section bb e cc, 2 x cross section u.
Progetto Speciale Prototipo Tier1 F. Ruggieri INFN – CNAF I Workshop CMS Italia del SW e Computing Roma 22 Novembre 2001.
Introduzione alle attivita Software e Computing di Atlas Napoli M. Biglietti – G. Carlino – F. Conventi - A. Doria – L. Merola - A. Migliaccio Software:
1 La farm di ATLAS-Napoli 1 Gb/s 7 nodi con 2 CPU PIII a 1 GH, RAM 512 MB, 2 schede di rete a 100 Mb/s. Server con 2 CPU PIII a 1 GH, RAM 1 GB, 2 schede.
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
2) Sistemi operativi Lab. Calc. AA2004/05 - cap.2.
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
SP-Grid - setup Implementazione dei servizi per la produzione al CNAF: –Integrazione tra i tool di produzione standard di BaBar (ProdTools) e gli strumenti.
Tier1 - cpu KSI2k days ATLAS KSI2k days CMS. Tier1 - storage CASTOR disk space CMS requires: T1D0, T0D1 ATLAS requires: T1D0, T0D1 and T1D1.
Michele Michelotto INFN-Padova
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
LNL M.Biasotto, Bologna, 13 dicembre La farm di Legnaro Massimo Biasotto – INFN LNL.
Execution benchmarks Obiettivi Test dettagliati e ben caratterizzati Esecuzione di benchmark standard Test di applicazioni dell'esperimento ALICE 20 Novembre.
LNL M.Biasotto, Bologna, 18 ottobre La farm CMS di Padova - Legnaro Proposta di acquisto hardware 2° semestre 2001.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
Stefano Belforte INFN Trieste 1 necessita' CDF al Tier1 2 feb 2004 CDF stato e necessita Poco cambiato dal 18 Dicembre 2003.
Benigno Gobbo – INFN Trieste 1 CSN 1 17 settembre 2002 Stato della Farm di Trieste CSN 1 17 settembre 2002 Benigno Gobbo INFN Sezione di Trieste
Benigno Gobbo – INFN Trieste 1 CSNI 21 maggio 2001 Stato della farm di COMPASS-TS CSNI Roma, 21 maggio 2001 Benigno Gobbo INFN Trieste
Alessia Tricomi Università & INFN Catania
Stato del computing Andrea Sciabà Riunione del consorzio INFN Firenze, 7 settembre 2001 Farm italiane Produzione Monte Carlo b/ Progetti di GRID.
* * Data Challenge 04 Stato dei centri di produzione in Italia.
C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova.
7 ottobre 2002P. Checchia Padova Cons. di sezione1 Resoconto CSN1 Lecce settembre 2003 Cosiderazioni generali Bilancio 2004: 28 M€ (era 38.5 compreso l’anticipo.
1 Il Buffer Cache Unix (Bach: the Design of the Unix Operating System (cap: 3)
lun mar mer gio ven SAB DOM FEBBRAIO.
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
Analysis unibo una proposta. Work flow di una tipica analisi 1.Simulazione di piccoli campioni di eventi per studio segnale 2.Generazione in grande.
CCR 14-15/03/2006 Status Report Gruppo Storage CCR.
Workshop sulle problematiche di calcolo e reti nell’INFN Paestum,9-12 giugno 2003 Report sull’ultimo HEPiX e proposte per le prossime edizioni Roberto.
Test Storage Resource Manager per SC4 Giacinto Donvito Vincenzo Spinoso.
1 CSN1 - Lecce 22/09/2003 Babar Relazione e proposte finanziarie Referee: M. de Palma, P. Lubrano, C. Luci, L. Perini,A. Staiano.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
Perugia - 12 novembre 2002 M. Morandin - INFN Padova Budget calcolo Babar 2003 e contributo INFN.
CSN1-Assisi L.Perini1 BaBar Calcolo L. Perini per i referees: L.Perini,A.Staiano…
Luca Lista - Capri /04/2003 Nuovo Computing Model L. Lista.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
Grid nelle sezioni: Milano Luca Vaccarossa INFN – Sezione di Milano Workshop sulle Problematiche di Calcolo e Reti nell'INFN.
Stato del calcolo in BaBar e richieste per il 2004, F. Galeazzi, Giugno 2003 Calcolo in BaBar Stato e richieste al CSN1 per il 2004 presentato da F. Galeazzi.
1 Calcolo e software G. Bagliesi 23/3/01 Riassunto riunione calcolo Bologna 19/3/01 B/tau : futuri miniworkshop.
BABAR: relazione dei referee M.De Palma, C.Luci, A.Staiano B.Gobbo, M.Sozzi (calcolo) Trieste,
CMS 1 M. Biasotto – Bologna 20/01/2005 Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia.
1 Roberto Stroili – 16 settembre 2002 – Commissione I Stato del calcolo di BaBar Roberto Stroili Università di Padova & INFN Commissione I 16 settembre.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
BaBar: stato ed utilizzo delle farms, F. Galeazzi, Settembre 2004, pag. 1 BaBar: stato ed utilizzo delle farms presentato da Fulvio Galeazzi a nome del.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
CDF Calcolo Another brick in the wall Paolo Morettini CSN1 Lecce Valerio Vercesi Settembre 2003.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
1 referee-BaBar CSN I, LNF giugno 2007 RELAZIONE DEI REFEREE DI BaBar M.De Palma, C.Luci, C.Troncon, B.Gobbo(calcolo) 26 giugno 2007.
Utilizzo della VO di theophys per il calcolo lattice QCD G. Andronico M. Serra L. Giusti S. Petrarca B. Taglienti.
19 Ottobre 2012ATLAS Milano1 Stato delle risorse locali di calcolo L. Carminati, L. Perini, D. Rebatto, L. Vaccarossa.
1 referee-BaBar CSN I, Roma Gennaio 2008 RELAZIONE DEI REFEREE DI BaBar e SuperB M.De Palma, C.Luci, C.Troncon, B.Gobbo(calcolo),D. Pedrini
1 ALICE I ITER2 DI ALICE IN ITALIA Bologna, 6 marzo 2007 M. Masera
ATLAS NAPOLI Software & Computing e il Tier-2 Gianpaolo Carlino INFN Napoli Il gruppo ATLAS di Napoli Le attività Software & Computing Il prototipo Tier-2.
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
The INFN Tier-1: progetto di ampliamento Cristina Vistoli – INFN CNAF Referee Meeting Sep
CCR - Roma 15 marzo 2007 Gruppo storage CCR Report sulle attivita’ Alessandro Brunengo.
Il calcolo per l’esperimento GERDA Luciano Pandola INFN, Laboratori del Gran Sasso Riunione della CSN2, LNF Frascati, 29 Novembre 2011.
1 Computing di BaBar Fabrizio Bianchi Universita’ di Torino e INFN Sez. di Torino Roma, 20 novembre 2007.
Aggiornamento AFS R.Gomezel Commissione Calcolo e Reti Presidenza 5/10/2010-7/10/2010.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
Transcript della presentazione:

Calcolo in BaBar: stato attuale e prospettive Francesco Safai Tehrani, INFN Roma per BaBar Italia

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar2 Computing Model 2 Incremento di luminosita' integrata previsto: –nel fb -1, nel fb -1 Nuovo modello di calcolo: –Tipo base dell’analisi in sostituzione del “micro” (AOD) diventa il “reduced mini” –Migrazione dall’event store Objectivity ad uno basato completamente su ROOT –Nuovi tool di bookkeeping Sviluppo da Ottobre 2002, implementazione da Gennaio 2003, in produzione ad Ottobre 2003, dopo test estensivi.

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar3 Attivita’ CM2 in BaBar Italia Modello di analisi (partecipanti italiani: M.Bondioli, G.DeNardo, L.Lista) : –sviluppo del nuovo formato “reduced-mini” –accesso ai dati ad 1 kHz –UsrData: possibilita' di aggiungere informazioni (es. sui compositi) –reskimming ogni 3 mesi a partire dai mini

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar4 Attivita’ CM2 in BaBar Italia (2) Migrazione Event Store –Conversione Objectivity – Kanga Necessaria sia per dati ricostruiti che per il MC –Sviluppo server Xrootd + XTNetFile per accesso ai dati (A.Dorigo, F.Furano) Il prodotto finito e’ stato offerto (ed accettato) per l’inclusione nelle release ufficiali di ROOT –Test modifiche sistema controllo PR (Padova)

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar5 Farm di analisi Problemi seri: –A meta’ luglio il sistema RAID Compaq che ospitava le home directories e’ crashato a causa di problemi hardware e di firmware. –I tempi d’intervento sono stati lunghi anche a causa di un tentativo di recupero dei raidset (fallito).

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar6 Farm di analisi (2) crash

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar7 Farm di analisi (3) Lo stato attuale: –Nuovo sistema RAID per homedirs (fatto) Server 3Ware con 0.5TB di spazio –Upgrade firmware dei RAID Compaq (fatto) –Patch del kernel delle macchine Solaris, i server NFS per i RAID Compaq (da fare) –Trasloco della farm da Roma al CNAF Fatto il 18/09/2003, arrivo al CNAF 19/09/2003 –Riconfigurazione e reinstallazione della farm al CNAF (da fare, appena il CNAF e’ pronto)

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar8 Monte Carlo: farm di Roma Impegnati: C. Bulfon, G. Della Ricca, F. Safai Tehrani Struttura della farmStruttura della farm: –1 server Linux, dual Xeon 2 GHz, 2 GB (NFS and Objy lock servers, batch queues) –8 (+2) client Linux, dual PIII 800 MHz, 1 GB –17 client Linux, dual PIII 1.27 GHz, 1 GB –1 client Linux, dual PIII 800 MHz, 1 GB (DBs and LOGs export) –1 Array RAID EIDE 1TB Produzione SP5: RH Obj 7.1 Espansione farm:Espansione farm: –(in arrivo, inizio Ottobre) 26 client dual Xeon 2.4GHz, 2GB –(pronti) 2*0.5TB Array RAID EIDE

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar9 Monte Carlo “parassita” (1) Impegnati: C. Bozzi, C. Bulfon, G. Della Ricca, F. Safai Tehrani Farm di analisi: 16 cpu su 54 Per minimizzare la concorrenza con l’analisi 15 macchine usavano ancora RH6.2 –Un crash di un sistema RAID ha fermato la produzione alla fine di Luglio Stato attuale: –Farm al CNAF, da reinstallare –Tutte le macchine upgradate a RH7.2 Da fare: –Riconfigurare il sistema di code per massimizzare l’uso delle macchine senza limitazioni artificiali sul numero di job

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar10 Monte Carlo “parassita” (2) Impegnati: G. Della Ricca, F. Galeazzi Usa le farm di calcolo di PD dedicate a processing e reprocessing Stato attuale: –INFNTA1: in produzione con 30 macchine –INFNTA2: appena partita (19/09/03) con 7 macchine Una farm (ER2) e’ validata per la produzione MC e puo’ essere “convertita” in 2-4 ore.

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar11 Plot prestazioni MC: prestazioni “ufficiali” 24/03/03-13/09/03 infn: 54Mev ~ 9.1Mev/mese infn2: 5Mev ~ 0.8Mev/mese infnta1: 38Mev ~ 6.5Mev/mese

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar12 Monte Carlo: prestazioni reali Le prestazioni reali sono calcolate sull’effettivo periodo di attivita’ delle farm Farm di Roma (INFN), 23/03/ /09/2003: –53Mev ~ 8.9Mev/mese, peak: 15.4Mev/mese Farm Analisi (INFN2), 11/05/ /09/2003: –4.7Mev ~ 1.3Mev/mese, peak: 2Mev/mese Farm (re)processing (INFNTA1), 15/06/ /09/2003: –38Mev ~ 12Mev/mese, peak: 17.2Mev/mese “peak” = massimo #ev prodotti in un periodo di un mese

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar13 Monte Carlo: espansioni & problemi 2002: prodotti circa 60Mev su un fabbisogno totale di 1.5*10 3 Mev, pari al 4%. Obiettivo per il 2003: produzione del 15% del fabbisogno ufficiale di BaBar (375Mev su 2.5*10 3 Mev). A tal fine: –Uso “parassita” della farm di (re)processing per circa 1/3 della statistica. –1TB disco addizionale per buffer farm MC –raddoppio CPU farm MC: +150x30SpecInt95 Ma c’e’ un problema: le nuove CPU per la farm sono in ritardo di 4 mesi a causa di problemi (risolti) nella firma del contratto di fornitura a seguito della trasformazione NAOS-Oxyria. Arrivo previsto: prima meta’ di Ottobre.

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar14 Monte Carlo + GRID Sezioni impegnate: Ferrara, Napoli Richieste di BaBar: –~1.5 Geventi adronici simulati per 100 fb -1 di luminosità integrata Le risorse necessarie sono ingenti e non disponibili in un singolo sito –Soluzione: produzione distribuita in una “Grid” di circa 25 siti amministrati e gestiti localmente

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar15 Monte Carlo + GRID (2) Testbed: Farm di Ferrara –1 CE + 1 SE + 6 WN con EDG –Visibile dal RB di BaBar (Imperial College) –I membri della VO BaBar possono sottomettere job anche da RB del CNAF Stato attuale: –Software MC integrato in EDG ed installato su farm EDG di Ferrara, Napoli, Catania e Padova –Effettuati test di produzione remota sulle 4 farm –Portale GENIUS installato a Ferrara e configurato per la produzione MC su risorse GRID A breve: Integrazione in LCG (fine anno) Integrazione nel nuovo CM di BaBar (autunno)

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar16 Farm di (re)Processing Attivita' estive, durante luglio ed agosto: –Hardware: riconfigurazione macchine (datamover) –Software: Modifiche al sistema di import Xtc (G.Tiozzo) Sviluppo e test del sistema di controllo (M.Piemontese, A.Ceseracciu, F.Galeazzi) Sviluppo e test nuovo sistema di export (G.Vedovato, F.Galeazzi) “reprocessing” di un set consistente di dati (circa 10 fb -1 ) con varie releases Nessuna “chiusura per ferie”...

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar17 Il processing di BaBar Architettura a due step: –Ogni run “pronto” ad IR2 viene automaticamente copiato a PD e (contemporaneamente)... –…accodato alla farm di calibrazione “PC” (a SLAC): selezione rapida di un campione di eventi per il calcolo delle “rolling calibrations”, che vengono scritte in Objectivity –Ogni ~24 ore si estraggono i database contenenti le calibrazioni (da Obj) e si copiano nel database di calibrazione (Obj) di PD –Processing a PD (Event Reconstruction) sulle farm “ER” condizioni lette da Objy ma uscita in formato ROOT –Export a SLAC dei dati processati dal 09/2003 tutta l'attivita' di ER viene fatta a Padova

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar18 Processing: stato attuale E' iniziato il Run 4! –(Programma anticipato di circa una settimana) –Primo run di cosmici il 26 agosto mattina (CET) dati riprocessati pronti per gli esperti dopo circa 24 ore feedback positivo –“Colliding beams” dal 5 settembre: Primo run utile: chiuso il 9/9/2003, 18:24 PST Primo blocco calibrazioni: 10/9/2003, 00:45 PST Dati processati disponibili a SLAC: 10/9/2003, 07:09 PST Ciclo di processing estremamente veloce

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar19 Processing+CM2=un successo L’efficienza di CM2 nel rendere disponibili i dati per l’analisi era impensabile con Objectivity: “Congratulations to everyone who helped make the first live CM2 production an immediate success.” (Rainer Bartoldus, Deputy Computing Coordinator) “...once again I'd like to congratulate and thank the OPR folks for the amazingly rapid throughput and availability of the data.” (Mike Kelsey, DCH System Manager) Dati riprocessati disponibili agli utenti: –Objectivity: ~2-3 settimane export settimanale + import in Objy a SLAC + caricamento collezioni nella Bridge Federation –CM2: ~1 giorno Export per ogni singolo run e l’import = untar di un file

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar20 Processing: import dei dati Copia completa del campione di dati “raw” da SLAC per backup ed uso locale. Modifica del sistema di import per la gestione di buffer di disco a SLAC e a PD (quasi completato). Tutti i dati fino alla fine di Run3 sono stati importati entro fine Agosto e copiati su nastro. Attualmente i dati di Run4 vengono importati e copiati su nastro appena disponibili. A.Dorigo ha ora la responsabilita' dell'import (il contratto di G.Tiozzo scaduto a fine agosto)

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar21 Processing: export Sistema completamente nuovo: –Granularita’: dalla “production week” al singolo run (ri)processato Molto piu' flessibile: –Objy imponeva l'assegnazione di risorse separate per ogni farm –Lo schema attuale ottimizza l’uso delle risorse aggregandole in “pool”: “produttori”, cioe' le farmdi processing “export”, cioe' le macchine che gestiscono la copia “tier”, cioe' l'insieme delle destinazioni (inclusi i nastri) –I collegamenti tra pool possono essere modificati in ogni momento con molta semplicita' (ad es. per includere Lione, CNAF...) –Completamente automatizzato Gia' operativo: –Solo due destinazioni: SLAC e i nastri –Qualche dettaglio nel protocollo di handshaking con i tier da definire

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar22 (re)Processing: stato delle farm Macchine della gara 2003 in arrivo: –dopo installazione e test, operative ~15 Ottobre Nel frattempo: –ER0: (piccola) farm di test –ER1: produzione MonteCarlo –ER2: “validata” come farm di produzione MC Puo' essere convertita a processing, o reprocessing, o MonteCarlo nel giro di 2-4 ore –ER3, ER4: processing dei nuovi dati con 3 farm = 0.5 fb -1 /giorno (PEP: al 19/9 max 0.25 fb -1 /giorno, ~0.45 fb -1 /giorno entro Dicembre)

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar23 Prospettive future: attivita’ Attivita’ relative al CM2 sulla farm di (re)processing: –Conversione dei dati dei Run1-3 dal formato mini-Obj al nuovo formato –(re)skimming –Reprocessing dei dati (ove necessario) Tutto questo in parallelo con il processing dei nuovi dati, grazie al nuovo hardware in arrivo ad Ottobre.

22/09/2003F. Safai Tehrani - Stato del Calcolo di BaBar24 Prospettive di espansione hw Luminosita’ integrata (fb -1 ) Farm Analisi CPU(CPUunit) Disco (TB) Farm (re)processing CPU(CPUunit) Disco (TB)+8+2