A.Fanfani - C.Grandi CMS Bologna 10 febbraio 2009 La nuova farm di CMS Bologna al CNAF Alessandra Fanfani Claudio Grandi.

Slides:



Advertisements
Presentazioni simili
1 Introduzione ai calcolatori Parte II Software di base.
Advertisements

E835 & Hera-B Concezio Pisa, 21/12/2004. E835 (aka Jet-FNAL) timeline dell'esperimento –Presa dati conclusa nel Alcune analisi tuttora in corso.
Sicurezza dei dati e privacy. Nel computer sono conservati dati molto importanti e per questo motivo si deve impararli a proteggerli.
Progetto Speciale Prototipo Tier1 F. Ruggieri INFN – CNAF I Workshop CMS Italia del SW e Computing Roma 22 Novembre 2001.
Aspetti critici rete LAN e WAN per i Tier-2
WP 2.4 al Cnaf Cnaf 13/11/00 P.M Hardware: - 12 PC Rack mountable IBM XSeries 330 (1U) 2 processori Pentium III 800 Mhz, FSB 133 Mhz 512 MB Mem Ecc, Controller.
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
Supercalcolo al CILEA: risorse e opportunità CAPI /11/2005 Dr. Claudio Arlandini, PhD HPC System Administrator.
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
Vincenzo Vagnoni per il gruppo di Bologna
Microsoft Windows Installazione, gestione ed utilizzo delle risorse Microsoft nella sezione INFN di BOLOGNA.
Michele Michelotto INFN-Padova
LNL M.Biasotto, Bologna, 13 dicembre La farm di Legnaro Massimo Biasotto – INFN LNL.
Execution benchmarks Obiettivi Test dettagliati e ben caratterizzati Esecuzione di benchmark standard Test di applicazioni dell'esperimento ALICE 20 Novembre.
M. Biasotto – INFN Legnaro
LNL M.Biasotto, Bologna, 18 ottobre La farm CMS di Padova - Legnaro Proposta di acquisto hardware 2° semestre 2001.
LNL M.Biasotto, Bologna, 19 marzo La farm CMS di Padova - Legnaro Proposta di acquisto hardware 1° semestre 2001.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
Case study Maiora srl.
GIADA O N L I N E.
Benigno Gobbo – INFN Trieste 1 CSNI 21 maggio 2001 Stato della farm di COMPASS-TS CSNI Roma, 21 maggio 2001 Benigno Gobbo INFN Trieste
Stefano Zani e Pierpaolo Ricci (INFN CNAF)
Architettura di storage ad alta affidabilita e bilanciamento di carico per volumi centrali e di esperimento A.Brunengo, M.Corosu INFN Sezione di Genova.
Alessia Tricomi Università & INFN Catania
A cura di: Huber Roberto, Zaharulko Nicola, Debernardi Daniele.
Il supercalcolo fai-da-te
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
LNL GM, CNAF, 18 ottobre INFN-Farm Management Toolkit 1.Fabric Management per DataGrid e INFNGrid 2.Definizione dei requisiti degli esperimenti.
1 Collaboration Server “La collaborazione verso il successo” Che cosa è un Collaboration Server? A cosa mi può servire?
Analysis unibo una proposta. Work flow di una tipica analisi 1.Simulazione di piccoli campioni di eventi per studio segnale 2.Generazione in grande.
Riunione gruppo storage – Roma 05/05/2005 Test di affidabilita’ e performance a Genova Alessandro Brunengo.
Servizio Sistema Informativo - Area Gestione Sistemi e Sicurezza – LNF – Dael Maselli Area Gestione Sistemi e Sicurezza LNF Plenaria Servizio Sistema Informativo.
Test Storage Resource Manager per SC4 Giacinto Donvito Vincenzo Spinoso.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
Competenze e attività gestite dai servizi di calcolo e reti. Paolo Mastroserio.
Condor standard. Sistema Batch. Tool di installazione D. Bortolotti,P.Mazzanti,F.Semeria Workshop Calcolo Paestum 9-12 Giugno 2003.
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Workshop CCR Otranto - giugno 2006 Gruppo storage CCR Status Report Alessandro Brunengo.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
CMS 1 M. Biasotto – Bologna 20/01/2005 Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
M.Biasotto, Bologna, 28 giugno 2004 M.Biasotto, Bologna, 28 giugno LNL CMS T2 Legnaro Stato attuale e richieste 2004/2005.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
Nuovo Ambiente CS7402. Attività Principali Gli obiettivi principali della migrazione sono stati quelli di ottenere: –Un’infrastruttura di produzione (Mainframe.
CDF Calcolo Another brick in the wall Paolo Morettini CSN1 Lecce Valerio Vercesi Settembre 2003.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
Riunione SICR E. P.. Aggiornamenti Certificati  Digicert  Server  Personali per dipendenti ed associati  Certificati INFN per laureandi non associati.
CNAF 6 Novembre Layout del testbed  wn a OS SL5.0 8 GB RAM kernel xen_3.1.0 SMP  wn a OS SL5.0 8 GB RAM kernel.
Roberto Covati INFN di Parma. Workshop CCR/INFN GRID Palau maggio Sommario VmWare Server (in produzione dal 2004 al 2008) VmWare Infrastructure.
Roberto Covati – Roberto Alfieri INFN di Parma. Incontri di lavoro CCR dicembre Sommario VmWare Server (in produzione dal 2004) VmWare ESX.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
FESR Consorzio COMETA - Progetto PI2S2 Il Tier-2 di ALICE a Catania Roberto Barbera Università di Catania e INFN Visita Referee.
19 Ottobre 2012ATLAS Milano1 Stato delle risorse locali di calcolo L. Carminati, L. Perini, D. Rebatto, L. Vaccarossa.
Attività e servizi di calcolo a Roma Tor Vergata R. Kwatera, R. Lulli, R. Sparvoli Roma Tor Vergata.
Aggiornamento sui lavori di ampliamento degli impianti infrastrutturali del TIER1 e stato delle risorse Cristina Vistoli – Massimiliano Fiore INFN-CNAF.
1 ALICE I ITER2 DI ALICE IN ITALIA Bologna, 6 marzo 2007 M. Masera
Martedi 8 novembre 2005 Consorzio COMETA “Progetto PI2S2” UNIONE EUROPEA Accesso all’infrastruttura Grid del Consorzio COMETA Grid Open Day alla Facoltà.
Test di storage a 10 Gbps proposta. Storage server a 10Gbps Si vuole vedere quali prestazioni si possano ottenere da server connessi a 10 GE –capacita’
20-21/03/2006Workshop sullo storage - CNAF Storage nei Servizi Calcolo delle sezioni INFN Alessandro Brunengo.
The INFN Tier-1: progetto di ampliamento Cristina Vistoli – INFN CNAF Referee Meeting Sep
Gruppo Server Commissione Calcolo e Reti 15 Marzo 2006.
CCR - Roma 15 marzo 2007 Gruppo storage CCR Report sulle attivita’ Alessandro Brunengo.
Il calcolo per l’esperimento GERDA Luciano Pandola INFN, Laboratori del Gran Sasso Riunione della CSN2, LNF Frascati, 29 Novembre 2011.
Aggiornamento AFS R.Gomezel Commissione Calcolo e Reti Presidenza 5/10/2010-7/10/2010.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
Transcript della presentazione:

A.Fanfani - C.Grandi CMS Bologna 10 febbraio 2009 La nuova farm di CMS Bologna al CNAF Alessandra Fanfani Claudio Grandi

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 2 Hardware farm Acquisti 2008: –Storage: Sistema Proware EPICa EP-3169S-F4S3 con doppio controller Fibre Channel ognuno 2*4Gbps, 1GB cache/controller, 16 dischi SATA-II da 1 TB; 13248,00 IVA inclusa –CPU: 2 lame HP Blade Server BL460c con 2 CPU quad- core Intel Xeon E5430, 2.66 GHz,, 16 GB RAM, 1 disco SAS 73 GB; 5644,80 IVA inclusa –Schede HBA: 1 Qlogic QLA2462 (2*4 Gbps); 816,00 IVA inclusa. Inoltre 1 Qlogic QLA 2340 (1*2 Gbps) in prestito da Legnaro Esistente: –CPU: 3 workstation 1U SUN FIRE V20Z con 2 CPU AMD Opteron 252, 2.6 GHz, 4 GB RAM, 2 dischi SCSI 73 GB

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 3 Configurazione farm bo.infn.it cmsbo01cmsbo02cmsbo03cmsbo04cmsbo05 storage 16 TB 2 Gbps Fibre Ch. LAN cnaf.infn.it 1 Gbps ethernet nuove lame ospitate nellenclosure di ATLAS vecchie sun dalla farm attuale 2*4Gbps Fibre Ch. accesso alla rete del cnaf tramite la back- door (senza firewall) stand-by (subentr a in caso di problemi) active Front-end Storage User Interface Punto daccesso alle risorse Grid Analisi locale Login interattivo

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 4 Riassunto NodoHardwareSoftwareStato cmsbo01 SUN FIRE V20Z dual-AMD Opteron single core SLC4 32-bit Storage front-end Attivo cmsbo02 SUN FIRE V20Z dual-AMD Opteron single core SLC4 32-bit Storage front-end Attivo cmsbo03 SUN FIRE V20Z dual-AMD Opteron single core SLC4 32-bit (?) User Interface Ancora sulla farm vecchia cmsbo04 HP Blade Server BL460c dual-Intel Xeon quad-core SLC4 64-bit User Interface Attivo cmsbo05 HP Blade Server BL460c dual-Intel Xeon quad-core SLC4 64-bit User Interface Attivo

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 5 Configurazione dischi 16 TB (raw) configurati in un unico volume da 12 TB (netti) in RAID-6 con un disco hot-swap –supporta la rottura contemporanea di due dischi e il recover automatico in caso di rottura di un disco 12 TB suddivisi in 6 partizioni logiche da 2 TB Al momento 3 partizioni sono attive: 1./data: dati (area senza backup) 2./gw_share: home directories e software 3.backup delle home (attualmente della farm vecchia) visibile solo da cmsbo01/2, quindi non accessibile agli utenti Le altre partizioni possono essere aggiunte a ciascuna delle 3 in base alle esigenze –quando si aggiunge alla home (2) si deve aggiungere anche alla partizione di backup (3), quindi bisogna cercare di usare /data (1) quando possibile

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 6 Migrazione Grazie alla back-door non ci sono problemi di firewall. Partendo da macchine in bo.infn.it ssh –Y cmsbo04.cnaf.infn.it vi fa avere il display sulla vostra macchina come di solito [Partendo da altri domini occorre passare da lnxbo.bo.infn.it] Le home directories sulla nuova farm sono congelate al 28/1/2009. E necessario sincronizzarle con quelle della vecchia farm per tutti lo stesso giorno, altrimenti diventa un delirio... –Una volta terminati configurazione e setup finale dello storage (un paio di settimane) ci sarà da decidere quando fare la migrazione –La migrazione comporterà inaccessiblità della farm per una giornata Account di persone che non lavorano piu nel gruppo saranno rimossi e gli account di persone del gruppo che non si collegano da anni avranno login disabilitato di default

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 7 Migrazione: CMSSW Dopo la migrazione ognuno dovra ricrearsi le proprie aree CMSSW perche i path fisici sono cambiati mv CMSSW_X_Y_Z OLDCMSSW_X_Y_Z scramv1 project CMSSW CMSSW_X_Y_Z cp –r OLDCMSSW_X_Y_Z/src CMSSW_X_Y_Z/src/. cd CMSSW_X_Y_Z/src cmsenv scramv1 b Al momento sono installate: –CMSSW_2_0_12 –CMSSW_2_1_9 –CMSSW_2_2_1, CMSSW_2_2_3, CMSSW_2_2_4 –Non saranno installate releases precedenti come CMSSW_1_8-* e CMSSW_1_6-*, a meno che non ne sia fatta esplicita richiesta

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 8 Come si può usare la Farm Copiare un file di dati –Usare FileMover per copiarloFileMover Testare/debuggare il proprio codice in locale Sottomettere jobs su Grid con CRAB per analizzare tutta la statistica dei dataset di interesse –È necessario un certificato Grid Recuperare i propri istogrammi o ntuple prodotte in Grid, analizzarle (interattivamente) con ROOT e condividerle con altri utenti del gruppo –se gli output prodotti sono ciascuno decine di MB si possono copiare direttamente sulla farm (via CRABServer) –se gli output prodotti sono grandi O(1GB) andranno copiati dai job sullo Storage Element di Legnaro

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 9 Perchè usare la farm Perchè avete spazio per immagazzinare i vostri output e per le vostre aree di lavoro Perchè potete analizzare interattivamente i vostri output o piccole frazioni di dati Perchè non funzionerà laccesso di tutti alla CAF ed è meglio imparare prima che poi ad utilizzare le risorse disponibili Perchè in base allesperienza di utilizzo si potranno identificare le reali esigenze del gruppo di Bologna e fare evolvere la farm secondo le necessità

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 10 Storage Element e PhEDEx Possibilità di far diventare lo storage uno Storage Element Grid Funzionalità di uno Storage Element per un utente –Copiarci direttemente loutput dai job Grid –Installarci PhEDEx per copiare moli di dati da altri siti Le competenze ci sono ma costano....si aggiungono solo le funzionalità realmente utilizzate

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 11 Prospettive Sito INFN-Bologna in Grid –In comune con gli altri esperimenti –Sito Grid a tutti gli effetti (Tier-3++) Con CPUs e con Storage Element Grid –Finanziata in gran parte dallUniversità –Quasi sicuramente non attiva fino allinizio del 2010 Indipendentemente dalla creazione del sito come gruppo di Bologna abbiamo bisogno di mantenere un pool di macchine per il login-interattivo e lanalisi locale –Prevediamo nel 2009 di avere bisogno di altro spazio? Il costo di una espansione con 16 dischi da 1 TB da collegare allo storage (max 4 espansioni) e di 6684,00 IVA inclusa (prezzo estate 2008, ora sara sicuramente meno) –Finche non avremo il sito Grid avremo comunque bisogno di uno Storage Element? Dipende se cè realmente un uso massiccio della farm e se questa funzionalità diventa rilevante.

A.Fanfani - C.Grandi 10 febbraio 2009 CMS Bologna 12 Supporto Andrea Paolucci del servizio di calcolo per la sistemistica Alessandra Fanfani e Claudio Grandi per il software (CMS e UI) Daniele Bonacorsi per un eventuale StorageElement e Phedex Un giovane volonteroso non guasterebbe...