Servizi per CCRC, INFN Grid release, stato dei servizi centrali e T2

Slides:



Advertisements
Presentazioni simili
1 La farm di ATLAS-Napoli 1 Gb/s 7 nodi con 2 CPU PIII a 1 GH, RAM 512 MB, 2 schede di rete a 100 Mb/s. Server con 2 CPU PIII a 1 GH, RAM 1 GB, 2 schede.
Advertisements

1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 20/12/2007 S.Pardi.
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
Conclusioni M. Paganoni workshop CMS Italia, Napoli 13-14/2/07.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
Last quarter work and future activities
CCR 14-15/03/2006 Status Report Gruppo Storage CCR.
Infrastruttura GRID di produzione e i T2 Cristina Vistoli Cnaf.
Test Storage Resource Manager per SC4 Giacinto Donvito Vincenzo Spinoso.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
Gruppo di referaggio: Forti (chair), Bossi, Ferrari, Menasce, Morandin, Simone, Taiuti, Zoccoli TIER2: Update F. Bossi, CSN1 Trieste 7/7/05.
CMS 1 M. Biasotto – Bologna 20/01/2005 Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia.
Calcolo LHC Francesco Forti, Università e INFN – Pisa Per il gruppo di referaggio: F. Bossi, C. Bozzi, R. Carlin, R. Ferrari, F.F., D.Martello, M.Morandin,
I testbed ed il loro uso 1 I testbed ed il loro uso L. Gaido, A.Ghiselli CSN1, Perugia novembre 2002.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
SCOPE: stato e piano di integrazione Phd. Silvio Pardi CNAF
ALICE Computing Readiness Workshop Tier-2 CNAF Jan 17-18, ALICE Computing Readiness 1) ALICE Italia: Persone & organizzazione 2) Test & commisioning.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF Riunione CCR
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
EGEE is a project funded by the European Union under contract IST L'infrastruttura di produzione attuale A. Cavalli - INFN- CNAF D. Cesini.
Alessandro De Salvo Status dei Tier2 di ATLAS Alessandro De Salvo
Domenico Elia1 Calcolo ALICE: stato e richieste finanziarie (aggiornamenti) Domenico Elia Riunione Referee Calcolo LHC / Bologna, Riunione con.
Torino, Andrea Dainese 1 Andrea Dainese (INFN – LNL) Stato del Tier-2 ALICE a Legnaro.
Acquisti TIER T2 team e Pistoni per la consulenza sull’hardware.
20-21/03/2006Workshop sullo storage - CNAF Alessandro Brunengo.
Procedura di certificazione di un sito
SCoPE - Stato dei Lavori
Relazione utilizzo rete, proposte per banda e collegamenti extra GARR
Riunione ALICE Italia - Referee stato e richieste finanziarie
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Problema T1 30 settembre Andrea Chierici CDG T1.
Attività In estrema sintesi (inutile ripetere i dettagli):
Monitoring e loadbalancing dei servizi Grid
Tiziana Ferrari (INFN CNAF), Luciano Gaido (INFN TO)
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
Dichiarazione dei servizi di sito nel GOCDB
Stato della Grid di produzione
Release LCG/INFN-GRID 2.4.0
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
Introduzione al progetto INFNGRID
CMS T2: monitoring Cosa c’e’ / cosa vorremmo / cosa manca
Stato e caratterizzazione della Grid di produzione italiana ed europea
Assegnazione risorse Stato INFN CNAF,
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
Analisi dei dati dell’Esperimento ALICE
Aggiornamento sullo stato del Tier-2 di Catania
Portal Architecture Data Management
Tier2 Milano Gli acquisti di fine 2008 saranno installati in 10 giorni circa Nuovo Storage Element vicino a commissioning No RFIO, cache, GPFS based, usato.
PI2S2 Regional Operation Centre Sistema di Supporto Sistema di Monitoring Rita Ricceri Consorzio Cometa Tutorial per Site Administrator Messina,
Luciano Gaido (INFN - Torino) Workshop CCR/INFNGRID – Palau
Job Application Monitoring (JAM)
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
Calcolo “locale” ATLAS-Mi
Report 15/11/2007 Giovanni d’Angelo
Risultati del questionario sui servizi middleware aggiuntivi
Report di attività e richieste 2008
PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno
Atlas Milano Giugno 2008.
La richiesta si basa sulle seguenti considerazioni:
Marcello Iacono-Manno Catania, 6 maggio 2010
STATO DEL PROTOTIPO DI SCoPE E DELL’INTEGRAZIONE TRA I 4 PON
Infrastruttura GRID di produzione italiana:
INFN-Grid DI PRODUZIONE grid-use-model grid.infn.it
EMI Fine progetto 30 Aprile 2013 Andamento progetto generale
Transcript della presentazione:

Servizi per CCRC, INFN Grid release, stato dei servizi centrali e T2 Enrico Fattibene, Tiziana Ferrari, Paolo Veronesi

Overview Requirement middleware CCRC08 Release INFN Grid Stato upgrade dei Tier2 WMS centrali d'esperimento + Monitor FTS

Base service version CCRC'08 https://twiki.cern.ch/twiki/bin/view/LCG/GSSDCCRCBaseVersions Requirement decisi dalle VO?

CCRC'08 Service Requirements (1/3)‏ http://igrelease.forge.cnaf.infn.it/doku.php?id=doc:ccrc_08

CCRC'08 Service Requirements (2/3)‏ http://igrelease.forge.cnaf.infn.it/doku.php?id=doc:ccrc_08

CCRC'08 Service Requirements (3/3)‏ http://igrelease.forge.cnaf.infn.it/doku.php?id=doc:ccrc_08

CE deployment plan CCRC'08 discusso alla phone SA1 Italia http://agenda.cnaf.infn.it/conferenceDisplay.py?confId=84 CE: SL3 o SL4. I test di DGAS non sono stati completati per cui si raccomanda di usare SL3. L'ultima release (INFNGRID/gLite update 38) include degli aggiornamenti di DGAS fortemente richiesti da Atlas. Se si fa solo il passaggio da update 37 a 38 non c'e' bisogno di riconfigurare il profilo perche' e' solo un update degli rpm. Richiede solo la riconfigurazione di DGAS. - Bari (probabilmete update 37 a meno che non richiesto specificatamente da CMS); - Legnaro, INFN-Pisa non intendendono per il momento aggiornare il CE visto che non e' strettamento necessario; - Torino ha una situazione mista (la parte dgas e' gia' allineata). - Cagliari (update 37), Napoli (per il problema dell'accounting), Frascati (fermi all' update 34), Milano (update 32) provvederanno all'aggiornamento. CMS richiede CE su SL4 in tutti i tier2

WN deployment plan Legnaro, Catania, Bari tutti su SL4 e prevedono di passare all'update 12. Frascati, Napoli su SL3 e non pensano di passare a SL4 in tempi brevi. Torino sia su SL3 che su SL4. Si prevede di passare lentamente solo su SL4. Milano: puo' bastare una coda con pochi WN SL4? RISP: Il modello di deployment per farm miste (WN su SL3 e WN su SL4), prevede due CE (uno che pubblica SL3 e uno che pubblica SL4), che pubblichino il tag di SO e vedano solo le code con WN omogenei. Eventualemte da concordare con l'esperimento supportato la necessita' (o deroga) di passare o meno i WN su SL4. In generale, sui WN e le UI sono fortemente richieste le lcg_util e le librerie GFAL aggiornate. ATLAS richiede WN su SL4 in tutti i tier2?

Storage deployment plan Storm 1.3.19 verra' rilasciato il 31 gennaio 2008 presente in INFN-GRID e non in gLite. La versione 1.3.18 e' installata solo al CNAF. Nessun sito prevede di installare Storm nelle prossime settimane. Solo Atlas prevede piu' avanti di testare Storm sui T2. dCache 1.8.0-12 +p1 + p2 versione non ancora disponibile in gLite e in INFN-GRID, ma solo sul sito dCache; CMS ha fatto richiesta di fare l'upgrade prima della fine del mese (prima dell'inizio di CCRC08). Upgrade cominciato. Bari; Legnaro e Pisa : sono in attesa dei risultati da Bari e poi la settimana successiva (la prima di febbraio) si pensa all'upgrade. DPM: 1.6.7.2. Su SL3 c'e' la versione richiesta da gLite mentre non e' disponibile per SL4. Milano, Napoli, Frascati hanno DPM su SL3 non e' stato richiesto di aggiornare a SL4 e non e' stato richiesto il passaggio a 1.6.7.2 LFC installato solo al Tier1 dove c'e' la replica globale di LHCb e la replica locale di Atlas. Da investigare se e' stato richiesto l'aggiornamento su SL4

Support list: fts-support@cnaf.infn.it FTS server @ CNAF Supported VOs: ALICE, ARGO, ATLAS, CMS, DTEAM, LHCB, OPS, VIRGO Installed and managed via Quattor; Support list: fts-support@cnaf.infn.it TEST OK Update rilasciato Venerdi'

VO dedicated production WMS, LB and LCG-RB at CNAF WMS and LB updated to PPS repository which contains all patches requested for CCRC08 WMS 3.1 sl3: glite-WMS-2.4.6-0 LB 3.1 sl3: glite-LB-2.3.4-0 https://twiki.cern.ch/twiki/bin/view/LCG/GSSDCCRCBaseVersions ATLAS wms001 (WMS) -> wms003 (LB) wms002 (WMS) -> egee-rb-06 (LB) CMS wms006 (WMS) wms011 (WMS) wms012 (WMS) egee-rb-04 (WMS) wms009 (WMS) wms014 (WMS) egee-rb-03 (LCG-RB) wms007 (LB) wms013 (LB) CDF wms004 (WMS) -> wms005 (LB) ALICE egee-rb-02 (LCG-RB) egee-rb-09 (LCG-RB) LHCB wms006 (WMS) -> wms007 (LB) Temporarily Lent to CMS BIOMED egee-rb-07 (LCG-RB)

WMS instances at CNAF recent problems WMS much stabler than a few months ago, daemons rarely crashing, but... dg20 files accumulating on WMS No problem for WMS service, but user receiving info about job with big delay LB Configuration allowing for more contemporary connections 1 LB for each WMS DISK FULL – Problem with Output Sandbox (Service Killer)‏ Bugs in the output sandbox limiter (disabled)‏ Implemented own made scripts to delete old unretrieved sandboxes and sandboxes exceeding 100MB Some performance problems still not well understood Jobs accumulating in WMqueue (input.fl) or JC queue (queue.fl)‏

WMS Monitoring (CERN tool)‏ https://yam-server.cnaf.infn.it/monitoring/

WMS Monitoring (CNAF tool)‏ https://cert-wms-01.cnaf.infn.it:8443/wmsmon/main/main.php

BACKUP

http://tier1.cnaf.infn.it/ftsmonitor/