Infrastruttura GRID di produzione italiana:

Slides:



Advertisements
Presentazioni simili
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
Advertisements

Interoperabilità tra i PON Giuseppe Andronico (INFN e Consorzio COMETA)
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 20/12/2007 S.Pardi.
Testbed release: processo di integrazione e validazione A. Ghiselli, L. Gaido.
Meeting WP 1 (Globus) 11 Gennaio 2001 Massimo Sgaravatto INFN Padova.
Introduzione Grid1 Introduzione ai Sistemi Grid. Introduzione Grid2 Generalità Un sistema Grid permette allutente di richiedere lesecuzione di un servizio.
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
25 ottobre 2002infn1 FIRB-Grid WP3,5 Grid deployment.
GridICE attività in corso e sviluppi futuri Gennaro Tortone Bologna, 4 marzo Technical Board INFNGRID
Last quarter work and future activities
Infrastruttura GRID di produzione e i T2 Cristina Vistoli Cnaf.
16 Maggio CSN1 Computing-Software-Analysis CMS-INFN TEAM Analisi in CMS: stato e prospettive del supporto italiano.
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Draft planning of the report Massimo Sgaravatto INFN Padova.
I testbed ed il loro uso 1 I testbed ed il loro uso L. Gaido, A.Ghiselli CSN1, Perugia novembre 2002.
OpenShift Origin – Cosa è
Overview del middleware gLite Guido Cuscela INFN-Bari II Corso di formazione INFN su aspetti pratici dell'integrazione.
SCOPE: stato e piano di integrazione Phd. Silvio Pardi CNAF
E. Ferro, F. Fanzago - CNAF, Bologna - 1/07/2004 Release LCG & INFN-GRID Enrico Ferro INFN - Padova.
Grid operations Luciano Gaido (INFN-Torino) ( Contributi di A. Cavalli, A. Paolini, A. Pagano) Incontro con i referee di INFN-GRID CNAF, 7 marzo 2007.
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
EGEE is a project funded by the European Union under contract IST L'infrastruttura di produzione attuale A. Cavalli - INFN- CNAF D. Cesini.
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
HLRmon per IGI: nuove funzionalità Enrico Fattibene INFN – CNAF
Do You Want To Pass Actual Exam in 1 st Attempt?.
Procedura di certificazione di un sito
SCoPE - Stato dei Lavori
Problema T1 30 settembre Andrea Chierici CDG T1.
Integrazione tier3 in Grid Paolo Veronesi, Luciano Gaido
Attività In estrema sintesi (inutile ripetere i dettagli):
Riorganizzazione delle attivita' di controllo della Grid
Riunione INFN – Bologna, 17 January 2013
IGI: gestione dell’infrastruttura, middleware release e certificazione
Monitoring e loadbalancing dei servizi Grid
MONBOX Federico Bitelli bitelli<at>fis.uniroma3.it
l’organizzazione di IGI
Tiziana Ferrari (INFN CNAF), Luciano Gaido (INFN TO)
Problemi aperti Luciano Gaido (INFN - Torino)
Dichiarazione dei servizi di sito nel GOCDB
Stato della Grid di produzione
Jobs and occupations What do they do?
Cristina Vistoli – INFN CNAF
Release LCG/INFN-GRID 2.4.0
Servizi per CCRC, INFN Grid release, stato dei servizi centrali e T2
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
Introduzione al progetto INFNGRID
I progetti PI2S2 e TriGrid VL
Sicurezza e Grid Computing
Stato e caratterizzazione della Grid di produzione italiana ed europea
Assegnazione risorse Stato INFN CNAF,
Come entrare in GILDA Riccardo Bruno INFN – Sez. CT
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
L’infrastruttura grid italiana nel contesto internazionale
Prototipo Tier 2 di CMS-INFNGRID M. Biasotto - INFN Legnaro
Valeria Ardizzone INFN Catania Martina Franca (TA),
PI2S2 Regional Operation Centre Sistema di Supporto Sistema di Monitoring Rita Ricceri Consorzio Cometa Tutorial per Site Administrator Messina,
Grid Monitoring: bacct - lsload
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
ONEDATA - distributed data caching -
Gruppo Proxmox ImoLUG: vedere provare condividere
Risultati del questionario sui servizi middleware aggiuntivi
Report di attività e richieste 2008
Marcello Iacono-Manno Catania, 6 maggio 2010
GENIUS Grid Portal Lorenzo Neri INFN Catania
STATO DEL PROTOTIPO DI SCoPE E DELL’INTEGRAZIONE TRA I 4 PON
Job Management Systems ovvero
INFN-Grid DI PRODUZIONE grid-use-model grid.infn.it
Evolution of Information Modeling and Discovery of Grid Resources
Transcript della presentazione:

Infrastruttura GRID di produzione italiana: stato ed organizzazione del supporto e delle operation Cristina Vistoli INFN Cnaf

Infrastruttura Grid di Produzione 37 ‘resource centers’: Tutti i siti sono accessibili attraverso i servizi (Resource Broker) di Grid 25 siti fanno parte della infrastruttura EGEE/LCG registrati nel GOCDB 12 siti aggiuntivi sono accedibili solo dai servizi italiani http://grid-it.cnaf.infn.it

Production Infrastructure: Resources

INFNGRID-2.6.0 deployment status: resources

INFNGRID-2.6.0 deployment status: Core SERVICES INFNGRID 2.6 On SCIENTIFIC LINUX 3.05 RLS LFC Gridice RB VOMS MyProxy GIS

La grid di produzione Obiettivo principale della organizzazione a supporto della infrastruttura GRID Fornire release di middleware stabile, certificata, documentata e con procedure automatiche di installazione adatte alle complessita’ delle farm Controllare le installazioni, le configurazioni e l’efficienza dei servizi Grid Collaborare con i site manager Fornire supporto agli utenti Garantire supporto agli esperimenti e alle applicazioni e promuovere l’integrazione dei servizi specifici di esperimento nei servizi comuni

EGEE/LCG EGEE SA1 garantisce l’operatività dell’infrastruttura di grid Europea La partecipazione italiana in EGEE/SA1 consiste in ROC (regional operation center) CIC (core infrastructue center) Gestione dei servizi generali di Grid (broker risorse, gestione dei cataloghi di File, monitoring e accounting dell’utilizzo, VOMS…) Sviluppo o adattamento di strumenti di controllo Produzione della release di middleware e relativa documentazione Controllo e certificazione delle configurazioni e della funzionalità dei siti Supporto agli utenti Supporto agli esperimenti per l’integrazione in Grid Porting e interoperabilita’

I siti inseriti nella Grid di produzione I nodi della grid di produzione devono: Fornire supporto sistemistico per le installazioni e configurazioni del middleware Rispondere prontamente ai problemi operativi e fornire un contatto di ‘sicurezza’ Fornire supporto agli utenti Partecipare ai turni di controllo dei servizi Grid della infrastruttura nel suo complesso Contribuire per: garantire distribuzione delle competenze e aggiornamento maggiore affidabilita e qualita’ del supporto

INFNGRID-2.6.0 features It is essentially LCG-2.6.0 with some additional features: new Network Monitor profile improved support for LSF and MPI support for additional VOs (managed via LDAP VO server): babar, zeus support for the additional VOs (managed via VOMS server): infngrid, cdf, gridit, compchem, planck, bio, enea, theophys, ingv, inaf, virgo, argo support for MPI jobs via home syncronisation with scp with hostbased authentication DGAS (DataGrid Accounting System)

Release and documentation Documentation: site installation guide, release notes…. Software repository Site management guide FRY is a tool developed by the Release and Documentation group of SA1 Italian ROC to perform quickly a set of basic test on all the grid elements (CE, SE, RB, WN,...). The idea is to increase the speed and reliability of the release certification phase, performing a "standard" set of tests to verify automatically configuration/setup troubles (daemons, permission and ownership of some directories, ...). http://grid-it.cnaf.infn.it/index.php?sitetest&type=1 DGAS checklist [new] DGAS developers produced this document to check if DGAS configuration is ok: UiPNP Installation of LCG 2.6 on IA64 http://www.spaci.it/egee/content.php?loc=docs&pg=default.php http://grid-it.cnaf.infn.it/index.php?siteman&type=1

Release and documentation

VO supportate

Central Management Team Site Certification The CMT is responsible of the certification: checking the functionalities of a site before to join the site to the production grid. In particular checks: GIIS' information consistence Local jobs submission (LRMS) Grid submission with Globus (globus-job-run) Grid submission with the ResorceBroker ReplicaManager functionalities  In order to certificate a site the CMT uses dedicated grid services   RB: gridit-cert-rb.cnaf.infn.it BDII: gridit-cert-rb.cnaf.infn.it In this way we avoid to have an uncertificate site in the production grid. The same grid services should be used for test activities.  

Support: regional operation center First level support: Italian ROC shifts The Italian ROC provides geographically based local front line support to Virtual Organization, Users and Resources Centres Provided through daily shifts Check list to be covered during the shift Periodic (every 15 days) phone conference ROC/CIC teams and site managers ROC report to GDA Shitf example, weekly based: Second level support: CIC on Duty Weekly shift CIC tools

Support system Problems Communication : ROC on Duty and site managers Site managers to Central management team and viceversa Site certification during installation/upgrade -GGUS to ROC

Tickets statistics starting date: August 2005 530 total 131 from GGUS

Voms proxy VO 28-30 Apr May June July Aug Sep 01-09 Oct total argo 3 3 bio 81 62 8 53 9 213 cdf 31 808 1029 868 867 777 243 4623 compchem 35 2 4 78 7 135 enea 1 37 139 43 229 gridit 41 48 45 110 24 268 inaf 6 5 20 34 infngrid 298 274 177 151 409 69 1387 ingv 13 18 12 59 planck 11 theophys 22 virgo 10 60 1141 1493 1241 1108 1627 406 7064

Job status 1/2 6/dec/2005 10.33

Job status 2/2 6/dec/2005 10.33

Jobs per site dal 21/11 al 12/04 Total jobs =121406

N.B senza T1 per vedere meglio le percentuali

Jobs per VO dal 21/11 al 04/12

Job report 21/11 - 05/12 n.b INFN T1 non included

Job report 21/11 - 05/12

Supported hardware and platform LCG is officially supported on the following platforms. i386 Standard PC and clones based on the Intel i386 architecture and compatible processors IA64 on Itanium / Itanium 2 (Spaci for Italy – openlab for Cern) amd64 AMD64-based systems (32 bit) Official support means that the release install media is known to work, that the architecture can self-compile tself,

Minimal hardware request CPU: For all nodes a Pentium with more than 500MHz Memory: More than 256MB Disc: The middleware uses about 1GB, in addition the RBs require at least 20GB for the storage of the sandboxes. The WNs need adequate scratch space of at least 5GB for each job run at the same time. The SEs storage size depends on the applications Shared Filesystem: A small shared file system is currently required for the storage of the experiments software. Network: A network card with at least 10Mbit is required.

Software request Il middleware LCG supporta ufficialmente: Scientific Linux versione 3 The base SL distribution is basically Enterprise Linux, recompile from source. Porting in corso su MacOS X, Solaris, EMT64, FC4, AIX, IRIX… Per la precisione… (segue)

Porting in corso… CERN/UVienna/Apple MacOS X port available (focus on UI: WMS, …) Grid-Ireland WN ports available for CentOS 4.1, Suse 9.3, RedHat 7.3/9 Work in progress on MacOS X, Solaris, EMT64, FC4, AIX, IRIX GSI (Germany) Debian port (UI and WN?) IRB (Croatia) Debian: tar fixes (UI), chroot (CE+WN), converting RPMs to DEBs (ongoing); FreeBSD: tar (UI) HPC2N Umea (Sweden) Porting gLite to Ubuntu (Debian) EGRID (Italy) LiveCD with all service nodes, UI-only relocatable installation

Pre-production activities CNAF site is already part of the PPS: Two more sites (Bari and Padova) will join the PPS infrastructure soon

Certification services INFN Grid Certification Testbed to test and certificate the Grid software developed inside the INFN: gLite and LCG.  to certify new INFN-GRID releases installation Five sites: INFN-TORINO, INFN-PADOVA, INFN- CNAF, INFN-ROMA1 and INFN-BARI. The activity is carried out in strict collaboration with the INFN-LCG-EGEE development teams, the EGEE Pre Production Service, ECGI and the Experiment task forces http://grid-it.cnaf.infn.it/certification/

CNAF CERTIFICATION / PRE-PRODUCTION cert-rb-02 (WMS+LB) Cert Sites cert-rls-01 (gLite1.2FireMan Cat.) glite-rb-00 (1.4 WMS+LB) LCG-2.6.0 Site gLite-1.3 Site cert-mon-it (1.2 R-GMA server With Registry/Schema) EGEE Production BDII cert-rb-03 (gLite 1.4 WMS+LB) cert-pbox-01 (PBOX server) cert-bdii-01 (LCG-2.6.0 BDII) Services for PBOX TESTS devrb (rb) devui (ui) Release Creation/Test +3 servers dedicated to STORM tests pre-ui-01 (gLite 1.1 UI) cert-voms-01 (gLite 1.3 VOMS Server) cert-voms-02 (gLite1.1 VOMS Server) cert-ui-01 (gLite 1.2 with bulk UI) gLite-1.2 Site cert-rb-01 (1.2 WMS+LB) APT Repository cert-mon (gLite 1.2 R-GMA Server) ALL PPS

Conclusioni L’infrastruttura nazionale di produzione fornisce ora risorse e supporto alle applicazioni nazionali I passi successivi: Allargare l’infrastruttura a nuove applicazioni Migliorare l’organizzazione in modo da includere facilmente altre risorse, risorse di progetti, universita’ etc. Garantire la condivisione ma fornire anche priorita’ e regole per rispettare i desiderata dei proprietari delle risorse Fornire spazio adeguato per la sperimentazione dei nuovi sviluppi di middleware su ampia scala