Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoBernadetta Savino Modificato 6 anni fa
1
Stato e caratterizzazione della Grid di produzione italiana ed europea
T. Ferrari, A. Paolini – INFN CNAF Presente e futuro delle attività operative nella Grid Italiana” 05-06 Febbraio 2009
2
Outline Part 1: the EGEE Italian Region
Overview of the Italian Grid infrastructure in EGEE Part 2: European grid infrastructure in numbers Grid user distribution Resource and site distribution among countries Tickets Stato e caratterizzazione della Grid di produzione italiana ed europea
3
Part 1: The EGEE Italian Region
4
Primary components of the Grid
Primary components of the Italian Production Grid are: Computing and storage resources Access point to the grid Services Other elements are also fundamental for the working, management and monitoring of the grid: Middleware Monitoring tool Accounting tool Management and control infrastructure Users Stato e caratterizzazione della Grid di produzione italiana ed europea
5
Grid services Allow you to use the grid resources (CEs and SEs):
Resource Broker (RB) / Workload Management System (WMS): they are responsible for the acceptance of submitted jobs and for sending those jobs to the appropriate resources Information System (IS): provides information about the grid resources and their status Virtual Organization Management System (VOMS): database for the authentication and authorization of the users Gridice: monitoring of resources, services and jobs Home Location Register (HLR): database for the accounting informations of the usage of resources LCG file catalog (LFC): file catalog File Transfer Service (FTS): file movements in an efficient and reliable way MonBox: collector for local data for R-GMA and GRIDICE (candidate to host nagios for site monitoring) Stato e caratterizzazione della Grid di produzione italiana ed europea
6
General Purpose Services
Test sites scope MYPROXY BDII myproxy.cnaf.infn.it Italian sites scope gridit-cert-rb.cnaf.infn.it LFC WMS gridit-bdii-01.cnaf.infn.it lfcserver.cnaf.infn.it gridit-wms-01.cnaf.infn.it LB lb009.cnaf.infn.it prod-bdii-01.pd.infn.it top-bdii03.cnaf.infn.it top-bdii01.cnaf.infn.it top-bdii02.cnaf.infn.it egee-bdii.cnaf.infn.it glite-rb-00.cnaf.infn.it prod-lb-01.pd.infn.it prod-wms-01.pd.infn.it albalonga.cnaf.infn.it egee-wms-01.cnaf.infn.it VOMS replica RB voms.cnaf.infn.it egee-rb-01.cnaf.infn.it voms-01.pd.infn.it WMS+LB+BDII voms2.cnaf.infn.it voms-02.pd.infn.it EGEE sites scope wms-lb.ct.infn.it replica Stato e caratterizzazione della Grid di produzione italiana ed europea
7
Servizi Controllati da NAGIOS
Le macchine del cnaf sono controllate da nagios: in caso di fallimenti, sono abilitati l’invio di o di sms In caso di down di un HOST, viene inviato un sms per i seguenti servizi grid: FTS, LFC, WMSMON, VOMS (master e replica), CE, NTP I servizi che girano sulle macchine sono controllati ogni 5 minuti Se risultano CRITICAL (viene inviato un sms), vengono fatti altri 4 controlli, distanziati di 1 minuto uno dall'altro. Al secondo di questi controlli, quando lo stato del check e' CRITICAL SOFT 2, viene fatto il tentativo di restart del servizio HOST CHECK RESTART FTS FTS AGENTS TO DO FTS BDII LFC lfc-dli SI' lfc-deamon globus-mds mysql VOMS voms ports BDII bdii NO CE site-bdii NTP ntpd WMS WMS-POOL Stato e caratterizzazione della Grid di produzione italiana ed europea
8
Update dinamico del DNS per top BDII
I servizi sono controllati ogni minuto Se risultano CRITICAL, vengono fatti altri 3 controlli, distanziati di 1 minuto uno dall'altro Nel caso in cui lo stato CRITICAL persista, viene rimosso l'IP del host che ospita il servizio critico dall'alias top-bdii.grid.cnaf.infn.it Host coinvolti top-bdii01.cnaf.infn.it top-bdii02.cnaf.infn.it top-bdii03.cnaf.infn.it prod-bdii-01.pd.infn.it Stato e caratterizzazione della Grid di produzione italiana ed europea
9
Servizi Dedicati alle VO
Stato e caratterizzazione della Grid di produzione italiana ed europea
10
Servizi dedicati ad altri progetti
Stato e caratterizzazione della Grid di produzione italiana ed europea
11
Tier1 & Tier2 HLRs 11 Home Location Register di sito per Tier1 e Tier2
HLR prod-hlr-02.ct.infn.it (INFN-CATANIA) reference for central-southern area sites host sito hlr-t1.cr.cnaf.infn.it INFN-T1 prod-hlr-02.ct.infn.it INFN-CATANIA prod-hlr-01.pd.infn.it INFN-PADOVA prod-hlr-01.ba.infn.it INFN-BARI atlashlr.lnf.infn.it INFN-FRASCATI t2-hlr-01.lnl.infn.it INFN-LEGNARO prod-hlr-01.mi.infn.it INFN-MILANO t2-hlr-01.na.infn.it INFN-NAPOLI, INFN-NAPOLI-ATLAS gridhlr.pi.infn.it INFN-PISA t2-hlr-01.roma1.infn.it INFN-ROMA1, INFN-ROMA1-CMS, INFN-ROMA1-VIRGO grid005.to.infn.it INFN-TORINO ENEA-INFO INFN-ROMA3 INFN-CAGLIARI ITB-BARI INFN-LECCE SPACI-CS-IA64 INFN-LNS SPACI-LECCE-IA64 INFN-NAPOLI-ARGO SPACI-LECCE INFN-NAPOLI-CMS SPACI-NAPOLI INFN-ROMA2 SPACI-NAPOLI-IA64 11 Home Location Register di sito per Tier1 e Tier2 2 HLRs per i siti medio-piccoli CNR-ILC-PISA INFN-GENOVA CNR-PROD-PISA INFN-PARMA INAF-TRIESTE INFN-PERUGIA INFN-CNAF INFN-TRIESTE INFN-BOLOGNA SNS-PISA INFN-FERRARA UNIV-PERUGIA INFN-FIRENZE HLR prod-hlr-01.pd.infn.it (INFN-PADOVA) reference for central-northern area sites Stato e caratterizzazione della Grid di produzione italiana ed europea
12
Deployment Status (I) 48 Siti in totale: 37 Siti attivi
SITE STATUS CNR-ILC-PISA CERTIFIED INFN-ROMA1 CNR-PROD-PISA INFN-ROMA1-CMS ENEA-INFO INFN-ROMA1-TEO ESA-ESRIN INFN-ROMA1-VIRGO INFN-BARI INFN-ROMA3 INFN-BOLOGNA INFN-T1 INFN-CATANIA INFN-TORINO INFN-CNAF INFN-TRIESTE INFN-CNAF-LHCB SNS-PISA INFN-FERRARA SPACI-NAPOLI INFN-FRASCATI SPACI-LECCE INFN-GENOVA SPACI-CS-IA64 INFN-LNL-2 UNI-PERUGIA INFN-LNS INFN-CAGLIARI TESTs ONGOING INFN-MILANO INFN-CS long downtime INFN-NAPOLI INFN-LECCE farm migration to sl4 INFN-NAPOLI-ARGO INFN-ROMA2 INFN-NAPOLI-ATLAS SISSA-TRIESTE INFN-NAPOLI-CMS INAF-TRIESTE HW PROBLEMS INFN-NAPOLI-PAMELA INFN-CASCINA INFN-PADOVA INFN-FIRENZE Supp. Unavailable INFN-PARMA ITB-BARI Cooling Maint. INFN-PERUGIA SPACI-LECCE-IA64 HW & MW PROBLEMS INFN-PISA SPACI-NAPOLI-IA64 48 Siti in totale: 37 Siti attivi 2 siti in fase di certificazione 34 siti INFN 14 siti di altri enti (cnr, enea, esa, inaf, spaci, univ.PG) 3 siti con architettura IA64 (1 attivo) Stato e caratterizzazione della Grid di produzione italiana ed europea
13
Distribuzione delle risorse di calcolo
num. CPU CNR 12 0,17% ENEA 119 1,69% ESA 56 0,79% INFN 6707 95,16% SNS 10 0,14% SPACI 22 0,31% UNI-PG 18 0,25% totale 7092 Stato e caratterizzazione della Grid di produzione italiana ed europea
14
Availability & Reliability
Viene preso in considerazione lo stato dei servizi CE,SE,SRM e sBDII come risulta dagli esiti dei test SAM Viene applicato un AND logico tra questi servizi ed un OR logico tra i servizi dello stesso tipo nel caso un sito abbia più istanze di uno stesso servizio Un sito deve risultare available almeno il 70% del tempo al mese (la disponibilità giornaliera è misurata sulle 24 ore) La reliability del sito deve essere di almeno 75% al mese Reliability = Availability / (Availability + Unscheduled Downtime) Downtime I periodi di scheduled downtime devono essere dichiarati in anticipo sul GOC-DB Gli Scheduled Downtime incidono negativamente sulla availability, ma non sulla reliability Stato e caratterizzazione della Grid di produzione italiana ed europea
15
Availability 2008 1/4 Risultati non soddisfacenti media annuale: 75%
media T1&T2: 76% Media T3: 74% mai sopra il 90% solo 4 volte sopra l’80% 5 volte sotto il 70% Stato e caratterizzazione della Grid di produzione italiana ed europea
16
Availability 2008 2/4 ENEA-INFO:migrazione ad sl4
CNR-PROD-PISA: in produzione da maggio ESA-ESRIN: in produzione da aprile INFN-CAGLIARI: problemi al dpm, uncertified da ott/nov INFN-CATANIA: problemi di autenticazione negli ultimi mesi, varie cose in prededenza INFN-CNAF-LHCB: problemi di “gestione” INFN-FERRARA: mar/apr/mag neri INFN-GENOVA:apr/mag/giu neri INFN-LECCE: uncertified da lug/ago T2 T2 T2 T2 Stato e caratterizzazione della Grid di produzione italiana ed europea
17
Availability 2008 3/4 INFN-NAPOLI-CMS: in produzione da giugno
INFN-NAPOLI-ARGO:in produzione da ottobre, frequenti problemi INFN-PERUGIA: uncertified in lug/ago, problemi frequenti con dcache T2 T2 T2 T2 Stato e caratterizzazione della Grid di produzione italiana ed europea
18
Availability 2008 4/4 INFN-ROMA1-CMS: frequenti problemi lsf e dcache
INFN-ROMA2: uncertified da ago/set INFN-T1: da gen a lug mesi neri INFN-TORINO: 4 mesi neri INFN-TRIESTE: primi 5 mesi neri SPACI-CS-IA64: 5 mesi neri SPACI-LECCE: in produzione da ottobre T1 T2 T2 T2 Stato e caratterizzazione della Grid di produzione italiana ed europea
19
Availability Gennaio 09 Media di gen 09: 83 % Invariata da novembre
sito gen-09 media 08 CNR-ILC-PISA 95% 88% INFN-NAPOLI-PAMELA 86% 83% CNR-PROD-PISA 85% 76% INFN-PADOVA 57% ENEA-INFO 72% 63% INFN-PARMA 90% 78% ESA-ESRIN 94% INFN-PERUGIA 59% INFN-BARI 77% INFN-PISA 96% 82% INFN-BOLOGNA 93% INFN-ROMA1 89% INFN-CATANIA 17% 68% INFN-ROMA1-CMS 0% 54% INFN-CNAF 99% 87% INFN-ROMA1-TEO 97% INFN-CNAF-LHCB 58% INFN-ROMA1-VIRGO 74% INFN-FERRARA 73% INFN-ROMA3 75% INFN-FRASCATI 81% INFN-T1 69% INFN-GENOVA 36% 71% INFN-TORINO INFN-LNL-2 100% INFN-TRIESTE 98% 55% INFN-LNS 80% SNS-PISA 50% INFN-MILANO 92% SPACI-CS-IA64 65% INFN-NAPOLI SPACI-LECCE 91% INFN-NAPOLI-ARGO 56% SPACI-NAPOLI 84% na INFN-NAPOLI-ATLAS UNI-PERUGIA INFN-NAPOLI-CMS Media di gen 09: 83 % Invariata da novembre Classifica per ROC: 9° su 11 Stato e caratterizzazione della Grid di produzione italiana ed europea
20
VO Supportate 57 VOs supported: 4 LHC (ALICE, ATLAS, CMS, LHCB)
3 test (DTEAM, OPS, INFNGRID) 23 regional VOs 1 catch all VO: GRIDIT 27 Other international VOs Stato e caratterizzazione della Grid di produzione italiana ed europea
21
VO Regionali 2286 utenti registrati in CDF Due nuove VO:
argo 35 bio 70 compassit 8 compchem 78 cyclops 15 egrid 28 enea 14 enmr.eu 53 euchina 60 euindia 67 eumed 103 glast.org 7 gridit 140 inaf 27 infngrid 219 ingv 13 libi 17 lights.infn.it 22 pamela 20 planck 38 theophys tps.infn.it 3 virgo 34 2286 utenti registrati in CDF Due nuove VO: eticsproject.eu pacs.infn.it Stato e caratterizzazione della Grid di produzione italiana ed europea
22
Utilizzo WMS/RB General Purpose
Stato e caratterizzazione della Grid di produzione italiana ed europea
23
Part 2: European Grid infrastructure
24
Problem statement Questions How many resources are distributed among countries in EGEE, Baltic-Grid and SEE-Grid? What is the user distribution among different countries? How many tickets have been handled in the recent past? Stato e caratterizzazione della Grid di produzione italiana ed europea
25
Sites, number of CPUs and related funding in EGEE
Note: data from EGEE Consortium Agreement v1.8 Stato e caratterizzazione della Grid di produzione italiana ed europea
26
Grid users distribution*
Distribution per CA and related country? 25 production VOMS servers queried 139 VOs registered at the time of writing, very different in size User certificate counted only for IGTF accredited CAs VO and certificate lists reprocessed to remove VOs for testing, demos, expired projects remove certificates from non-accredited CAs (expired CAs, CAs for testing and demonstration activities, etc.); remove double entries in case of multiple certificates hold by individual users avoid double counting in case of a user certificates that is part of two or more VOs remove the Kerberized CA of Fermilab (extensively used by the CDF VO), where a single user typically holds three or more different X.509 certificates (*) analysis work by Andrea Ceccanti Stato e caratterizzazione della Grid di produzione italiana ed europea
27
Users distribution per CA 1/2
CA ShortName Country Users % CERN Trusted Certification Authority CH 902 14.42% GridKa-CA DE 897 14.34% DOEGrids CA 1 USA 789 12.62% INFN CA IT 718 11.48% GRID-FR FR 497 7.95% Baltic Grid Certification Authority BalticGrid 398 6.36% UK e-Science CA UK 351 5.61% IRISGridCA ES 224 3.58% NIKHEF medium-security certification auth NL 214 3.42% HellasGrid CA 2006 GR 199 3.18% Russian Data-Intensive Grid CA RU 144 2.30% Stato e caratterizzazione della Grid di produzione italiana ed europea
28
Users distribution per CA 2/2
Academia Sinica Grid Comp. Certification Authority & Mercury TW 231 3.69% Grid Canada Certificate Authority CA 116 1.85% KEK GRID Certificate Authority JP 93 1.49% Polish Grid CA PL 78 1.25% gridca-cn CN 63 1.01% CyGridCA CY 46 0.74% IUCC IL 45 0.72% AEGIS-CA RS 43 0.69% SEE-GRID CA SeeGrid 37 0.59% TR-Grid CA TR 36 0.58% BEGrid CA BE 33 0.53% LIP Certification Authority PT 31 0.50% AustrianGrid CA AT 24 0.38% CESNET CA CZ 23 0.37% KISTI Grid Certificate Authority KR 22 0.35% Stato e caratterizzazione della Grid di produzione italiana ed europea
29
Grid users distribution per country
CERN DE SP UK Baltic USA FR IT Stato e caratterizzazione della Grid di produzione italiana ed europea
30
Tickets per ROC in GGUS 1/2
GGUS monthly statistics (Jan-Oct 08) missing data for a few ROC (e.g. CE) for a couple of months in the range statistics do not take into account tickets handled by regional trouble systems, where available Number of tickets not proportional to the number of sites in the region Stato e caratterizzazione della Grid di produzione italiana ed europea
31
Tickets per ROC (Jan-Oct 08) – GGUS 2/2
Stato e caratterizzazione della Grid di produzione italiana ed europea
32
Conclusions The Italian EGEE region is one of the largest in Europe
Now relies on a consolidated operational model and set of tools and services but Availability/reliability need to improve The user community supported needs to extended (e.g. parallel applications, …) In the coming months we need to plan the transition to the Italian Grid Infrastructure More tools deployed regionally (regional dashboard, regional monitoring system changes its architecture, …) Shifts structure needs to be revised The gLite release will presumably evolve into the Unified Middleware Distribution (gLite + ARC + Unicore) Support activities will need to be consequently extended Purpose of this workshop is analyze the technical implications of this transition Stato e caratterizzazione della Grid di produzione italiana ed europea
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.