Grid operations Luciano Gaido (INFN-Torino) ( Contributi di A. Cavalli, A. Paolini, A. Pagano) Incontro con i referee di INFN-GRID CNAF, 7 marzo 2007.

Slides:



Advertisements
Presentazioni simili
Lo sviluppo delle PMI tra Innovazione e Competenze. Il progetto MASTER Valentina Castello.
Advertisements

Windows Server 2003 Active Directory Diagnostica, Troubleshooting e Ripristino PierGiorgio Malusardi IT Pro – Evangelist Microsoft.
DG Ricerca Ambientale e Sviluppo FIRMS' FUNDING SCHEMES AND ENVIRONMENTAL PURPOSES IN THE EU STRUCTURAL FUNDS (Monitoring of environmental firms funding.
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 28/02/2008 S.Pardi.
Comitato Tecnico sullInteroperabilità MUR, L. Merola.
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 20/12/2007 S.Pardi.
Testbed release: processo di integrazione e validazione A. Ghiselli, L. Gaido.
Proposta di integrazione e consolidamento delle risorse presenti nellinfrastruttura Grid dellItalia Meridionale (L. Merola, )
Incontro di coordinamento Firenze 21 gennaio 2010, 11:00-17:00 Ordine del Giorno Presentazione piano di lavoro eTwinning 2010 Dati registrazioni Proposte.
Queuing or Waiting Line Models
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
25 ottobre 2002infn1 FIRB-Grid WP3,5 Grid deployment.
Conclusioni M. Paganoni workshop CMS Italia, Napoli 13-14/2/07.
Secure Socket Layer (SSL) Transport Layer Security (TLS)
Last quarter work and future activities
Printserver2.pg.infn.it (VM Xen in esecuzione su redhat cluster)
C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova.
Infrastruttura GRID di produzione e i T2 Cristina Vistoli Cnaf.
G. Martellotti Roma RRB 16 Aprile Presentazione M&O cat A (per LHCb i M&O cat B sono gestiti autonomamente e non sono scrutinati fino al 2005/2006)
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
Taccani1 7.4 Identification ANALISI DEI PERICOLI Hazard Analysis Identificazione Valutazione Misure di Controllo Control Measures Assessment.
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
Installation and evaluation of the Globus toolkit Massimo Sgaravatto INFN Padova.
Draft planning of the report Massimo Sgaravatto INFN Padova.
Layered Grid Architecture. Application Fabric “Controlling elements locally”: Access to, & control of, resources Connectivity “Talking to Grid elements”:
Viruses.
From this year, by kind permission of Taeco S.r.l., the Working Retrievers Club Italia has the pleasure to award the prize “Big Hunter Project”. This.
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
Report HEPiX Spring meeting 2002 Workshop sulle problematiche di calcolo e reti nell'INFN 6-9 Maggio 2002 La Biodola - Isola d'Elba Silvia Arezzini.
Condor III Workshop sul Calcolo INFN F. Semeria INFN Bologna Cagliari
I testbed ed il loro uso 1 I testbed ed il loro uso L. Gaido, A.Ghiselli CSN1, Perugia novembre 2002.
P5  2009 shifts VS shifts until the end of 2009  2010 plan.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
CMS RPC ITALIA' , Settembre Ischia-ITALIA RPC DCS Giovanni Polese.
Storage (ieri, oggi e domani) Luca dell’Agnello INFN-CNAF.
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA SAGE – Un sistema per l’accounting dello storage in gLite Fabio Scibilia Consorzio.
La Task Force Gestione Operativa (Operations) L. Gaido, INFN Torino.
A.S Digiaro Antonio Classe 3°A I.T.E. Tutor aziendale: Adriano Fortinelli Tutor scolastico: Angela Ferrari.
Buon giorno, ragazzi oggi è il quattro aprile duemilasedici.
OJS & OCS O PEN S OURCE PER LA R ICERCA S CIENTIFICA Le risorse offerte da CSIA-UniMC per la ricerca scientifica: Open Journal System & Open Conference.
Overview del middleware gLite Guido Cuscela INFN-Bari II Corso di formazione INFN su aspetti pratici dell'integrazione.
Open City Platform: i primi risultati Riunione CCR, 16 settembre 2015 Luciano Gaido.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
Stato Unità Gestione Operativa Paolo Veronesi. Stato revisione blueprint I task oggetto dell’Unita’ Gestione Operativa Personale afferente all’Unita’
R. Brunetti – INFN Torino WS. Sicurezza CNAF Bologna dicembre
DNSSEC Sicurezza & Windows Frascati Febbraio 2012 Fulvia Costa Infn Padova.
ORGANISATION OF THE EDUCATION SYSTEM IN ITALY 2010/2011.
Struttura nazionale di Nameserver per i servizi ad alta affidabilità Riccardo Veraldi - CNAF.
SCOPE: stato e piano di integrazione Phd. Silvio Pardi CNAF
JOB MONITORING Donvito Giacinto INFN-Bari. OUTLINE ● Use-case ● Informazioni utilizzate e metodologie di raccolta per il job monitoring ● Informazioni.
EGEE is a project funded by the European Union under contract IST Il pre-production service in EGEE e in INFN-GRID D. Cesini - INFN-CNAF IV.
Sessione "EGI Production Infrastructure" martedì 14 Settembre ore 14 From EGEE to EGI: status of the EGI infrastructure, results and roadmap: – ROC_CE.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
EGEE is a project funded by the European Union under contract IST L'infrastruttura di produzione attuale A. Cavalli - INFN- CNAF D. Cesini.
1 Accounting DGAS per job MPI Marco Bencivenni (INFN-CNAF) Workshop CCR-INFN GRID Maggio 2010.
Do You Want To Pass Actual Exam in 1 st Attempt?.
Attività In estrema sintesi (inutile ripetere i dettagli):
Riorganizzazione delle attivita' di controllo della Grid
Riunione INFN – Bologna, 17 January 2013
Dichiarazione dei servizi di sito nel GOCDB
Stato della Grid di produzione
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
Introduzione al progetto INFNGRID
L’infrastruttura grid italiana nel contesto internazionale
Transcript della presentazione:

Grid operations Luciano Gaido (INFN-Torino) ( Contributi di A. Cavalli, A. Paolini, A. Pagano) Incontro con i referee di INFN-GRID CNAF, 7 marzo 2007

La gestione della grid Viene fatta dal Regional Operation Center (ROC) italiano. Le attività principali sono: produzione della release InfnGrid certificazione della release distribuzione della release nei siti, supporto agli amministratori locali e certificazione dei siti controllo periodico dello stato delle risorse: checklist a livello ROC italiano Service Availability Monitoring (SAM) test a livello EGEE monitoraggio dello stato delle risorse e dei servizi supporto a livello italiano supporto a livello europeo con la partecipazione ai turni del CIC-on-Duty (COD) Un gruppo di circa 20 persone (Central Management Team), distribuito geograficamente, effettua le attività di controllo con una turnazione settimanale Vari strumenti (tool) sono utilizzati per queste attività, alcuni generali (EGEE), altri specifici del ROC italiano.

Il Regional Operations Center (ROC) italiano E’ uno dei 10 ROC esistenti in EGEE u Operations Coordination Centre (OCC) n Management, oversight of all operational and support activities u Regional Operations Centres (ROC) n providing the core of the support infrastructure, each supporting a number of resource centres within its region u Grid Operator on Duty u Grid User Support (GGUS) n At FZK, coordination and management of user support, single point of contact for users

Supporto EGEE utilizza il sistema di ticketing GGUS (Global Grid User Support) basato su un sw commerciale (Remedy). I vari ROC utilizzano prodotti differenti interfacciati a GGUS in modo bidirezionale; è possibile cioè, mediante l’utilizzo di Web Services: trasferire ticket dal sistema globale a quello regionale trasferire ticket dal sistema regionale a quello globale I gruppi di supporto, a cui verranno reindirizzati i ticket, sono definiti sia in GGUS che nei sistemi regionali. Nel ROC italiano il ticketing systemn utilizzato è basato su Xoops/xHelp.

Il ticketing system del ROC italiano (Xoops/xHelp)

Xoops/xHelp: interfaccia con GGUS

Central Management Team (CMT) Shifts About 20 supporters perform a checking activity composed of 2 shifts per day, from Monday to Friday, with 2 people per shift; for each shift a report is compiled. The main activities are: n Check the grid status, warn about problems, dealing with some of them until they are solved if possible n Certificate sites during deployment phases n Monitor the open tickets, remind the support group members (experts or site managers) in order to have the tickets answered and the problems solved as soon as possible

Central Management Team (CMT) Shifts

Turni

Geographic Failover activity INFN-CNAF coordinates and is an active partner in the Geographic Failover activity of EGEE SA1 Operation: u Geographic distribution of web content via mirror sites is vital to ensure high availability and speed access for a resource u CNAF hosts Geographic Failover Service in a highly effective and inexpensive solution to provide High Availability for mission critical services u the domain gridops.org has been registered to transparently redirect the users whenever one or more grid operation tools become unavailable u Nameservers for gridops.org: n dxcnaf.cnaf.infn.it n nic.grnet.gr

“Replicated” tools Grid is monitored by various tools: n CIC Portal n GSTAT n SAM-SFT n SAM Auto Admin n GRIDICE Every tool is mantained by a different institution

Geo Failover DNS architecture DNS Version: Bind Nsupdate (symmetric ciphers) 60’’ TTL => Switch in 60’’

Failover: web The domain: gridops.org n Registered and available, master at CNAF, slave at GRNET n NSUPDATE enabled n Hosts registered as CNAME (alias) of real names n Short TTLs: the zone configuration has been done to be able to work with very short TTLs. In this way we can quickly remap the “gridops” CNAMEs.

Replication Status u CIC Portal: n Web part: frontend n Lavoiser, a data aggregation and unification service n Oracle database u GGUS: currently not considered – locally done u GOCDB: MySQL done in TW, Web TODO u GSTAT: u SFT/SAME: TODO u SFT ADMIN: (integrated into the CIC Portal)

CIC Operation Portal

Accounting DGAS (Distributed Grid Accounting System) è utilizzato sulla grid di produzione italiana per l’accounting delle risorse:  le informazioni sono raccolte in un database (HLR) e possono essere aggregate in vari modi: la granularità arriva fino al singolo job eseguito sulla grid;  la confidenzialità delle informazioni è garantita dall’utilizzo di vari livelli di autorizzazione per l’accesso agli Usage Record;  l’architettura è completamente distribuita per assicurare flessibilità e scalabilità. Attualmente sono attive 12 HLR di primo livello ed una di secondo livello per l’aggregazione dei dati delle HLR di primo livello. E’ stata sviluppata una interfaccia tra DGAS ed Apel, il sistema attualmente utilizzato per l’accounting sulla grid EGEE.

Accounting A meta’ dicembre 2006 sono stati distribuiti sulla grid di produzione:  la patch 898 per CE LCG (log unificato per il gatekeeper)  una nuova versione di DGAS che consente di utilizzare le informazioni contenute nel log unificato Questo rende possibile avere informazioni grid complete, cioè: grid job id user DN user FQAN per TUTTI i job, compresi quelli sottomessi a Resource Broker su cui non è implementato DGAS

Accounting In questo momento sono in corso controlli incrociati sui siti principali (T1 e T2) per la validazione del sistema di accounting. Nei siti validati:  l’HLR viene connessa a quella di secondo livello (che si trova a Torino, almeno per ora).  verrà attivata (a breve) la procedura Dgas2Apel per l’invio automatico dei dati al GOCDB Siti validati finora (tutti con PBS ed 1 solo CE):  Frascati  Milano  Napoli  Pisa  Torino

Accounting Siti in fase di controllo:  Bari (PBS, 2 CE, problemi HLR)  Tier-1 (LSF, vari CE)  Catania (LSF, 1 CE) -> validato ieri! Controllo incompleto o da iniziare per siti con configurazioni particolari:  Legnaro (LSF, log non ruotati)  Roma1 (LSF, vari CE e varie registrazioni nel GOCDB)

Alcuni dati ( ) Query effettuata sui siti Catania, Frascati, Milano, Napoli, Pisa e Torino (aggregati)

Alcuni dati ( ) Query effettuata sui siti Catania, Frascati, Milano, Napoli, Pisa e Torino (aggregati)

Accounting I prossimi passi:  completamento controlli [2 o 3 settimane?]  invio automatico dati al GOCDB  nuova feature (lookup table) per la corretta associazione dei job locali ad una VO [prossima settimana]  nuovo prototipo di interfaccia web (HLRmon) per l’accesso ai dati di accounting con 4 ruoli possibili (utente, site manager, VO manager, CMT)[fine marzo]

Partecipazione al TPM Dal prossimo aprile parteciperemo alle attività del Ticket Processing Management (TPM) di EGEE con un team di 4 persone: Luca Vaccarossa Alessandro Paolini Sara Bertocco Danilo Dongiovanni Ogni team fa un turno di una settimana (+ un turno di backup) ogni n settimane, dove n è il numero dei team (ora ce ne sono 13)

Partner Activity Review di EGEE A maggio ci sarà l’ultimo turno della Partner Activity Review Dobbiamo presentare lo stato delle attività ed il “consuntivo” per la federazione italiana (INFN+SPACI+ENEA) Per quanto ci riguarda non dovremmo avere particolari problemi, il punto piu’ debole e’ il training.

Assegnazioni 2007 Per quanto riguarda l’inventariabile sono state effettuate le seguenti assegnazioni: Sezionerich.ass.motivo Bari7.55 HA CNAF5540testbed, preview, etc. Catania2.52.5HA Genova107.5potenziamento Milano7.57.5HA Napoli7.57.5HA Padova7.55HA Pisa7.55HA Roma HA Torino107.5HA