JOB MONITORING Donvito Giacinto INFN-Bari. OUTLINE ● Use-case ● Informazioni utilizzate e metodologie di raccolta per il job monitoring ● Informazioni.

Slides:



Advertisements
Presentazioni simili
VIA GIULIO RATTI, CREMONA – Tel. 0372/27524
Advertisements

Introduzione al prototipo Grid-SCoPE
INFO Sevizio Centralizzato Informatica e Reti Frascati, Infrastrutture e Servizi per il Calcolo Scientifico 1 Modalità di utilizzo dei server.
EGEE-II INFSO-RI Enabling Grids for E-sciencE EGEE and gLite are registered trademarks Sicurezza in EGEE Vincenzo Ciaschini Roma.
Classe III A A.s – 2011 Sistemi di Elaborazione e Trasmissione dell’Informazione 4 ore settimanali (2 laboratorio) Docenti Prof. Alberto Ferrari.
Sicurezza e concorrenza nelle basi di dati
Unità D2 Database nel web. Obiettivi Comprendere il concetto di interfaccia utente Comprendere la struttura e i livelli che compongono unapplicazione.
© 2007 SEI-Società Editrice Internazionale, Apogeo Unità D3 Sicurezza e concorrenza nelle basi di dati.
Mantenimento dello stato Laboratorio Progettazione Web AA 2009/2010 Chiara Renso ISTI- CNR -
Sicurezza e Policy in Active Directory
Amministrazione di una rete con Active Directory.
Esercitazione con socket
E stato realizzato uno script che ottiene per ogni giorno dellanno luso della CPU ed il wall_time integrato dai jobs che hanno completato in quel giorno.
Interfaccia del file system
Silvia Simonetti - CASPUR CASPUR Statistiche duso.
Fabrizio Balloni - AGES S.p.A. -
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 20/12/2007 S.Pardi.
Accesso di base alle risorse di ENEA GRID Calcolatori Software.
Software di base Il sistema operativo è un insieme di programmi che opera sul livello macchina e offre funzionalità di alto livello Es.organizzazione dei.
Creazione e manipolazione tabelle. TABELLE una tabella può essere creata in qualsiasi momento,anche quando gli utenti stanno usando il database la struttura.
GridICE attività in corso e sviluppi futuri Gennaro Tortone Bologna, 4 marzo Technical Board INFNGRID
E. Ferro / CNAF / 14 febbraio /13 GRID.it servizi di infrastruttura Enrico Ferro INFN-LNL.
INTRODUZIONE l sistema operativo è il primo software che lutente utilizza quando accende il computer; 1)Viene caricato nella memoria RAM con loperazione.
Comunità Montana dellAppennino Modena Est Portale Turistico Guida al Sistema di Amministrazione.
INFO Sevizio Centralizzato Informatica e Reti Modalità di utilizzo dei server di calcolo del C.E.D. di Frascati.
Shell dei comandi – ! Bash &/o Tcsh !
Un problema importante
Presentazione Data Base Ovvero: il paradigma LAPM (Linux - Apache - PHP - mySQL) come supporto Open Source ad un piccolo progetto di Data Base relazionale,
Inserimento di copie di Referti Medici Inserimento di copie di Referti Medici e di Analisi nel web dellUtente ! e di Analisi nel web dellUtente !
C. Aiftimiei 1, S. Andreozzi 2, S. Dal Pra 1, G. Donvito 3, S. Fantinel 4, E. Fattibene 2, G. Cuscela 3, G. P. Maggi 3, G. Misurelli 2, A. Pierro 3 1 INFN-Padova.
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
FESR Consorzio COMETA Pier Paolo CORSO Giuseppe CASTGLIA Marco CIPOLLA Industry Day Catania, 30 Giugno 2011 Commercial applications.
CNAF 18/11/2004 Federica Fanzago INFN Padova a/grape... BAT... BATMAN...o? M.Corvo, F.Fanzago, N.Smirnov (INFN Padova) + tutte le persone che fanno i test.
10 azioni per lo scheduling su Grid Uno scheduler per Grid deve selezionare le risorse in un ambiente dove non ha il controllo diretto delle risorse locali,
Test Storage Resource Manager per SC4 Giacinto Donvito Vincenzo Spinoso.
PoctEvo Point of Care Testing Evolution Gestione diagnostica Web.
Gestione del processore (Scheduler)
Introduzione Cos’è un sistema operativo ?. Hardware Sistema Operativo Applicazioni È il livello di SW con cui interagisce l’utente e comprende programmi.
Progetto di Ingegneria del Web Anno Accademico 2007/2008 Stefano Pigiani Bruno Ricci Marco Ruzzon.
Extension pack per IIS7 Piergiorgio Malusardi IT Pro Evangelist
Ancora sulla shell. Shell e comandi La shell e' un programma che interpreta i comandi dell'utente. I comandi possono essere dati da terminale, oppure.
Esempi di Sistemi Operativi: DOS Nel file system di DOS i path names hanno la seguente forma C:\TEMP\DirA\DirB\elab.pdf Si utilizzano due nomi speciali.
Lista di Nozze OnLine Programma per l’offerta e la gestione delle liste nozze online.
Corso di Laurea in Biotecnologie corso di Informatica Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Informatica Generale Marzia Buscemi
TIER-2 E’ stato certificato in sequenza dal –CNAF –Alessandro De Salvo come ATLAS software manager in LCG –LCG group del CERN nella TestZone E’ costituito.
Condor III Workshop sul Calcolo INFN F. Semeria INFN Bologna Cagliari
I Sistemi Operativi. Definizione Per Sistemi Operativi (di seguito SO) si intendono quei pacchetti software, a loro volta costituiti da più sottoprogrammi.
Bologna Batch System (BBS). BBS e’ un sistema batch basato su Condor. L’utente sottomette i job da una macchina e il sistema li distribuisce sulle altre.
Perché un elimina code? Vantaggi e potenzialità derivanti dall’installazione di un moderno sistema di gestione dei flussi di persone.
Insegnare digitale: la didattica flipped e gli strumenti digitali a supporto della didattica capovolta Antonio Todaro “ L'utilizzo di Google Moduli e di.
Consorzio COMETA - Progetto PI2S2 UNIONE EUROPEA SAGE – Un sistema per l’accounting dello storage in gLite Fabio Scibilia Consorzio.
FESR Trinacria Grid Virtual Laboratory Rosanna Catania Rita Ricceri INFN Catania 25 Luglio 2006 Grid Monitoring: GridICE – bacct - lsload.
UNIMORE University of Modena and Reggio Emilia Scratch Simone Calderara
Giovanni d’Angelo Università degli studi di Napoli Federico II I Corso di formazione INFN su aspetti pratici dell'integrazione di applicazioni in GRID.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
Università degli studi di Cagliari Facoltà di Ingegneria Dipartimento di Ingegneria Elettronica Gruppo di Elettromagnetismo Metodo di Progettazione Automatica.
Utilizzo della VO di theophys per il calcolo lattice QCD G. Andronico M. Serra L. Giusti S. Petrarca B. Taglienti.
FESR Trinacria Grid Virtual Laboratory PROGETTO “MAMMO” Sviluppo e ottimizzazione di algoritmi adattativi, specificatamente di Artificial.
Overview del middleware gLite Guido Cuscela INFN-Bari II Corso di formazione INFN su aspetti pratici dell'integrazione.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
Martedi 8 novembre 2005 Consorzio COMETA “Progetto PI2S2” UNIONE EUROPEA Accesso all’infrastruttura Grid del Consorzio COMETA Grid Open Day alla Facoltà.
Procedure per la richiesta di certificazione e per l'autenticazione alla VO Cometa Accesso all’infrastruttura del Consorzio COMETA in modalità GRID.
FESR Trinacria Grid Virtual Laboratory Porting su grid di *ROSETTA*, un metodo per la predizione di strutture proteiche Giuseppe La Rocca.
I L SO MS DOS … una breve guida…. C OS ’ È UN S ISTEMA OPERATIVO Un sistema operativo (SO) è un insieme di programmi che agisce come intermediario tra.
1 EGI-TF: Accounting Andrea Cristofori EGI-TF
Checkpoint e restore di job LSF Workshop Congiunto INFN CCR e GRID Acireale, Maggio 2010 INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF Riunione CCR
Summary di (quasi) tutti gli utenti non presentati…
Job Application Monitoring (JAM)
Transcript della presentazione:

JOB MONITORING Donvito Giacinto INFN-Bari

OUTLINE ● Use-case ● Informazioni utilizzate e metodologie di raccolta per il job monitoring ● Informazioni ancora disponibili ● Come utilizzare le informazioni ● Possibili sviluppi & Requirements

USE-CASE ● Poter conoscere nel più breve tempo possibile lo stato di ogni job eseguito su una farm. ● L'utente ha bisogno di controllare lo stato dettagliato di ogni job e sapere dove essi stanno girando ● E' necessario avere delle informazioni sull'uso delle risorse suddivise per VO ● E' necessario poter effettuare un minimo di debug sul risultato di un job su Grid.

Informazioni utilizzate ● Per PBS: – I log in “/var/spool/pbs/server_priv/accounting” per le informazioni sui job terminati – Il comando “qstat -f” per le informazioni sui job running – Il file di log del globus-gatekeeper per il match fra account locale alla macchina e nome reale dell'utente ● Per LSF: – Il comando “bhist -al -u all -C $today” per i job terminati – I comandi “qstat -al” e “bjobs -l $job_id_run_lsf” per i job running – Il file di log del globus-gatekeeper per il match fra account locale alla macchina e nome reale dell'utente

Sistema di pubblicazione usato Informazioni locali PERL SCRIPT pbs§/C=IT/O=INFN/OU=Personal Certificate/L=Bari/CN=MARIA Certificate/L=IMIPbari/CN=Savino Certificate/L=Bari/CN=giacinto gm$4$apierro$0$0§cms|short^1$1$0$0$0^E$8373$STDIN$cms001$3$pccms17$4$11$0§gridit|i nfinite^1$1$0$1$0^E$5775$STDIN$gridit003$2$gridfirb1$360017$360012$0^R$8371$STDIN$ gridit003$2$pccms20$21943$21951§infngrid|long^1$1$0$0$0^E$8372$STDIN$infngrid003$1$ pccms17$8$83$0§ PARSER PUBBLICAZIONE VIA LDAP...

Sistema di pubblicazione usato (2) ● Lista dei subject trovati ● Statistiche complessive per VO e per coda con l'idicazione di: ● Job finished ● Job successful ● Job failed ● Job running ● Job queued pbs§/C=IT/O=INFN/OU=Personal Certificate/L=Bari/CN=MARIA Certificate/L=IMIPbari/CN=Savino Certificate/L=Bari/CN=giacinto babar|long^0$0$0$1$0^R$1425$STDIN$babarsgm$4$apierro$0$0§ cms|short^1$1$0$0$0^E$8373$STDIN$cms001$3$pccms17$4$11$0§ gridit|infinite^1$1$0$1$0^E$5775$STDIN$gridit003$2$gridfirb1$360017$360012$0^ R$8371$STDIN$gridit003$2$pccms20$21943$21951§ infngrid|long^1$1$0$0$0^E$8372$STDIN$infngrid003$1$pccms17$8$83$0§

Sistema di pubblicazione usato (3) pbs§/C=IT/O=INFN/OU=Personal Certificate/L=Bari/CN=MARIA Certificate/L=IMIPbari/CN=Savino Certificate/L=Bari/CN=giacinto babar|long^0$0$0$1$0^R$1425$STDIN$babarsgm$4$apierro$0$0§ cms|short^1$1$0$0$0^E$8373$STDIN$cms001$3$pccms17$4$11$0§ gridit|infinite^1$1$0$1$0^E$5775$STDIN$gridit003$2$gridfirb1$360017$360012$0^ R$8371$STDIN$gridit003$2$pccms20$21943$21951§ infngrid|long^1$1$0$0$0^E$8372$STDIN$infngrid003$1$pccms17$8$83$0§ ● Statistiche dettagliate per VO e per coda con l'idicazione di: ● Stato del job (Running/Executed/Queued) ● LRMS ID ● Job Name (Da dove viene??) ● Utente locale ● Riferimento per il subject dell'utente ● Nome dell'host su cui è eseguito ● Tempo di CPU utilizzato ● Tempo totale sulla risorsa ● Exit status dell'LRMS

To Do: ● Parametri ancora disponibili: ● Memoria Usata (Reale e Virtuale) ● Data precisa di inizio e fine del job ● Parametri richiesti: ● Il job-id su Grid di ogni job (WMS is working on it!)

Come utilizzare le informazioni ● Accesso via web per l'utente – Viene controllata la presenza del certificato nel browser, quindi vengono mostrati tutti i job di quello specifico utente – Se non c'è un certificato viene mostrato il dettaglio della VO senza l'indicazione dell'utente reale ● Accesso via web per l'amministratore della farm – Può vedere anche i Subject dei job della sua farm (Bisogna pubblicare da qualche parte anche il subject del certificato del syte-admin) ● Grafici e Report on-line sui job di una determinata VO o per utente (presentazione di Antonio)

Sviluppi & Requirements ● Un servizio di monitoring “attivo” dei job (SOAP&DB?) – Fornirebbe un servizio “alla BOSS” a tutti gli utenti ● La possibilità di ottenere frammenti di std-output e std-error prima che i job finiscano ● Feedback from Atlas DC04