1 Accounting DGAS per job MPI Marco Bencivenni (INFN-CNAF) Workshop CCR-INFN GRID 2010 18 Maggio 2010.

Slides:



Advertisements
Presentazioni simili
FESR Trinacria Grid Virtual Laboratory Rosanna Catania Rita Ricceri INFN Catania 25 Luglio 2006 Grid Monitoring: GridICE – bacct - lsload.
Advertisements

Workshop CCR e INFN-GRID Hotel Cala di Lepre Palau, maggio 2009 Il futuro di INFGRID nell'era IGI:
Overview del middleware gLite Guido Cuscela INFN-Bari II Corso di formazione INFN su aspetti pratici dell'integrazione.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
JOB MONITORING Donvito Giacinto INFN-Bari. OUTLINE ● Use-case ● Informazioni utilizzate e metodologie di raccolta per il job monitoring ● Informazioni.
1 EGI-TF: Accounting Andrea Cristofori EGI-TF
Implementazione di TRIP ai LNF Commissione Calcolo e Reti 31 maggio 2007 Massimo Pistoni.
Giuseppe Andronico CCR-WS10 Santa Tecla, 18 Maggio 2010 Introduzione MPI & GPU.
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
Growing with the market Marco Pioli – Ufficio di Firenze IDEAS GENERATION CHALLENGE.
CORSO elementare su DATABASE Applicativo utilizzato OpenOffice 3.0.
HLRmon per IGI: nuove funzionalità Enrico Fattibene INFN – CNAF
L’avvio della valutazione del sistema educativo di istruzione, secondo il procedimento previsto dall’art. 6 del D.P.R. n. 80/2013, costituisce un passo.
Monitoraggio di siti potenziali fonti di rischio di contaminazione radioattiva Scopo della proposta Realizzare una rete di monitoraggio della radioattività.
Scopo di FOFEM 6 Il modello FOFEM è composto da due parti distinte, ciascuna delle quali si occupa di simulare rispettivamente: il consumo di combustibile,
Bitcoin “What is a Bitcoin?”. What is a Bitcoin? Bitcoin The 4th most common research on Google in 2014.
Presente e futuro..  Introduzione  Funzionalità  Modello.
VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre.
Procedura di certificazione di un sito
SCoPE - Stato dei Lavori
Gestione Farm Tema centrale della sessione: utilizzo del batch- system nelle varie sedi T1 e T2, ma anche altre farm grid e farm di sezione requirements,
Gestione Farm Tema centrale della sessione: utilizzo del batch-system nelle varie sedi T1 e T2, ma anche altre farm grid e farm di sezione requirements,
Piattaforma per industrie stampaggio
Il Sistema Operativo Gestione dei Processi
Monitoring e loadbalancing dei servizi Grid
Comput-ER l'infrastruttura di calcolo distribuito in Emilia Romagna
Lezione CG01 Il Sistema di Controllo di Gestione e il ciclo del controllo Economia ed Organizzazione aziendale AA Prof. Cristina Ponsiglione.
Metodologie Quantitative per il Calcolo Scientifico
Studente/i Relatore Correlatore Committente Christian Ortega
HLRmon: visualizzazione di dati di accounting
Nuovo sito della Commissione Calcolo e Reti
Dichiarazione dei servizi di sito nel GOCDB
Relazione finale su [nome del progetto]
a cura di Francesca De Rosa
Giuseppe Andronico 1 Marzo 2010 Riunione CCR
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
FACCIAMO LA DIFFERENZA
Trasmettitori e ricevitori
GridFlex: gestione di software
Analisi dei dati dell’Esperimento ALICE
Report 21/11/2007 Giovanni d’Angelo
Workshop TriGrid Catania 13/03/2006
Lezione CG01 Il Sistema di Controllo di Gestione e il ciclo del controllo Corso di Gestione Aziendale AA Prof. Cristina Ponsiglione
PI2S2 Regional Operation Centre Sistema di Supporto Sistema di Monitoring Rita Ricceri Consorzio Cometa Tutorial per Site Administrator Messina,
Grid Monitoring: bacct - lsload
Luciano Gaido (INFN - Torino) Workshop CCR/INFNGRID – Palau
Job Application Monitoring (JAM)
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
Cos' è l'Augmented Reality? Perchè è diversa dalla Virtual Reality?
VALUTAZIONE e AUTOVALUTAZIONE ALUNNI
LE BANCHE DATI PER LE RICERCHE BIBLIOGRAFICHE
V. Di Stefano a, O. Muscato b, W.Wagner c
Risultati del questionario sui servizi middleware aggiuntivi
PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno
Modulo N.2: Business plan, Budget e Competenze Manageriali
Ammortamento anticipato
Progetto di Tecnologie Web 2014/2015 THERMOWEB
Programmazione parallela in Matlab e Test per ENEA-GRID
[Nome progetto] Relazione finale
Programmare.
Emergency Department Wait Time Prediction
[Nome progetto] Relazione finale
Analisi dati astronomici sulla GRID COMETA con HEAsoft
Dipartimento scienze Economiche , Aziendali e statistiche
Concorrenza e parallelismo
SAGE – Un sistema per l’accounting dello storage in gLite
le regole e i periodici elettronici
Test per campioni indipendenti
ROMA 26 FEBBRAIO 2018 Web mining per integrare e validare informazioni del registro statistico delle imprese attive (ASIA) ROMA 26 FEBBRAIO 2018 INAUGURAZIONE.
Transcript della presentazione:

1 Accounting DGAS per job MPI Marco Bencivenni (INFN-CNAF) Workshop CCR-INFN GRID Maggio 2010

2 Sommario Qual è il problema Obiettivo del lavoro Parametri testati Testbed e metodologia Risultati ottenuti Conclusioni Lavori futuri

3 I sistemi di acconting Grid in uso attualmente non permettono di differenziare i dati di accounting per tipologia di job (parallelo vs sequenziale) L’accounting di job MPI è importante per stimarne il relativo workload sull’infrastruttura Grid e per capire quali discipline Grid fanno maggior uso di MPI al fine di migliorarne il supporto. Tra le varie cose questo significa anche fornire strumenti di accounting adeguati tramite una estensione di DGAS (Distributed Grid Accounting System) Problema

4 Obiettivi Primo passo necessario per l’estensione dei sensori DGAS e del portale HLRmon è la validazione dei dati collezionati dai sensori di DGAS per i job MPI, su diversi batch system, in modo da renderli pubblici in HLRmon differenziandoli da quelli sequenziali. – Capire se i dati collezionati dai sensori si riferisco ad un singolo processo o sono la somma dei processi di ciascun job MPI – Per i job paralleli può risultare che il CPUTime sia molto maggiore WallClockTime e quindi utilizzare il CPUtime per misurare il tempo effettivo di utilizzo delle risorse

5 Campi già presenti nello usage records di HLR: – CPUtime: Amount of CPU time used by all processes in the job. – WallCLockTime: Amount of real time during which the job can be in the running state. – executingNodes: The Worker Node(s) where the user payload is executed. – Pmem: Amount of physical memory used by any single process of the job – Vmem: Amount of virtual memory used by all concurrent processes in the job Possibili campi futuri: – Processors: Number of processors where the user payload is executed Parametri

6 Sono stati creati 3 testbed, uno per ciscun Batch System e per ognuno sono stati testati i valori di CPUTime, WallclockTime, executingNodes e Processors E’ stato simulato un caso di uso reale: – un job MPI con 2 processi di durata diversa ma nota per entrambi (120 e 180 sec); ciascun processo utilizza una diversa CPU – (Ringraziamenti a Cristina Aiftimiei e Gian Mario Mereu) Metodolgia Batch System #Worker Node #CPUFlavour MPI Sede PBS12openmpiCNAF LSF12openmpiPadova SGE24mpichCybersar- portoconte

7 Risultati: PBS - LSF PBSLSF CPUTime WallClockTime executingNodespre-wn- 02.cnaf.infn.it/1+pre-wn- 02.cnaf.infn.it/0 cert-wn32-05;cert- wn32-05 pmem vmem

8 Risultati: SGE cybersar:wnsge02.ca.infn.it:cybersar:cybe rsar006:STDIN:377:s ge:0: : : :0:0:130:33:87: :0:0:0:0:161938:0:0 : :0:0:0:0:250 8:872:NONE:defaultd epartment:mpich:2:0: : : :-q cybersar -pe mpich 2: :NONE: WN WallClockTime CPUTime

9 LSF e PBS: – I dati di CPUTime sono quelli previsti – Sono molto differenti tra loro i valori pmem e vmem SGE: – Pubblicazione dei dati per il solo processo “0” – Nessun CE SGE di produzione in Europa supporta MPI pmem/vmem – Al momento non ancora identificato come realizzare un job che richieda un utilizzo esatto delle memorie Osservazioni

10 Conclusioni I dati pubblicati in HLR per executingNodes, CPUTime e WallclockTime sono corretti per LSF e PBS, per tali sistemi è dunque possibile raccogliere dati di accounting accurati A livello di database (HLR) i job MPI verranno differenziati da quelli sequenziali utilizzando il campo processors non appena questo sarà integrato ufficialmente in HLR

11 Portale di accounting HLRmon [ ts.php]: aggiunta di specifici grafici per job MPI Accuratezza: verificare la correttezza dei valori pmem e vmem SGE: è necessario attendere un miglior supporto ad MPI ed un perfezionamento dei log prodotti Lavori Futuri

12 ? Domande