Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 1 INFN WAN Condor Pool: Status Report P.Mazzanti, F.Semeria.

Slides:



Advertisements
Presentazioni simili
Termodinamica Chimica
Advertisements

Lo sviluppo delle PMI tra Innovazione e Competenze. Il progetto MASTER Valentina Castello.
ISA Server 2004 Enterprise Edition Preview. ISA Server 2004.
Introduzione ad Active Directory
Branch office update – SP2. Agenda Messa in esercizio degli uffici remoti Compressione HTTP Differentiated Services Cache di BITS.
P. Capiluppi Organizzazione del Software & Computing CMS Italia I Workshop CMS Italia del Computing & Software Roma Novembre 2001.
Testbed release: processo di integrazione e validazione A. Ghiselli, L. Gaido.
Queuing or Waiting Line Models
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
Linux Riunione Referenti-CCL 2-Luglio Utilizzo di Linux Principale (unica) piattaforma di calcolo per HEP Grid Supportato dalle maggiori industrie.
Istituto Nazionale di Fisica Nucleare Roma,12 febbraio 2001 Netgroup meeting Situazione attuale e attivita futura - R.Gomezel 1 Netgroup meeting Situazione.
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
INFN-GRID WP1 11 gennaio 2001 GridFTP: stato dellarte Luciano Gaido 1 Progetto INFN-GRID GridFTP: stato dellarte Riunione WP1 (GLOBUS) Cnaf, 11 gennaio.
INFN-GRID WP1 20 novembre 2000 Sperimentazione GridFTP Luciano Gaido 1 Progetto INFN-GRID Sperimentazione GridFTP Riunione WP1 (GLOBUS) Cnaf, 20 novembre.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
La sicurezza può essere fornita in ciascuno degli strati: applicazione, trasporto, rete. Quando la sicurezza è fornita per uno specifico protocollo dello.
13-may-031 Calcolo CDF Richiesta sblocco s.j. per Accelerare migrazione farm (analisi e MC) da FNAL al CNAF incluso piccolo status report ed uno sguardo.
Distributed System ( )7 TCP/IP four-layer model.
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
FESR Consorzio COMETA Pier Paolo CORSO Giuseppe CASTGLIA Marco CIPOLLA Industry Day Catania, 30 Giugno 2011 Commercial applications.
AFS Working Group R.Gomezel CCRWS Verso la sfida di LHC Otranto (Lecce), 6-9 Giugno 2006.
Infrastruttura GRID di produzione e i T2 Cristina Vistoli Cnaf.
16 Maggio CSN1 Computing-Software-Analysis CMS-INFN TEAM Analisi in CMS: stato e prospettive del supporto italiano.
Extreme Cluster Administration Toolkit Alberto Crescente, INFN Sez. Padova.
Sezione di Padova Contributo alla costruzione dei layers 6,7 Possibili task per PADOVA:  precedente proposta: R&D della procedura di assemblaggio degli.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
Competenze e attività gestite dai servizi di calcolo e reti. Paolo Mastroserio.
Condor standard. Sistema Batch. Tool di installazione D. Bortolotti,P.Mazzanti,F.Semeria Workshop Calcolo Paestum 9-12 Giugno 2003.
8 Maggio 2002Workshop CCR - La Biodola W2K Coordination Group & HEP-NT Report Enrico M.V. Fasanelli Gian Piero Siroli.
Installation and evaluation of the Globus toolkit Massimo Sgaravatto INFN Padova.
Distribuzione controllata del software con Systems Management Server 2003 Fabrizio Grossi.
Accoppiamento scalare
BaBar Tier A Administration Workshop CCR, Paestum Giugno 2003 Alberto Crescente, INFN Sez. Padova.
SUMMARY Time domain and frequency domain RIEPILOGO Dominio del tempo e della frequenza RIEPILOGO Dominio del tempo e della frequenza.
Viruses.
Antivirus per mailserver: RAV Antivirus & altri Marco De Rossi – “Workshop sulle problematiche di calcolo e reti nell'INFN” 6-9 Maggio La Biodola.
Istituto Nazionale di Fisica Nucleare La Biodola, Isola d’Elba, 6-9 maggio 2002 AFS: Status Report WS CCR R.Gomezel Workshop sulle problematiche.
Meeting CCL-Referenti Stato dell’arte. 28 Aprile 2004 P.Mazzanti.
Mobilità tra i Paesi del Programma KA103 A.A. 2014/2015 (KA103) Mobility Tool+ e il Rapporto Finale Claudia Peritore Roma luglio 2015.
La gestione snella dei progetti Social Perché il lato pesante non può vincere sulla forza agile Ernesto Amato Project Manager & Agile Evangelist.
L A R OUTINE D EL M ATTINO Ellie B.. Io mi sono svegliata alle cinque del mattino.
Report HEPiX Spring meeting 2002 Workshop sulle problematiche di calcolo e reti nell'INFN 6-9 Maggio 2002 La Biodola - Isola d'Elba Silvia Arezzini.
Condor III Workshop sul Calcolo INFN F. Semeria INFN Bologna Cagliari
CMS 1 M. Biasotto – Bologna 20/01/2005 Infrastruttura di calcolo per CMS-Italia M.Biasotto – INFN Legnaro e i gestori dei centri CMS Italia.
Windows 2000 WG Status Report Gian Piero Siroli, Dip. di Fisica, Univ. di Bologna e INFN La Biodola 2002.
SUMMARY Different classes and distortions RIEPILOGO Le diverse classi e le distorsioni RIEPILOGO Le diverse classi e le distorsioni.
Accesso a ShareGrid mediante VPN ing. Sergio Rabellino Dipartimento di Informatica Università degli Studi di Torino.
Auditing di sicurezza Report 2011 O. Pinazza per il gruppo Auditing CCR-INFN Tutorial Sicurezza CCR, LNF 15 febbraio
Storage (ieri, oggi e domani) Luca dell’Agnello INFN-CNAF.
Comenius Project “Math is B.E.A.U.” that is Beautiful Easy Amusing Useful ITALIAN WORKGROUP ENNISKILLEN (U.K.) May 2011.
Michele Punturo INFN Perugia 1. Riunione di oggi Mattina: problemi immediati – Trasferimento dati da LIGO (Luca Rei) – Trasferimento dati da.
11 Richieste di banda Anno 2010 T.Ferrari, M.Morandin CCR, Roma, 30 settembre 2009.
The INFN Tier-1: progetto di ampliamento Cristina Vistoli – INFN CNAF Referee Meeting Sep
MM news & status -Final Design Review -NA for NSW -altre attività MM.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
Futuro di EGI EGI è menzionato esplicitamente nel draft delle nuove calls EU ( H2020 ) Da ultima versione (per me) data 18-9 di –HORIZON 2020 – WORK PROGRAMME.
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
Do You Want To Pass Actual Exam in 1 st Attempt?.
Riunione INFN – Bologna, 17 January 2013
MONBOX Federico Bitelli bitelli<at>fis.uniroma3.it
Dichiarazione dei servizi di sito nel GOCDB
Gigi Cosentino - LNL 20 ottobre 2016
Proposal for the Piceno Lab on Mediterranean Diet
SWORD (School and WOrk-Related Dual learning)
Transcript della presentazione:

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 1 INFN WAN Condor Pool: Status Report P.Mazzanti, F.Semeria

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 2 Sommario › Condor e Progetto Condor INFN - Configurazione e stato del Pool › Utilizzazione del pool e reazioni dagli utenti › Possibili sviluppi

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 3 Cosa e` Condor Condor converte un insieme di workstation scorrelate in un sistema di calcolo high-throughput E` un sistema non invasivo

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 4 Cosa e` Condor (cont.) › Condor cerca di runnare un job anche se alcune macchine:  Vanno in crash  Vengono disconnesse  Sono tolte o aggiunte al pool

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 5 Utilita` di Condor › Condor utilizza risorse che altrimenti andrebbero perdute: 1000 cpu non usate per 15 ore al giorno = 1.7 anni di cpu al giorno sprecati

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 6 Policy d’uso generale Ogni gruppo deve mantenere il massimo controllo e la massima priorita` sulle proprie macchine.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 7 The ‘Condor on WAN’ INFN Project › Approved by the Computing Committee on February › Goal: install Condor on the INFN WAN and evaluate its effectiveness for the our computational needs. › ~30 people involved. › Collaboration INFN-CS Madison-Wisconsin

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 8 Organization of the Project › Coordinator: Paolo Mazzanti. › Central Management: (condor- › Local Management: ~25 people. › Steering Committee › Software support and maintenance contract with the Madison Condor Team

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 9 Central management › The Admin Group has to provide: - Configuration, tuning and overall maintenance of the INFN Condor Wan pool. - Management tools. - Activity reports. - Condor resource usage statistics (CPU, Network, Ckpt-server). - Help desk for users and local administrators. - Interface to Condor support in Madison.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 10 Local management › Local management has to provide :  release installation in collaboration with the central management.  local Condor usage policies.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 11 Steering Committee › The Steering Committee has to:  Interact with the Condor Team and suggest possible modifications of the system.  Define the general policy of the Condor pool.  Organize meeting for Condor administrators and users.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 12 INFN-WAN Pool ALPHA/OSF1 107 INTEL/LINUX 122 SUN/SOLARIS 6 INTEL/WNT Total 236

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 13 INFN-WAN Pool (cont.) Il primo esempio in Europa di un sistema di calcolo distribuito a livello nazionale.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 14 Il problema del checkpoint › Il checkpoint di un job puo’ essere molto grande (~100MB): possibili problemi di rete se fatto su WAN.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 15 Checkpoint Server Domains Per ridurre il traffico di rete si divide il pool in “domini di checkpoint”, ognuno con un checkpoint server. Un job deve rimanere il piu’ possibile nello stesso dominio.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 16 Checkpoint Server Domains(cont.) Numero di macchine associate ai ckpt domain BO: 42 CNAF: 71 LNGS: 12 MI: 19 NA: 11 PD: 25 PV: 17 TO: 32 TS: 6

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 17 GARR-B Topology 155 Mbps ATM based Network access points (PoP) main transport nodes radio wave bridge 34M user access E1-E3 TO PD BARI PALERMO FIRENZE PAVIA MI 19 GENOVA NA CAGLIARI ROMA PIS A L’AQUILA CATANIA BO UDINE TRENTO PERUGIA LNF LNGS SASSARI LECCE LNS LNL Europe/US 155Mbps T3 SALERNO COSENZA S.Piero FERRARA A CNAF 87 Central Manager CKPT domain # hosts INFN Condor Pool on WAN: checkpoint domains April 2002 ROMA Default ckpt domain in cnaf PV US Ts 6

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 18 Software installed Condor releases Official release: 6.2.0/1 However a large number of machines, mainly Linux are running old versions 6.1.x (x=8,10,12,16)  problems

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 19 APPLICATIONS › Simulation of Cherenkov light in the atmosphere (CLUE). › MC integration in perturbative QCD. › Dynamic chaotic systems. › Extra-solar planets orbits. › Sthocastics differentials equations. › Maxwell equations. › MC simulation, liquid crystals

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 20 Il numero di utenti che hanno usato il pool per piu' di 100 ore: 45. Un utente ha utilizzato circa ore di allocation time. Possibilita’ di runnare per tempi lunghissimi.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 21 Totale ore utilizzate Periodo Gennaio-Dicembre 2001 ~ > 82 anni!

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 22 Outside INFN … CERN: Chorus exp. NASA : ~ 300 cpus Japan : ~ 300 cpus Oracle: ~ 1500 cpus Madison: ~ 1800 cpus in 10 campus pools More than 350 condor pool with more than 9000 cpus world wide.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 23 Grado di soddisfazione : Utenti che lo usano in modo sistematico: ottimo Ma: -Alcuni programmi non danno buone prestazioni… I/O ? (Ma: caching..) -Problemi associati al CKPTng (non omogeneita’ delle release ?) -Il pool DEVE essere mantenuto aggiornato. Alcuni utenti trovano difficile usare Condor !!!

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 24 Caching Condor keeps a buffer of recently-used data for each file a job accesses. This buffer is used both to cache commonly-used data and to consolidate small reads and writes into larger operations that get better throughput. Caching only apply to standard-universe jobs.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 25

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 26 Sviluppi Migliorare l’interazione con gli utenti. Migliorare la gestione del pool. Installare la prossima release stabile: indispensabile maggiore omogeneita`. Incrementare il numero delle cpu nel pool: includere farm (flocking?). Uso di Condor come sistema batch.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 27 Sviluppi (flocking) Flocking allows jobs from one Condor pool to run in another Condor pool if there are insufficient resources in the local pool.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 28 Sviluppi (batch) A batch system may be set up by using the following features: -more than one job may be executed on the same cpu at the same time -a job time limit may be defined As a consequence QUEUES may be easily (!!) defined and configured.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 29 New Release Arch. and OS.: Complete support for RedHat 7.x, HP, Sun, SGI, Alpha. W2K and MAC OS X ‘clipped supported’ (no ckpt,no parallel functionalities, no remote system calls).

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 30 New Release (cont) Security: Secure network connection (Kerberos, X509, NT LanMan) Encryption: all ‘condor’ network traffic can be encrypted Authorization based on host or USER. Firewall support E.g.: LOWPORT = X HIGHPORT = Y All dynamic ports will be between x and y

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 31 New Release (cont.) New Job Universe: MPI universe Globus Universe (GRID) Java Universe. Possibility to run condor jobs on different architectures.

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 32 New Release (cont.) File Transfer: Possibility to transfer files from the submitting machine to the executing one. Example: Transfer_input_files = x. y. z. Transfer_output_files = a. b. c. Transfer_files = [ALWAYS | ONEXIT] Default: send back new/changed files

Workshop sulle problematiche di calcolo e reti nell’INFN. 6-9 Maggio 2002 La Biodola, Isola d’Elba 33 Conclusioni L’INFN WAN condor pool si e’ dimostrato un efficiente sistema di calcolo distribuito. Limitati i costi di gestione e mantenimento. Soddisfa ad un requisito fondamentale per quanto riguarda l’utilizzo delle risorse: permette l’uso di risorse di calcolo che altrimenti andrebbero perdute. L’estrema flessibilita’ del software rende possibile moltissime diverse configurazioni. Si continua?