TIER-2 E’ stato certificato in sequenza dal –CNAF –Alessandro De Salvo come ATLAS software manager in LCG –LCG group del CERN nella TestZone E’ costituito come detto precedentemente –1 CE atlasce.lnf.infn.it –1 SE atlasse.lnf.infn.it –3 WN atlascn001, 002, 003 –1 LCFGserver (attualmente su un PC in prestito, in attesa la macchina finale) E’ installata la UI (User interface) sulla vecchia lxcalc05 che rimane ancora in uso ad ATLAS per accordo con Massimo Pistoni. Sui nodi del TIER-2 esistono solo utenti atlas001,…,atlas050, cms001,….., ma solo per la vo (virtual organization) atlas e’ installato il software di esperimento
TIER-2 (2) Su lxcalc05 possono collegarsi tutti gli utenti. Un utente che accede alla griglia viene mappato su uno degli utenti interni dopo che e’ stata controllata la certificazione Lo spazio disco assegnato e’ –/flatfiles/SE00/”exp” 400 GB –/exp_software 50 GB /exp_software/atlas esiste soltanto Il resto dello spazio verra’ assegnato al momento dell’installazione della nuova macchina (atlaslcfg) e del nuovo disco che dupplica lo spazio attuale (richiesto dal pile-up) Lo spazio utente verra’ deciso insieme al calcolo (funzionamento del nuovo SAN e macchine dedicate al calcolo simili al TIER-2) Qualsiasi decisione ora e’ complessa se fuori dello schema di TIER-2
Organizzazione (1) Il sito e’ stato istallato da –Claudio Soprano (super esperto Linux) –Sabrina (fulltime instalation/management) –Meiwen (parttime utente) –Mario Reale (al momento dei problemi che richiedevano un esperto di LCG) I problemi sono stati moltissimi. Gli scripts di istallazione prevedono configurazioni di hardware limitate. I controllori dischi SCASI RAID non sono contemplati. Sono stati modificati con grande sforzo. Sabrina ha gestito la produzione di un paper che documenta il lavoro fatto. E’ stato gia’ utilizzato parzialmente dal gruppo di Cagliari che aveva un problema analogo. Verra’ pubblicizzato in modo che possa essere utilizzato dalla comunita’.
Organizzazione (2) C’e’ ancora molto da capire ma il sito puo’ essere utilizzato dal momento della certificazione da parte del CNAF Molti utenti esterni stanno usando il sito (solo in Italia eccetto per la certificazione LCG) Invito tutti a spendere un po di tempo a famigliarizzare con l’UI. Il tutorial che trovate in e’ buono per un primo approcciohttp://grid-it.cnaf.infn.it Usate la mailing-list per contributi, configurazione dei jobs, eca. Fornire esempi di jobs di ATLAS funzionanti che possano essere utilizzati da altri Prego di non contattare direttamente il Servizio di Calcolo per richieste relative all’uso del TIER-2. Contattate personalmente Sabrina o Meiwen
Organizzazione per l’esterno Attualmente tutte le certificazioni, mailing-list, entry nei databases, eca. portano il mio nome Sono anche il contatto per DC2 Nel futuro non lontano spero che questo ruolo venga ri-assegnato. Sabrina potrebbe gestirlo Il problema principale in questo momento e’ la mancanza d’informazione ( o troppa sulle mailing-list di LCG2) In Italia ci appogiamo al RB (Resource broker) del CNAF che assegna le risorse di un certo numero di siti Il DC2 sembra appoggiarsi ad un RB ad-hoc che distribuisce risorse ad un numero di siti diverso Ieri ho chiesto a Miguel Branco se siamo nella lista dei siti del RB-ATLAS e in caso contrario di inserirci! (fordward di mails ….)
RB al CNAF lxcalc05:~> grid-proxy-init -valid 36:00 Your identity: /C=IT/O=INFN/OU=PersonalCertificate/L=LNF/CN=MariaLorenzaFerrer/ =Maria.Lorenza.Fer Enter GRID pass phrase for this identity:*********** Creating proxy Done Your proxy is valid until: Thu May 20 20:59: lxcalc05:~> more jdl1 Executable = "/bin/echo"; Arguments = "Hello World"; StdOutput = "message.txt"; StdError = "stderror"; OutputSandbox = {"message.txt", "stderror"};
Esempio di parziale funzionamento lxcalc05:~> edg-job-list-match jdl1 Selected Virtual Organisation name (from UI conf file): atlas Connecting to host edt003.cnaf.infn.it, port 7772 **** Error: API_NATIVE_ERROR **** Error while calling the "NSClient::listJobMatch" native api ListMatchException: Problems querying the information service ibm140.cnaf.infn.it lxcalc05:~> edg-job-list-match -vo atlas jdl1 Selected Virtual Organisation name (from --vo option): atlas Connecting to host edt003.cnaf.infn.it, port 7772 **** Error: API_NATIVE_ERROR **** Error while calling the "NSClient::listJobMatch" native api ListMatchException: Problems querying the information service ibm140.cnaf.infn.it lxcalc05:~> edg-job-submit jdl1 Selected Virtual Organisation name (from UI conf file): atlas Connecting to host edt003.cnaf.infn.it, port 7772 Logging to host edt003.cnaf.infn.it, port 9002 ********************************************************************************************* JOB SUBMIT OUTCOME The job has been successfully submitted to the Network Server. Use edg-job-status command to check job current status. Your job identifier (edg_jobId) is: - *********************************************************************************************
Esempio fallito! lxcalc05:~> edg-job-status ************************************************************* BOOKKEEPING INFORMATION: Status info for the Job : Current Status: Aborted Status Reason: Cannot plan: BrokerHelper: Problems querying the information service ibm140.cnaf.infn.it reached on: Wed May 19 07:06: *************************************************************
Certificati Nella home directory dell’utente della griglia deve essere creata una directory.globus lxcalc05:~> pwd /afs/lnf.infn.it/user/f/ferrer lxcalc05:~> ls -la.globus total 33 drwxr-xr-x 2 ferrer kloe 2048 Apr 20 11:09. drwxr-xr-x 72 ferrer kloe May 18 15:06.. -rw-r--r-- 1 ferrer kloe 2414 Jan 27 17:35 usercert.pem -r ferrer kloe 1916 Jan 27 17:36 userkey.pem I files.pem vengono creati a partire dal file esportato dal browser da dove si ottiene la certificazione. Come detto precedentemente, l’utente si deve registrare anche nella VO atlas
DC-2 Da Dario il venerdi 14. La release dovrebbe essere disponibile lunedi di questa settimana (Alessandro Di Salvo e’ responsabile per installarlo nel TIER-2 sotto una utenza definita. Meiwen lo fa sull’area AFS) La produzione DC2 dovrebbe partire questa settimana ma nessuna comunicazione da Gilbert Poulard e’ arrivata C’e’ una grossa attivita’ di siti che vogliono entrare nella TestZone di LCG-2 (50 mails sulla mailing list al giorno! Riportando i problemi/successi dei test) Quando ci siamo iscritti alla mailing list (necessaria alla richiesta di inserimento) I tests indicavano 24 siti OK e 14 in errore! (13 Maggio). La situazione al 18 maggio e’ nella pagina Ho chiesto perche’ non appare ancora INFN-LNF e ….
Resources di un sito Richiesta dei parametri di un sito una volta identificato il nome del CE lxcalc05:~> ldapsearch -x -h atlasce.lnf.infn.it -p b "mds-vo-name=local,o=grid“ -> molte informazioni lxcalc05:~> ldapsearch -x -h atlasce.lnf.infn.it -p b "mds-vo-name=local,o=grid“| grep RunTime GlueHostApplicationSoftwareRunTimeEnvironment: VO-atlas-release GlueHostApplicationSoftwareRunTimeEnvironment: FRASCATI GlueHostApplicationSoftwareRunTimeEnvironment: LCG2 Un job che richiede che sia disponibile il software di ATLAS dovrebbe mettere nei Requirements VO-atlas-release (p.e.)