Procedura di certificazione di un sito Alessandro Paolini EGEE Tutorial Bologna, 6 – 8 June 2007
Introduzione Controllo delle informazioni pubblicate dal sito Controllo dei vari nodi grid del sito Autenticazione Funzionamento dell’LRMS Quando arriva una richiesta di certificazione, si suppone che i site-manager abbiano fatto dei controlli preliminari (doverosi) Inserimento del sito nel bdii di certificazione gridit-cert-rb.cnaf.infn.it
Controllo delle informazioni
Controllo delle informazioni Parametri da controllare: GlueSiteUniqueID GlueSubClusterUniqueID GlueCEUniqueID GlueCESEBind GlueSEUniqueID GlueServiceUniqueID
Controllo delle informazioni GlueSiteUniqueID GlueSiteName GlueSiteUserSupportContact GlueSiteSysAdminContact GlueSiteSecurityContact
Controllo delle informazioni GlueCEUniqueID: GlueCEInfoTotalCPUs GlueCEInfoLRMSType GlueCEAccessControlBaseRule
Controllo delle informazioni GlueCESEBind Per ogni SE del sito devono essere definite: GlueCESEBindSEUniqueID GlueCESEBindCEAccesspoint e GlueCESEBindMountInfo
Controllo delle informazioni GlueCluster, GlueSubCluster: Controllare GlueHostApplicationSoftwareRunTimeEnvironment Nome del sito Versione corrente del middleware RGMA SI00MeanPerCPU_<valore> e SF00MeanPerCPU_<valore> Eventualmente MPICH per gli MPI Eventualmente AFS (e verificare che i WNs montino /afs) GlueHostOperatingSystemName (es. Scientific Linux CERN) GlueHostOperatingSystemVersion (es. SLC) GlueHostOperatingSystemRelease (es. 3.0.6)
Controllo delle informazioni GlueServiceUniqueID: È presente per ogni servizio pubblicato dal sito (RB, WMS, LFC, DPM, GRIDICE, CEGLITE, MYPROXY) Ciò che distingue i servizi sono i valori di GlueServiceType, es: lcg-file-catalog org.glite.wms org.glite.ce ResourceBroker srm_v1 Quante VOBOX ci sono a disposizione?
GRID test Test del gate-keeper Controllo dell’LRMS Controllo dei WNs $ globus-job-run grid0.fe.infn.it /bin/hostname grid0.fe.infn.it $ globus-job-run ce.grid.unipg.it /usr/bin/whoami infngrid001 Controllo dell’LRMS globus-job-run <CE hostname>/jobmanager-lcgpbs –queue cert /bin/hostname globus-job-run <CE hostname>/jobmanager-lcglsf –queue cert /bin/hostname Controllo dei WNs globus-job-run $CE_HOST /usr/bin/pbsnodes -a globus-job-run $CE_HOST /xxx/bin/bhosts
GRID test Controllo dell’autenticazione sull’SE: edg-gridftp-ls gsiftp://grid007g.cnaf.infn.it/flatfiles/SE00 Controllo dei processi dgas sul CE: $ globus-job-run gridit-ce-001.cnaf.infn.it /bin/ps axfwww | grep dgas Controllo dello stato delle code globus-job-run gridce.pg.infn.it /usr/bin/qstat –n Sottomissione job di test: IS del WN, CA, closeSE, stato del WN, repliche, RGMA client, RFIO
GRID test L’output è reports.txt (“grep TEST” per un riassunto)
GRID test Test sul supporto degli mpi (per chi pubblica MPICH) I siti i cui WNs non hanno le home condivise devono pubblicare anche il tag MPI_HOME_NOTSHARED Il test è reperibile su CVS http://forge.cnaf.infn.it/plugins/scmcvs/cvsweb.php/ig-certification/mpi/?cvsroot=igrelease Nel comando di sottomissione, l'opzione –lrms (pbs o lsf) e' importante Nel jdl la variabile NodeNumber deve essere pari al numero dei WNs, mentre cpi almeno il doppio Type = "Job"; JobType = "MPICH"; NodeNumber = 5; Executable = "MPItest.sh"; Arguments = "cpi 14"; StdOutput = "test.out"; StdError = "test.err"; InputSandbox = {"MPItest.sh","cpi"}; OutputSandbox = {"test.err","test.out","executable.out"}; Requirements = other.GlueCEInfoLRMSType == "PBS" || other.GlueCEInfoLRMSType == "LSF";
Ingresso in GRID Superati tutti i tests, il sito può aprire le code, e viene inserito nei bdii di produzione Prosegue la registrazione del sito nel GOC-DB ..ma di questo e di altre procedure burocratiche parleremo nel talk: GRID OPERATIONS
Esercizio File New Profile Avanti Host: gridit-bdii-01.cnaf.infn.it Port: 2170 Spuntare “Anonymous bind” Scegliere un sito e certificarlo… …con tanti auguri…
…e le VOBOX di prima? Potete tentare semplicemente con $ ldapsearch -x -LLL -H ldap://egee-bdii.cnaf.infn.it:2170 -b "mds-vo-name=local,o=grid" 'GlueServiceType=VOBOX‘ Oppure per filtrare l’output: $ ldapsearch -x -LLL -H ldap://egee-bdii.cnaf.infn.it:2170 -b "mds-vo-name=local,o=grid" 'GlueServiceType=VOBOX' GlueForeignKey GlueServiceType GlueServiceUniqueID GlueServiceAccessControlRule