Scaricare la presentazione
La presentazione è in caricamento. Aspetta per favore
PubblicatoDaniele Giuseppe Modificato 8 anni fa
1
CMS @ CNAF
2
storage Siamo in una fase di tuning con lo storage, che al momento sembra essere un collo di bottiglia 1.~10 giorni fa vista saturazione GPFS a 6 GB/s 2.In contemporanea, efficienza di CPU in calo
3
Azione Vladimir: dovuto a Storage Pools sbilanciati sul ddn12k; lanciato ribilanciamento Situazione attuale un po’ migliorata: + 2 GB/s Ma efficienza ancora suboptimale
4
2015 … Ci aspettiamo 39kHS06 entro il 1 Aprile – Diciamo 3500 job slots di pledge, fino a 2x in certi casi I vecchi numeri delle gare erano 5 MB/s/job (correggetemi se sbaglio) Su 3500 jobs farebbe un enorme 17.5 GB/s, che non e’ possibile.. Pero’ contavamo su 15 GB/s dal DDN12k (che sulla carta fa tranquillamente.…) Soluzioni? Domanda: il grosso utilizzo di AMS nello stesso periodo ha conseguenze?
5
Altre 2 cose… Proposta di CMS di spostare il DataManagement su CNAF_DISK in automatico – Quindi approvazione automatica delle richieste Phedex – Io non vedo problemi, lo fanno gia’ PIC e KIT Setting: (3PB-200TB)/2 da dare in gestione automatica – ~2400 TB – Ok?
6
Ssh to condor Esiste una feature (che non conoscevo) per cui se gira un job HTCondor su un nodo, chi e’ in possesso del proxy puo’ far partire un sshd sul WN e lasciar entrare l’utente del pilot (quindi operatori) – NON utenti finali, solo coloro che hanno il proxy del pilot e NON del payload finale – Inoltre, sshd parte con l’id dell’utente e non ROOT (ovviamente) – La connessione ssh e’ via chiave pubblica generata ad-hoc per la connessione, e distribuita client/server via comunicazione interna condor Non funziona al CNAF, probabilmente perche’ la shell dei cmspltXX e’ nologin – Questo blocca, non so se ci siano problemi a valle Non credo sia una cosa scritta nel MoU di WLCG, per cui non mi risulta sia obbligatorio per metterlo (stiamo vedrificando!) Detto questo, voi che ne pensate? Spiegazione del meccanismo: http://research.cs.wisc.edu/htcondo r/manual/current/condor_ssh_to_jo b.html
7
Siti che NON permettono login ` … Tutti gli altri si
8
Computing week al cern Giovedi’ sessione T1, in cui si chiede di dichiarare lo stato del deployment delle risorse 2015 Da Luca: – 39 kHS06 1 Aprile ok – Disco invariato 3380 TB ok – Tape 9620 TB ok – Luca, vuoi presentare tu questa cosa? Altrimenti io ci saro’ di sicuro
9
Finale … Sonia away (giustamente!) fino alla ripresa del contratto a inizio Aprile Possiamo chiedere una mano a Saverio in queste due settimane? – Serve ok di user support chiaramente
Presentazioni simili
© 2024 SlidePlayer.it Inc.
All rights reserved.