Incontro annuale utenti ReCaS ALICE, CMS, CTA, DAMPE, FERMI, PAMELA

Slides:



Advertisements
Presentazioni simili
Computing: Attività 2011 Limitate produzioni di MC e skim E il dataset finale (rel24/26) Grosso sforzo per il Long Term Data Access project: cluster di.
Advertisements

LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
La Farm di Alice a Torino Workshop sulle problematiche di calcolo e reti Isola d’Elba 6-9 maggio 2002 Mario Sitta (Università del Piemonte Orientale e.
BOLOGNA Prin-STOA Report L. Rinaldi Bari – 12/11/2015.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
Referaggio sigla CALCOLO D. Bonacorsi, G. Carlino, P. Morettini CCR – Roma 9 Settembre 2014.
Domenico Elia1CdG Tier1-Tier2 / CNAF ALICE Tier2 sites Domenico Elia CdG Tier1-Tier2 Bologna, 15 Aprile 2015  Infrastruttura e risorse, coordinamento.
Silvia Arezzini 2 luglio 2014 Consiglio di Sezione per Preventivi.
L’infrastruttura del progetto ReCaS Paolo Lo Re on behalf of ReCaS collaboration.
Referaggio delle richieste dei gruppi di lavoro G. Ambrosi, R. Fantechi, M. Gulmini, O. Pinazza Commissione Calcolo e Reti, Roma, 5-7 Ottobre 2010.
ATLAS computing Roberto Carlin Commissione I Roma 1/7/08 F. Bossi, C.Bozzi, R. Carlin, R. Ferrari, D. Lucchesi, D. Martello, M. Morandin, M. Taiuti.
Attività PRIN STOA a Cagliari Alessandro De Falco Università/INFN Cagliari.
KLOE - Referee Luca Lista, Andrea Perrotta, Vincenzo Vagnoni.
Utilizzo e Richieste infrastrutture di calcolo esperimenti LHC & non LHC G. Carlino, INFN Napoli CSN1 – Roma 7 Luglio 2016.
Domenico Elia1 Calcolo ALICE: stato e richieste finanziarie (aggiornamenti) Domenico Elia Riunione Referee Calcolo LHC / Bologna, Riunione con.
Il calcolo per l’esperimento GERDA: prospettive per la Fase II Luciano Pandola INFN, Laboratori del Gran Sasso e Laboratori del Sud Workshop della CCR,
Torino, Andrea Dainese 1 Andrea Dainese (INFN – LNL) Stato del Tier-2 ALICE a Legnaro.
Stato dell’infrastruttura INFN CNAF, Stato dell’infrastruttura Impianti tecnologici Gli impianti di base stanno funzionando, ma sono urgenti.
Il calcolo ATLAS a Napoli nel 2014/2015
Riunione ALICE Italia - Referee stato e richieste finanziarie
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Report dei referee sulle richieste di OPERA referees: S. Bottai, B
Summary di (quasi) tutti gli utenti non presentati…
D. Martello, F. Ricci, F. Ruggieri
CALCOLO CSN B.Bertucci.
I costi del Calcolo LHC un update –
INFN-Bari.
Calcolo LHC e Tier2 Concezio Bozzi, INFN – Ferrara
M.Biasini, P. Checchia 23 Settembre Riunione CSN1
G. Carlino, D. Lucchesi, V. Vagnoni
Massimo Masera CSNIII Roma, 20 marzo 2012
Metodologie Quantitative per il Calcolo Scientifico
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Richieste di upgrade dei link di accesso alla rete Geografica
G. Carlino, D. Lucchesi, V. Vagnoni
PNSD - Modulo M5 e M11 Ravenna
Attivita’ e compiti del Servizio Impianti Calcolo e Reti
Commissione Scientifica III stato e richieste finanziarie
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Richieste preliminari calcolo non LHC
Pisa.
Sicurezza e Grid Computing
Introduzione alla sessione sull’analisi per gli esperimenti LHC
QUADRO CALCOLO IN COMMISSIONE III
PNSD - Modulo M6 Faenza 6 settembre 2017
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
ALICE CALCOLO richieste finanziarie e proposte di assegnazione 2017
Aggiornamento sullo stato del Tier-2 di Catania
ATLAS-Italia Tier-3 Dario Barberis Università e INFN Genova
Attvità Computing – Inverno 08/09
(Breve) Riassunto del workshop WLCG
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
MC-INFN.
IL CALCOLO DI ALICE IN ITALIA
CNAF – Proposte B.Bertucci.
Report Calcolo Commisione III
23,6% 2,8% 10,5% 22,8% 22% 18,3%.
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
PNSD - 24 ottobre 2017 Piattaforma e risorse educative aperte (OER) per la costruzione di contenuti digitali - G Suite For Education - Storage e repository.
Interfacce SRM: l'utilizzo di STORM - Overview e prospettive (ALICE)
Calcolo “locale” ATLAS-Mi
Risultati del questionario sui servizi middleware aggiuntivi
PNSD - Modulo M6 Lugo 4 settembre 2017
ATLAS: il calcolo Alessandro De Salvo
Managed Workplace RMM Il monitoraggio e la gestione da remoto (Remote Monitoring and Management) resi semplici. Ottieni gli strumenti e le conoscenze necessarie.
Rivelazione e misura di mesoni 0 con il rivelatore ICARUS T600
CMS – Richieste finanziarie – 22 giugno 2004
PNSD novembre 2017 Piattaforma e risorse educative aperte (OER) per la costruzione di contenuti digitali - G Suite For Education - Storage e repository.
ATLAS PRIN Roma1 - status Alessandro De Salvo
Report dei referee di Kloe
Transcript della presentazione:

Incontro annuale utenti ReCaS ALICE, CMS, CTA, DAMPE, FERMI, PAMELA Bari, 4 Luglio 2017 Le esigenze della FISICA SPERIMENTALE Domenico Elia (INFN Bari) per gli utenti: ALICE, CMS, CTA, DAMPE, FERMI, PAMELA Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Contenuto e crediti Riscontro sintetico per ciascun utente: use case scientifico statistiche di utilizzo delle risorse ReCaS problematiche ed eventuali suggerimenti/proposte Utenti INFN gruppo I, II e III: ALICE (CSN3): DE, A. Franco, G. Vino CMS (CSN1): L. Cristella Utenti CSN2: CTA: L. Di Venere, E. Bissardi DAMPE: F. Gargano FERMI: F. Loparco PAMELA: A. Bruno Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Use case (1): ALICE Tier-2 ALICE: BA uno dei 4 Tier-2 ALICE INFN (con CT, PD-LNL, TO) Analisi e storage dati (da ricostruzione raw data e MC): esecuzione workflow gestiti centralmente (AliEn): 75% MC e 25% Analisi storage dataset utilizzati anche da altri Tier Nodi di calcolo per Tier-1: BA fornisce nodi di calcolo al Tier-1 (link dedicato con CNAF) ALICE utilizza pienamente anche queste risorse (principalmente MC) Analysis Facility ALICE-IT: cluster per analisi interattiva sviluppata nel PRIN STOA-LHC condivisione dello storage con altre AF in siti ALICE INFN data federation con redirettore XRootD nazionale a BA Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Use case (2): CMS Tier-2 CMS: BA uno dei 4 Tier-2 CMS INFN (con RM1, PI, PD-LNL) skimming e storage dati CMS: esecuzione workflow gestiti centralmente (WMAgent) esecuzione workflow gestiti da ingoli utenti (CRAB) storage e backup dataset processati (anche da altri Tier) analisi dati (CMS BA & Co): job sottomessi da utenti CMS con accesso interattivo alla farm Nodi di calcolo al Tier-1 (vedi ALICE) Web server di piccoli siti web: per condividere materiale per Redmine projects all’interno della collaborazione CMS Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Use case (3): CTA Analisi dati e simulazione per CTA: progetto array di ~100 telescopi Cerenkov per studio raggi gamma ruolo e attività presente gruppo di BA: progettazione camera prototipo telescopio SCT (in collaborazione con USA) in corso: caratterizzazione dispositivi (SiPM) per primo prototipo attività future (prossimi mesi): validazione e calibrazione dispositivi prima della produzione di massa assemblaggio prototipo prevista fine 2017 analisi dati presi dal prototipo simulazioni dati di alto livello Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Use case (4): DAMPE Analisi dati per DAMPE: backup parziale dati MC storage dataset opportunamente selezionati per specifiche analisi BA ospita redirettore XRootD: accesso dataset (reali e MC) di tutto l’esperimento per la comunità europea Uso del sistema HPC: macchina dedicata con GPU Nvidia Tesla K40 utilizzo librerie TensorFlow in Docker containers Docker containers con ambiente completo di lavoro: TensorFlow, ROOT6, Anaconda risorse utilizzate per analisi PID su MC e dati in orbita Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Use case (5): FERMI e PAMELA Analisi dati per FERMI: studio emissione gamma: da sorgenti galattiche ed extra-galattiche, alta energia (100 MeV – 300 GeV) da Sole e Luna dall’atmosfera terrestre (“Earth Limb”) ricerca indiretta dark matter studio spettri di elettroni e ricerca anisotropie Analisi dati per PAMELA: misura radiazione carica nelle fasce di Van Hallen misura di eventi solari, effetti geomagnetici (“Space Weather”) ricostruzione di spettri energetici, distribuzioni angolari etc Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Previsione utilizzo futuro Statistiche di utilizzo Sottosistema utilizzato Frequenza di utilizzo Previsione utilizzo futuro Numero job sottomessi Storage utilizzato ALICE Batch Quotidiana >> 1 anno ~2800/giorno ~1200 TB CMS Batch, HPC ~3500/giorno ~2000 TB CTA Settimanale - < 1 TB DAMPE > 1 anno ~10-20/giorno ~50 TB FERMI ~10/giorno ~40 TB PAMELA 1 anno ~100/giorno ~3 TB Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Problemi/proposte (1): ALICE Ritardo messa in linea storage 2016: ultimo blocco (300 TB) acquistato fine 2016, online Giugno 2017: richiesta intervento assistenza per problemi hardware necessità ulteriore acquisizione (cavi etc) tempistica procedura di configurazione basso livello dischi e server Programmazione preventiva (h/w e man-power)? Problema potenzialmente sensibile per prossimo futuro (gare centralizzate, arrivo contemporaneo risorse ALICE+CMS a BA). Down 11-13 Aprile: non preventivato, “impegnativo” ripristino attività calcolo e storage Rendere più rapido il reboot del sistema (task force, procedure automatiche dedicate) ? Mancata pubblicazione dati accounting su FAUST: essenzialmente prima metà 2016, recuperabile il pregresso? Monitoraggio trasmissione dati al sistema di accounting? Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Problemi/proposte (2): CMS Mount point non accessibili (/afs, /gps, ...): causa interventi tecnici senza preavviso Pagina di monitoring della farm per gli utenti (quali rack, pcs sono ON, non alimentati etc)? Software monitoring per amministratori: intervenire senza aspettare notifica utenti? Lunghe attese per utilizzare CPU/GPU sistema HPC: risolto a inizio anno ma riapparso di recente ... Front-end con poca memoria Assegnazione CPU non sempre fedele alle richieste: risolto nell’ultimo mese Down 11-13 Aprile (vedi ALICE) Per le attività machine learning utile disporre di più di un nodo dotato di TensorFlow Poter richiedere anche #GPU (oltre al #CPU) nella sottomissione al sistema HPC Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Problemi/proposte (3): CTA, FERMI, DAMPE CTA: sporadici rallentamenti nell’accesso ai dati FERMI: spesso si osservano rallentamenti sulle macchine di front-end DAMPE: occasionalmente sensibile rallentamento macchine front-end: di solito legato ad attività di “manutenzione” dell’infrastruttura Potrebbe essere utile informare preventivamente gli utenti su questi interventi e su potenziali malfunzionamenti che potrebbero essere sperimentati in conseguenza. Si pensa di intensificare l’uso di TensorFlow, quindi servirebbero delle macchine dedicate basate su Docker containers. Sarebbe ovviamente molto utile avere anche su queste un sistema di gestione delle code di job. Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017

Incontro annuale utenti ReCaS / Bari, 4.7.2017 Conclusione Esperimenti più che soddisfatti: clima di grande collaborazione e professionalità in ReCaS percepito sforzo continuo per migliorare il servizio agli utenti Problematiche e suggerimenti: generalmente difficoltà non particolarmente critiche qualche suggerimento, inteso nel consueto rapporto costruttivo Agli amministratori e colleghi coinvolti nella gestione del datacenter ReCaS: un sentito GRAZIE! Domenico Elia Incontro annuale utenti ReCaS / Bari, 4.7.2017