COSA f2f Meeting INFN-CNAF Bologna 3/11/2016 WP3 (status&update)

Slides:



Advertisements
Presentazioni simili
CUDA & OpenMP parallel programming.
Advertisements

LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
Lenovo ® ThinkServer ® RD350 e RD450 Nome relatore, titolo - Data.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
LNF Farm E. V. 9/8/2006. Hardware CE, LCFG, HLR, 3 WN: DL 360 1U; SE: DL 380 2U 5 WN: BL 25 P In totale 25 jobs general purpuse (coda Atlas) + una coda.
Federico Ruggieri Riunione CSN1 PISA 22 Giugno 2004 Il Progetto TIER1 Status Update.
BaBar Tier A Administration Workshop CCR, Paestum Giugno 2003 Alberto Crescente, INFN Sez. Padova.
Alessandro Tirel - Sezione di Trieste Storage Area Network Riunione gruppo Storage Padova, 5 ottobre 2005.
Online U. Marconi Milano, 21/9/ ~ 9000 optical link 40 MHz PCIe based readout 30 MHz × 100 kB/evt 5 Gb/s, 300 m long fibres from the FEE directly.
Servers Outlook Server for INFN – End 2007 Outlook.
COSA: Computing on SoC Architecture D. Cesini – INFN-CNAF – CSNV – 30/09/ Ferrara.
+ COSA (COmputing on Soc Architectures ) Michele Michelotto – INFN Padova.
CNAF 6 Novembre Layout del testbed  wn a OS SL5.0 8 GB RAM kernel xen_3.1.0 SMP  wn a OS SL5.0 8 GB RAM kernel.
+ COSA (COmputing on Soc Architectures ) Tommaso Boccali – INFN Pisa.
WP3: Implementazione del prototipo al CNAF Status.
Test di porting su architetture SoC F. Pantaleo for T. Boccali.
Firmware per il Trigger del RICH Cristiano Santoni Università degli studi di Perugia INFN - Sezione di Perugia Meeting generale GAP 13/01/2014.
Domenico Elia1Workshop PRIN STOA-LHC / EGI CF - Bari, Workshop PRIN STOA-LHC EGI CF - Bari, 12 Novembre 2015 Report attività ALICE (+ dettaglio.
Calcolo a LHC Concezio Bozzi, INFN Ferrara per il gruppo di referaggio: F. Bossi, CB, R. Ferrari, D. Lucchesi, D. Martello, [M. Morandin], S. Pirrone,
CCR, LNF ott 2011 Proposte assegnazioni server & storage L. Carbone, A. Gianoli, M. Serra.
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
Sistema Informativo. Mansioni Gestione della piattaforma hardware e sistemistica del sistema informativo INFN In realta’ il mansionario e’ in continua.
FESR Catania, Trigrid Open Day, Trinacria Grid Virtual Laboratory PROGETTO “ISOSPIN” Supporters : AnnaMaria Muoio, Marcello IaconoManno.
Sommario richieste CSN1 Consiglio di Sezione 28/06/2013 Attilio Andreazza.
Ingegneria Dalmine "Impianti Informatici" CLOUD - 1 Introduzione al Cloud Computing M.Arrigoni Neri.
Domenico Elia1 Calcolo ALICE: stato e richieste finanziarie (aggiornamenti) Domenico Elia Riunione Referee Calcolo LHC / Bologna, Riunione con.
Cms.
Riunione ALICE Italia - Referee stato e richieste finanziarie
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Online U. Marconi Bologna, 5/9/2016.
Problema T1 30 settembre Andrea Chierici CDG T1.
Gianluca Lamanna (Unità di Pisa) II GAP MEETING – Pisa –
Summary di (quasi) tutti gli utenti non presentati…
CMS HPC Italia.
Riunione INFN – Bologna, 17 January 2013
Ricostruzione immagini Positron Emission Tomography (PET)
Engineering Faculty University of Messina, Italy Marco Scarpa
Referaggio delle richieste dei gruppi di lavoro L. Gaido, F. Galeazzi
Risultati ultimi mesi Piano di lavoro prossimi mesi Reclutamento
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
The FOOT Calorimeter No TOF, high density and good energy resolution -> BGO TOF asks for 1.2 m lever arm -> R = 20 cm with 100 angular aperture of the.
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
Richieste preliminari calcolo non LHC
Pisa.
Assegnazione risorse Stato INFN CNAF,
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
Analisi dei dati dell’Esperimento ALICE
NETGROUP Incontro Technology Tracking 2008
Aggiornamenti dal Tier-1
Aggiornamento sullo stato del Tier-2 di Catania
Nuove funzionalità e futura implementazione nella Sezione di Trieste
Introduzione L0.
Belle II Computing: Accesso alle risorse di storage via http/webdav
INAF – Osservatorio Astrofisico di Catania
IL CALCOLO DI ALICE IN ITALIA
Workshop dei Gruppi di lavoro CCR Michele Michelotto at pd.infn.it
Drafts H2020.
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
ATLAS PRIN Next Steps Alessandro De Salvo
ONEDATA - distributed data caching -
Calcolo “locale” ATLAS-Mi
Gruppo Proxmox ImoLUG: vedere provare condividere
GAP: Obiettivi Generali
M.Biasini, P. Checchia 18 Settembre 2008 Riunione CSN1
La richiesta si basa sulle seguenti considerazioni:
HEPMARK2 Michele Michelotto.
Windows Admin Center La rivoluzione della gestione di Windows Server
Programmazione parallela in Matlab e Test per ENEA-GRID
(Università di Palermo)
CdS 2017: embargo fino a TAUP2017
Transcript della presentazione:

COSA f2f Meeting INFN-CNAF Bologna 3/11/2016 WP3 (status&update)

Outline Cluster Operations Tests Todo A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Boards@CNAF A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Cluster@CNAF (22 nodi!) Nodo del cluster X86_64 ARMv7 ARMv8 Xeon Atom Pentium Tegra K1 Q2/2014 Tegra X1 Q2/2015 Broadwell Q1/2015 14nm Silvermont Q3/2013 22nm Airmont Q1/2015 14nm <2.8 HS06/W 4 core 10W 28 HS06 2.8 HS06/W 4 core 15W 20/28 HS06 D-1540 8 core 90 W 151 HS06 C2750 8 core 25W 55 HS06 N3700 4 core 7W 28 HS06 1.89 HS06/W 2.20 HS06/W 4 HS06/W A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Cluster low-power (operations) CONFIGURATION Ansible MONITORING Telegraf/InfluDB,Grafana TEST SUITE Phoronix A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Osservazioni sull’HW lowpower CPU ARM deludente dopo entusiasmo iniziale (solo Nvidia K1/X1…) Intel sul low-power ha recuperato il gap su ARM (vedi Pentium N3700) Intel copre ogni esigenza per cluster da laboratorio (da Pentium a Xeon-D) Intel (tutto a parte Pentium) permette di utilizzare schede di rete a bassa latenza Pentium N3700 conveniente come consumi, prezzo per board e ratio performance/consumo Simulazioni tecnico-economiche hanno senso solo tra CPU Intel (in un mondo ideale per un datacenter sarebbe conveniente un economico Pentium N3700!!!)  no ECC, no multi PSU, no PCIe, no AVX2, etc. A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Il marketing Intel fa di tutto per complicare le cose… E.G. Core-M hanno cambiato nome da Skylake a Kaby Lake (ora si chiamano di nuovo Core i5, Core i7) A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Tegra X1 vs K1 SORPRESA !!!! X1 con CPU piu’ lenta (1.7Ghz vs 2.2GHz) X1 ha interconnessioni ethernet 1GB con bridge USB !!! è orientata al mondo automotive/imaging non HPC installata scheda Planet 10Gb/s (ricompilato driver) X1 sui test condotti (PI, Primes, CT reconstruction, staucc) fino ad ora non ci ha impressionato A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Tegra X1 vs K1 K1 2.2GHz, X1 1.7GHz GPU very similar with the CT application

Benchmarks Risultati ed osservazioni in Google Drive Sorgenti in github A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

LHC offline benchmarks A.Falabella LHCb HEPSPEC06 Pentium N3700 16GB 130€ !!! = COSA f2f - 3/11/2016

LHC online benchmarks LHCb event building M.Manzali LHCb event building Sw designed to simulate the event building on a InfiniBand based network D-1540@COSA vs E5- 2600@Tier1 Same performances (not shown) D-1540 requires a third of the power consumption of the E5-2600 A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Implementation of space-aware stochastic simulator on low-power architectures. E.Corni L.Morganti Implementig of a variant of a membrane system, called dynamical probabilistic P systems (DPPs), in which probabilities are associated with the rules , and such values vary during the evolution of the system according to a prescribed strategy. Code Implementations: Sequential MPI CUDA Lucia Morganti – INFN-CNAF COSA f2f - 18/05/2015

Storage benchmarks Test DAS (Direct Attached Storage) di HDD/SDD/eNVE Test file system distribuiti A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Storage (test DAS) WRITE (dd) READ(dd) XEOND WRITE/READ A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

Preliminary distr. FS tests hadoop jar hadoop-mapreduce-client-jobclient-2.7.2-tests.jar TestDFSIO -read -nrFiles 10 -fileSize 1000MB hadoop jar hadoop-mapreduce-client-jobclient-2.7.2-tests.jar TestDFSIO -write -nrFiles 10 -fileSize 1000MB ----- TestDFSIO ----- : write Number of files: 10 Total MBytes processed: 10000.0 Throughput mb/sec: 20.2 Average IO rate mb/sec: 20.3 IO rate std deviation: 1.75 Test exec time sec: 80.8 ----- TestDFSIO ----- : read Throughput mb/sec: 68.9 Average IO rate mb/sec: 121.2 IO rate std deviation: 2.7 Test exec time sec: 44.7 Distributed FS to test: HDFS (installed) 10 Intel nodes BEEGFS (installed, to reinstall) LUSTRE (to install ???) HDFS&BEEGFS convivono bene assieme

Network latency 10Gb/s for X1 La network latency è alta per tutti (IB < 2micros) Intel meglio di ARM X1 molto peggio di K1!!! Installata NIC 10Gb/s (latency <100micross) COSA f2f - 3/11/2016

Not only CUDA (but not OpenCl) AMD HIP U A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016

TODO 2017 Previsione attività 2017 al CNAF Continuazione porting applicazioni e benchmarking nuove architetture low power Benchmarking XEON PHI (acquisto a settembre 2016 già finanziato) Benchmarking GPU AMD HIP Benchmarking GPU Pascal (acquisto 1H 2017  finanziato) Benchmarking fabric OMNIPATH ( finanziato) A.Ferraro – INFN-CNAF COSA f2f - 3/11/2016