COSA: Computing on SoC Architecture D. Cesini – INFN-CNAF – CSNV – 30/09/2014 - Ferrara.

Slides:



Advertisements
Presentazioni simili
E835 & Hera-B Concezio Pisa, 21/12/2004. E835 (aka Jet-FNAL) timeline dell'esperimento –Presa dati conclusa nel Alcune analisi tuttora in corso.
Advertisements

Cluster openMosix Linux Day ’04 Caserta Ing. Diego Bovenzi.
Gruppo di Lavoro CSN1 sulla Valutazione Chiefari,Diemoz,Dosselli,Vercesi.
MAIS WP5 – Architectures Luca Negri Politecnico di Milano Roma – novembre 05.
IL PATRIMONIO DI DATI - LE BASI DI DATI. Il patrimonio dei dati Il valore del patrimonio di dati: –Capacità di rispondere alle esigenze informative di.
P. Capiluppi Organizzazione del Software & Computing CMS Italia I Workshop CMS Italia del Computing & Software Roma Novembre 2001.
1 Riunione del 29 Marzo 2007 IL PROGETTO SCoPE Prof. Guido Russo I lavori Le apparecchiature Il portale.
Future Astronomical Software Environment
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
Supercalcolo al CILEA: risorse e opportunità CAPI /11/2005 Dr. Claudio Arlandini, PhD HPC System Administrator.
LNL CMS M.Biasotto, Firenze, 22 maggio Hardware e tools di installazione Massimo Biasotto INFN – Lab. Naz. di Legnaro.
Il supercalcolo fai-da-te
FESR Consorzio COMETA Giuseppe Andronico Industry Day Catania, 30 Giugno 2011 IaaS, PaaS e SaaS: cosa significano per le aziende.
Manutenzioni e Mezzi di Calcolo Paolo Morettini – INFN Genova Valerio Vercesi – INFN Pavia CSN1 - Catania Settembre 2002.
AFS Working Group R.Gomezel CCRWS Verso la sfida di LHC Otranto (Lecce), 6-9 Giugno 2006.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Calcolo LHC - F. Ferroni, P. Lubrano, M. SozziCSN1 - Catania Calcolo LHC 2003 (F. Ferroni, P. Lubrano, M. Sozzi)
Calcolo ad alte prestazioni: situazione e prospettive Gianluigi Bodo INAF Osservatorio Astronomico di Torino.
Istituto Nazionale di Fisica Nucleare La Biodola, Isola d’Elba, 6-9 maggio 2002 AFS: Status Report WS CCR R.Gomezel Workshop sulle problematiche.
Workshop CCR Otranto - giugno 2006 Gruppo storage CCR Status Report Alessandro Brunengo.
15/05/2007CSN1 Roma Presidenza1 KLOE: referee* KLOE Calcolo (referee calcolo) KLOE2 Tabelle con proposte di assegnazione * M. Livan, P. Paolucci, P.C.
PcClusters, ALBERT100 e Grid Roberto Alfieri Parma,
1 Calcolo e software G. Bagliesi 23/3/01 Riassunto riunione calcolo Bologna 19/3/01 B/tau : futuri miniworkshop.
Report HEPiX Spring meeting 2002 Workshop sulle problematiche di calcolo e reti nell'INFN 6-9 Maggio 2002 La Biodola - Isola d'Elba Silvia Arezzini.
FITEL Telecomunicazioni Soluzioni per tecnologie informatiche e telecomunicazioni.
GPU - Graphics Processing Unit Corso di Sistemi Paralleli Luigi La Torre Giugno 2012.
MS - NA62 TDAQ INFN – Settembre 2011 TDAQ in generale Distribuzione clock/trigger: progetto definito, moduli finali in arrivo (?), installazione prevista.
SEMINARI CAMO 2003 LA SIMULAZIONE NUMERICA COMPIE 50 ANNI
DRAFT Partner C.R.M. Processo di Vendita
Alessandro Venturini* e Stefano Ottani ISOF – CNR Area della Ricerca di Bologna.
+ COSA (COmputing on Soc Architectures ) Michele Michelotto – INFN Padova.
Laboratorio
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
Workshop CCR e INFN-GRID Hotel Cala di Lepre Palau, maggio 2009 Il futuro di INFGRID nell'era IGI:
+ COSA (COmputing on Soc Architectures ) Tommaso Boccali – INFN Pisa.
La Task Force Gestione Operativa (Operations) L. Gaido, INFN Torino.
Il progetto ARTISAN Angelo Frascella – ENEA (8 Luglio 2011)
Riunione PRIN STOA - Bologna - 18 Giugno 2014 Testbed del T2 distribuito Napoli-Roma Dr. Silvio Pardi INFN-Napoli Riunione PRIN STOA – Bologna 18 Giugno.
XzelCloud Cloud Advanced Services on large-scale Federated Infrastructures Call ICT-7 (23 Apr ‘14) Marco Verlato (INFN-PD)
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
Test di porting su architetture SoC F. Pantaleo for T. Boccali.
CCR – 9 Settembre 2014 R.Fantechi, M.Gulmini, S.Parlati.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
Claudio Grandi Comunicazioni Claudio Grandi INFN Bologna.
Gruppo Multimedia CCR “Report” Stefano Zani (INFN CNAF) Alfredo Pagano (INFN CNAF) Commissione Calcolo e Reti Roma, Dicembre 2006.
FESR Trinacria Grid Virtual Laboratory Porous Fluid Dynamics Analyzer Supporter : Salvatore Scifo Affiliation : TRIGRID Second TriGrid Checkpoint.
Referaggio sigla CALCOLO D. Bonacorsi, G. Carlino, P. Morettini CCR – Roma 9 Settembre 2014.
A.O.B.. Referee INFN L’INFN ci ha assegnato 2 referee: – Donatella Lucchesi (INFN PD) – Francesco Giacomini (CNAF) Inseriti in CSN1 Non chiarissima la.
+ Eventi ICT Eventi ICT Work Programme 2016/2017 Evento lancio APRE Roma 29/09 semestre/evento-di-lancio-ict /
Obiettivi «6 mesi» - Unità di Pisa. Persone coinvolte Gianluca Lamanna Gianluca Lamanna – Coordinatore, algoritmi di pattern recognition Marco Sozzi Marco.
HARDWARE (2). MEMORIE Due classi di memoria MEMORIA CENTRALE –media capacità - ottima velocità MEMORIA DI MASSA elevata capacità - bassa velocità.
Il progetto ARTISAN Alessandro Canepa - Piacenza Biella - 12 Luglio 2012.
Referaggio delle richieste dei gruppi di lavoro G. Ambrosi, R. Fantechi, M. Gulmini, O. Pinazza Commissione Calcolo e Reti, LNF, 5-7 Ottobre 2011.
Progetto iSCSI Report alla CCR 12-13/12/2006 Alessandro Tirel – Sezione di Trieste.
Attività e richieste gruppo Bologna A. Margiotta 25/7/2014.
1 ALICE I ITER2 DI ALICE IN ITALIA Bologna, 6 marzo 2007 M. Masera
International Research Networking ll progetto ASTRA per ricostruzione di strumenti musicali antichi con GRID su GEANT2 e EUMEDCONNECT Domenico Vicinanza.
Progetti CCR Referaggio progetti della Commissione Calcolo e RetiReferaggio progetti della Commissione Calcolo e Reti Referees: Tommaso Boccali, Alessandro.
P. Morettini. Organizzazione della CCR Le principali attività della CCR consistono da un lato nell’assegnazione di fondi per le infrastrutture di rete.
Attività Gruppo Virtualizzazione Andrea Chierici CNAF CCR
I progetti di ricerca e le attività di consulenza nell'ambito delle filiere produttive UTT-PMI Piero De Sabbata 30 settembre 2013.
Silvia Arezzini 2 luglio 2014 Consiglio di Sezione per Preventivi.
Aggiornamento Netgroup R.Gomezel Commissione Calcolo e Reti LNF 29/09/ /10/2009.
Gruppo Server Commissione Calcolo e Reti 15 Marzo 2006.
M. Citterio CDS Milano – 9 Luglio 2014 Servizio di Elettronica 1.Attivita’ previste per il Strumentazione/Attrezzature, capacita’ di calcolo e software.
Status Acceleratore e budget. Status Nell’ Ottobre 2010 abbiamo terminato la stesura di un nuovo “CDR2” pubblicato su:
PROGETTO Infra infn-grid Maria Cristina Vistoli INFN – CNAF.
EU-IndiaGrid Project Joining European and Indian grids for escience
Alberto Masoni EU-IndiaGrid Project Manager INFN Sezione di Cagliari
HEPMARK2 Michele Michelotto.
Transcript della presentazione:

COSA: Computing on SoC Architecture D. Cesini – INFN-CNAF – CSNV – 30/09/ Ferrara

Proposta di progetto per CSN5 COSA: Computing On SOC Architecture DURATA: 2 anni da Gennaio 2015 SEDI: 7 INFN –CNAF, PI, PD, ROMA1, FE, PR, LNL BUDGET RICHIESTO:~70kEuro Anno I 30/09/ COSA Project – D. Cesini – Ferrara CSNV

Obiettivi Acquisizione know-how –Porting e benchmarking su System on Chip low power –Gestione di sistemi SoC in ambiente Linux –Benchmarking di architetture ibride Unificazione delle attività INFN di testing HW –Continuazione di COKA Porting su acceleratori tradizionali (GPU/MIC) –Continuazione di HEPMARK Benchmarking di x86 Studio di interconnessioni dedicate toroidali a bassa latenza tramite sistemi ARM+FPGA 3 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

System on Chip Low Power 4 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

System on Chip Low Power 530/09/2014COSA Project – D. Cesini – Ferrara CSNV

NON stiamo chiaramente pensando di comperare 1000 iPhone e usarli per fare lattice QCD Vogliamo usare questi processori in configurazione standard –rack di computer in centri di calcolo attrezzati –in ambiente Linux –per applicazioni di interesse INFN Cluster di SoC Development Board 6 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Motivazioni Economica1: Electric Bill 7 Source: EUROSTAT Eur/100kWh 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Motivazione Economica2: Commodity Wave Sono finiti i tempi in cui il supercalcolo si progettava le sue CPU Competitività economica della “commodity wave” utilizzando componenti –Prodotte in maggiore quantità, e quindi con minori costi industriali –Soggette a maggiore concorrenza –In un mercato in fase espansiva 8 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

HPC Trends /09/2014COSA Project – D. Cesini – Ferrara CSNV

Shipment 10 Miliardi! ARM: architettura dominante telefoni e tablet X86: architettura dominante PC 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

La previsione MONTBLANC 11 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Un solo Chip…..CPU + GPU  Calcolo parallelo “HPC” ARM ma non solo La maggior parte della potenza del SoC è nella GPU La vera sfida è riuscire a sfruttare la GPU per il calcolo in applicazioni di interesse Anche Intel (Atom), AMD (Kaveri), IBM (Power/Openpower) sono della partita 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Applicazioni Area teorica (PR, FE) –Applicazioni parallele generalmente girate in ambienti HPC standard fluido-dinamica basata su modelli Lattice Boltzmann simulazione Monte Carlo di sistemi di Spin-Glass Simulazioni di Lattice Quantum CromoDynamics Area sperimentale (PI, PD, CNAF) –Applicazioni per High Level Trigger di esperimenti LHC –Montecarlo e analisi di esperimenti LHC –Applicazioni che necessitano di sistemi portatili Tomografia assiale Reti neurali (RM1) –codice DPSNN-STDP 13 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

CPU ARM: Risultati da paper CHEP di CMS 14 ARM più lento di un fattore 3-4 in assoluto ARM migliore di un fattore 3-5 relativamente alla potenza usata 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

HEPMARK –Benchmarking di architetture x86 tradizionali con applicazioni HEP non paralelle HEPSPEC COKA –Benchmarking e porting su acceleratori GPU/MIC –Applicazioni parallele Solo SoC? 15 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Approccio coerente e controllato per il benchmarking dell’HW Confronto delle varie piattaforme più diretto A fattor comune esperienza ed effort economico Convergenza di attività 16 Convergenza delle attività sui SoC low power con le sigle HEPMARK e COKA all’interno del progetto COSA 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Test preliminari su Tegra-K1 COKA Use Case – Lattice Boltzmann 17 Run su SoC Tesla K1 al CNAF e Fe: 15 GFLOPS 12GB/s P e < 10 Watt o Porting del codice quasi immediato o Performance e ottimizzazioni ancora da investigare o COKA fornisce una base consolidata di applicazini reali per il benchmarking 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Investigazione delle esigenze del networking Molte unità di calcolo singolarmente poco potenti Requirement in termini di: –Latenza –Banda –Scalabilità Trovare la soluzione tecnologica migliore –Costi –Consumi Interconnessioni tra le schede low power 18 - Soluzioni commerciali esistenti (i.e. eth) - Prototipazione di soluzioni dedicate 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Interconnesioni toroidali 3D 19 Configurabilità ed espandibilità ­architettura ARM a 32 bit oggi ­ 64 bit nel futuro prossimo Sistemi FPGA-based che integrano:  SoC multicore ARM  transceiver ad alta velocità Sviluppo volto a realizzare un sistema di interconnessione dedicato a SoC scalabile ed a bassa latenza 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

I Cluster di COSA 20 CNAF ROMA1 PD 4 board ARM+FPGA based + 1 server 16 board ARM+FPGA based + 4 server ex cluster COKA (2 server) + nuove acquisizioni (1 server) (server = cpu + acceleratori) Anno I + ~10 nuove board ~25 board SoC Based (GFLOPS nominali di 2 server tradizionali con GPU) Anno I Anno II Anno I Anno II Ex cluster HEPMARK + nuove acquisizioni (~ 3 server) + nuove acquisizione (~ 3 server) Anno I Anno II 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Call H2020-LEIT-ICT4 21 LEIT-ICT Topics  New generation of components and systems  Advanced Computing o Customized and low-power computing–ICT4  Future Internet 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

ICT4.aICT4.bICT4.c Research&Innovation ActionsStimulate broad adoption ActionsSupport Actions 37M€17M€3M€ One or both the following themes: ● Integration of HW&SW components into fully working prototypes of low-power micro-servers. Specific emphasis is given on low-power, low-cost, high- density, secure, reliable, scalable small form-factor datacentres ("datacentre-in-a-box") [5-8M€] ● New programming approaches to exploit the full potential of the next generations of computing systems based on heterogeneous parallel architectures (beyond performance, optimisation should include energy efficiency). Proposals requesting a small contribution are expected. [2-4M€] One or both the following themes: ● Establish reference architectures and platforms for customised low-power heterogeneous computing systems delivering high performance functionality. [2-4M€] ● Bring together all actors along the value chain to customise and use advanced low power computing systems in cyber-physical systems. Clustered in large scale projects driven by networks of European centres of excellence to achieve critical mass and to better exploit EU- added value. [5-8M€] Support actions for cross- sectorial platform- building, for clustering of related research projects, for structuring the European academic and industrial research communities, for dissemination of programme achievements and impact analysis [2-4M€] Expected impact: ● Strengthening the technology competences of European suppliers and the academic community. ● Reduction of energy consumption of servers by 2 orders of magnitude as compared to state of the art in ● Double the productivity in efficiently programming and maintaining advanced computing systems powering cyber-physical systems as compared to state of the art in programming embedded systems in ● Increase the adoption of form-factor data-centres and heterogeneous highly parallel computing systems. ● Higher involvement of SMEs, both on the supply and the demand-side. ● Increased adoption of concurrency in applications across all sectors; higher degree of parallelism in applications LEIT -> ICT -> Advanced Computing -> ICT-4 ( Customised and low power computing )

Il “cluster”

Attività & WP WP1: Coordinamento WP2: Technology Tracking e Benchmarking WP3: Implementazione del prototipo al CNAF WP4: Sviluppo di interconnessioni di rete dedicate WP5: Application Porting WP6: Technology Transfer e Dissemination 24 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Sedi Coinvolte & Personale 25 SedePersonaleFTEWP ROMA1 Alessandro Lonardo 0.2 Pier Stanislao Paolucci 0.2 Piero Vicini 0.1 Assegnista ,2,4,5 CNAF Daniele Cesini 0.5 Andrea Ferraro 0.4 Lucia Morganti 0.5 Elisabetta Ronchieri 0.3 Andrea Chierici 0.2 Stefano Dal Pra 0.2 Luca Dell’Agnello ,2,3,5,6 FE Fabio Schifano 0.5FTE Enrico Calore 0.6FTE 1.15 PD Mauro Morandin 0.1 Michele Michelotto 0.65 Lisa Zangrando 0.2 Alberto Crescente 0.3 Roberto Ferrari ,5,6 PR Roberto Alfieri 0.5 Francesco Di Renzo 0.2 Roberto De Pietri 0.2 Roberto Covati ,5 PI Tommaso Boccali 0.2 Claudio Bonati 0.1 Silvia Arezzini 0.15 Andrea Carboni 0.20 Alberto Ciampa 0.15 Simone Coscetti ,5 LNLGaetano Maron0.42,5 TOTALE FTE /09/2014

26 CNAFFEPDPRROMA1PI LNL TOT INV. WP1 INV WP INV. WP3 14 CONS WP3 11 INV. WP4 15 INV. WP5 10 LICENZE SW WP5 2.5 CONS. WP4 22 CONS. WP6 22 TOT INV./CONS MISSIONI TOT Budget Anno I INVENTARIABILE: 5 kEuro al CNAF per le prime board su cui eseguire test e per l’acquisto di board basate su nuove architetture mentre la tecnologia evolve 14 kEuro al CNAF per finanziare l’acquisto del cluster SoC euro i.e. a board ~ 25 unità 10 kEuro per l’acquisto di server tradizionali a PD per HEPMARK 10kEuro a FE per continuazione COKA (GPU&MIC) 15kEuro a ROMA1 per 4 sistemi FPGA di sviluppo ed un server, entrambi dal costo unitario di circa 3 keuro 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Budget Anno II 27 CNAFFEPDPRROMA1PI LNL TOT INV./CONS. WP1 INV. WP INV. WP3 55 INV. WP4 45 CONSUMO WP4 22 INV./CONS. WP5 10 CONSUMO WP6 22 TOT INV./CONS Missioni TOT INVENTARIABILE: 45 kEuro ROMA1 per acquisire ulteriori 12 schede di sviluppo FPGA e ulteriori 3 server. 10 kEuro per l’acquisto di server tradizionali a PD per HEPMARK 10kEuro a FE per continuazione COKA (GPU&MIC) 5 kEuro al CNAF nuove unità nel cluster 5kEuro al CNAF per nuove board da testare mentre la tecnologia evolve 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Backup 28 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Post-PC Era 29 HEP! 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

HPC Trends 30 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

HPC Trends /09/2014COSA Project – D. Cesini – Ferrara CSNV

Esiste anche qualcosa di ingegnerizzato … 32 Boston Viridis Boston Viridis, DELL Copper, HP MoonShot In 2U: 48 SoC ARMv7(1.4 GHz) 4-core, each with 4 GB RAM 8x10Gbit/s internal networking; 24x DISK slots Under 300W under load ~ 20kEuro (?) Costo ancora troppo alto per noi A cluster in a single box.. 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Porting completo dell’ambiente operativo di CMS su ARM –Simulazione, ricostruzione, analisi Come si fa? Meno complicato del previsto: –Il SW di CMS e’ solo open source: ci sono i sorgenti, basta ricompilare (beh, non cosi’ facile) –Su questi sistemi e’ presente un ambiente Linux completo, con lo stesso compilatore usato su sistemi x86 Cosa ci si aspetta da queste CPU? –Che vadano piu’ piano (Events/sec per esempio) –Che siano pero’ migliori se la metrica e’ Events/sec/W Test di CMS (Pisa + Princeton + CERN) 33 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Affiancare alle CPU delle GPU sempre piu’ potenti –sono sullo stesso silicio delle CPU e’ un SoC Le stesse dei desktop ma… –A basso consumo ~ 50 volte meno delle schede desktop –A basso costo non possono costare più del cellulare le hai anche se non le vuoi, tanto vale usarle –Potenza ridotta ~ 5-10 volte meno –Meno memoria interna SoC per HPC? 34 La maggior parte della potenza del SoC è nella GPU La vera sfida è riuscire a sfruttare la GPU per il calcolo in applicazione di interesse 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Quattro architetture in competizione –SoC ARMv7 based (32bit): Nvidia Tegra, Qualcomm Snapdragon, Samsung Exynos, Freescale imx6, TI OMAP/Keystone II, Mediatek MT659x, Allwinner A80, etc. –SoC ARMv8 based (64bit): AppliedMicro X-Gene, Qualcomm Snapdragon 805/810, Samsung Exynos 5433, Mediatek MT6732/MT6752, etc. SoC x86 based (64bit): Intel Avoton C2750, etc. SoC HSA based (64bit): AMD Kaveri, etc. Scenario Complesso 35 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Calcolo “HPC” –Test di architetture per macchine di nuova generazione –Sviluppo di interconnessioni dedicate (“alla APE”) per sitemi di questo tipo Molti nodi poco potenti Calcolo HTC –Test di architetture e di possibile utilizzo di questo tipo di calcolo per (una frazione) di centri di calcolo INFN –Risparmio annuale di corrente elettrica facilmente stimabile in Meur/anno Knowledge base INFN –Sul porting di applicazioni in processori di tipo SoC e architetture ibride con acceleratori più tradizionali –Misurazione delle performance tramite metriche complesse Linee di sviluppo 36 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

X-Ray Tomography (CH-NET/UniBo) –sistemi portatili di X-ray e TAC per beni culturali. Difficile spostare una tempio romano in un laboratorio INFN) –post processing e CAD avviene in un momento successivo per l’impossibilita’ di avere potenza di calcolo in loco Use case: CH-NET 37 CT analysis of an Ancient Greek Bronze Head 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

HEPMARK2 in CSN5 nel 2012 e 2013 ed esteso al 2014 in accordo con i referee HEPMARK2 continua le misure e le attività di technology tracking dei processori per Worker Node per esperimenti HEP iniziate nella sigla HEPMARK Collaborazione con il gruppo della comunità HEPiX –RAL, CERN, GridKA FZK Collaborazione con progetto COKA Studio delle prestazioni relative ai consumi HS06 per watt, su architetture ATOM Intel o equivalenti AMD Studio delle prestazioni su architetture non x86 come per esempio ARM HEPMARK 38 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

COKA 39 kernel rilevanti "propagate" e "collide" riscritti in OpenCL, CUDA e C. Con acceleratori, se opportunamente programmati, un fattore 7-10 meglio delle CPU classiche. Nvidia Kepler GPU risulta migliore dei sistemi Xeon-PHI /09/2014COSA Project – D. Cesini – Ferrara CSNV

LEIT-ICT4 4030/09/2014COSA Project – D. Cesini – Ferrara CSNV

Coordinamento del progetto –verifica dei suoi progressi –report periodici Acquisti HW –Gestione Centralizzata a CNAF e ROMA1 –hardware spedito ad altre sedi se necessario per questioni Oraganizzazione meeting periodici, sia face to face che telefonici –Tool necessari Agenda, phone conference system, docs, issue traker, etc… Eventualmente preparazione del futuro progetto europeo o regionale qualora si ritenga che esistono le condizioni e le motivazioni –identificazione partenariato –Sviluppo proposal Sedi: CNAF, ROMA1 WP /09/2014COSA Project – D. Cesini – Ferrara CSNV

Technology tracking per lo studio dell’evoluzione delle tecnologie low power –SoC commerciali e in produzione da parte di imprese private –SoC da progetti di ricerca, prototipi o in fase di progettazione (es. in EUROSERVER) –Interconnessioni disponibili (PCIe, RapidIO, AMBA, eth) Benchmarking sulle piattaforme SoC –micro benchmark, sviluppati ad hoc o reperiti dalla comunità –applicazioni e test suite standard (i.e. HEPSPEC, RODINIA, SHOC, HPL, etc) –applicazioni reali di interesse dell’ente e comunemente usate in letteratura come riferimento delle prestazioni di architetture computazionali Indicazioni necessarie alla scelta della piattaforma su cui basare i cluster di COSA Continuazione delle attività HEPMARK per il benchmarking delle architetture tradizionali –termine di paragone ai benchmark su architetture low power Studio e valutazione delle tecnologie software, compilatori e paradigmi di programmazioni, disponibili su SoC low-power Sedi coinvolte: TUTTE WP /09/2014COSA Project – D. Cesini – Ferrara CSNV

Implementazione del prototipo di cluster di schede SoC low power al CNAF –Aperto agli utenti Equiparabile ad un cluster minimale tradizionale con acceleratori di ultima generazione –due nodi con GPU Nvidia K40 ~8.4TFlops (SP) ~ 800W –il SoC Nvidia K1 ~ 326 Gflops ~ 11W Configurazione e mantenimento tool software –Compilatori –Librerie –Framework di sviluppo –Batch system Implementazione software di monitoraggio delle principali metriche di interesse del progetto Il WP3 dipende dal WP2 fino al PM9 per quanto riguarda la decisione della piattaforma SoC su cui basare il cluster al CNAF Dal secondo aggiornamento con ulteriori unità di calcolo –in base ai risultati emersi dal WP2 –nuove architetture low power Sedi coinvolte: CNAF WP schede ~ 275 W 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Implementazione del prototipo di cluster a ROMA1 –Chiuso agli utenti Studio delle architetture di rete per sistemi SoC tramite ARM+FPGA Primo anno –4 kit di sviluppo + un server prestazioni del sistema di interconnessione fornito sui sistemi di sviluppo, i.e Gigabit Ethernet test sintetici sia a livello socket TCP/IP sia a livello di libreria message passing MPI Con WP5 studio delle prestazioni della applicazione DPSNN multi-nodo –indicazioni utili per lo sviluppo di una rete di comunicazione dedicata Dal secondo semestre del primo anno –Espansione a 16 nodi per scalabilità –Progettazione e realizzazione architettura di interconnessione dedicata a bassa latenza Sedi coinvolte: ROMA1 WP /09/2014COSA Project – D. Cesini – Ferrara CSNV

Porting su SoC a basso consumo delle applicazioni di interesse Valutazione performance con metriche complesse –performance/watt, performance/eur, performance/porting_effort Confronto con risultati su sistemi HPC di punta oggi disponibili basati su acceleratori GPU e MIC –Continuazione di COKA Area Teorica (Parma e Ferrara) –Fluido-dinamica basata su modelli Lattice Boltzmann (Ferrara) –Simulazione Monte Carlo di sistemi di Spin-Glass (Ferrara) –PDE iperboliche per gravità numerica (Parma) Area Sperimentale (Pisa, PD, CNAF) –High Level Trigger Applications –CMS Swstack –Tomografia assiale da CH-NET Area reti neurali (ROMA1) –Codice DPSNN-STDP WP5 45 Sedi coinvolte: TUTTE 30/09/2014COSA Project – D. Cesini – Ferrara CSNV

Disseminazione –materiale di training per nuovi paradigmi di calcolo per sistemi eterogenei CUDA, OpenCL,OpenACC, etc.. –Inserimenti di tematiche di interesse in scuole INFN su calcolo ESC a Bertinoro –Promozione di eventi di disseminazione per il personale INFN Sedi coinvolte: PD, CNAF, ROMA1 WP /09/2014COSA Project – D. Cesini – Ferrara CSNV

47 COSA Project – D. Cesini – Ferrara CSNV Budget Anno I 30/09/2014

X-Ray Tomography (CH-NET/UniBo) – sistemi portatili di X-ray e TAC per beni culturali. Difficile spostare un tempio romano in un laboratorio INFN – post processing e CAD avviene in un momento successivo per l’impossibilita’ di avere potenza di calcolo in loco Use case: CH-NET 48 CT analysis of an Ancient Greek Bronze Head 30/09/2014COSA Project – D. Cesini – Ferrara CSNV