Test di porting su architetture SoC F. Pantaleo for T. Boccali.

Slides:



Advertisements
Presentazioni simili
Idee sullHiggs Fabrizio Palla Firenze 16 gennaio 2003.
Advertisements

Io e la matematica Elena Gardenal.
Laboratori Nazionali di Frascati INFN
7/10/2008Paolo Checchia riunione CMS Pd1 CMS Esperimento a LHC la macchina pp a più alta energia mai costruita al mondo: 7 TeV + 7 TeV (si inizia a 5+5)
INTRODUZIONE AI SISTEMI OPERATIVI
Introduzione al calcolo parallelo SISTEMI INFORMATIVI AZIENDALI Pierpaolo Guerra Anno accademico 2009/2010.
A study of low mass Higgs boson decay H → 2μ2e with the CMS experiment
Roberto Chierici2 Il bosone di Higgs nello SM La particella mancante nel Modello Standard, che nella sua versione minimale non puo spiegare perche le.
1 La farm di ATLAS-Napoli 1 Gb/s 7 nodi con 2 CPU PIII a 1 GH, RAM 512 MB, 2 schede di rete a 100 Mb/s. Server con 2 CPU PIII a 1 GH, RAM 1 GB, 2 schede.
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
UNIVERSITA DEGLI STUDI DI LECCE FACOLTA DI SCIENZE MM.FF.NN CORSO DI LAUREA IN FISICA TESI DI LAUREA ANALISI DEL FLUSSO COMBINATO DEI PIONI INDOTTI DA.
Paolo Bagnaia - Il top a CDF1 CDF è un rivelatore al Collider antiprotone-protone di Fermilab; Fermilab opera a s = 1.8 TeV nel CM antiprotone-protone.
La gestione dell'I/O Architettura degli elaboratori 1 - A. Memo La gestione dellI/O 4Prestazioni e generalità 4.1Modelli di funzionamento 4.2Dischi.
Supercalcolo al CILEA: risorse e opportunità CAPI /11/2005 Dr. Claudio Arlandini, PhD HPC System Administrator.
UNIVERSITÀ DEGLI STUDI DI LECCE Facoltà di Scienze MM.FF.NN. Corso di laurea in FISICA Caratteristiche Volt-Amperometriche degli elettrodi dei rivelatori.
Fondamenti di Informatica1 Software di base Tra il linguaggio macchina (basso livello) e i linguaggi evoluti (alto livello) esiste uno strato di software.
Architettura di un calcolatore
Software per il b-tagging Gabriele Segneri Firenze, 16 Gennaio 2003.
Stato del b tagging Stato del b tagging Alessia Tricomi Università and INFN Catania TISB – Firenze Gennaio 2003.
16/1/2003TISB1 FAMOS: quel (poco) che ci ho capito io Tommaso Boccali – SNS Pisa.
H ZZ (*) e + e D. Giordano CMS TISB. TISB, Firenze 15-16/01/03D. Giordano2 Il bosone di Higgs ad LHC gluon fusion ---dominante ZZ e WW fusion bremsstrahlung.
Studio preliminare della produzione Z+b all'esperimento ATLAS ad LHC 1 30/03/2005 Studio preliminare della produzione Z+b nellesperimento ATLAS ad LHC.
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
Case study Maiora srl.
Programmazione ad oggetti per la simulazione numerica di strutture su grande scala dellUniverso di Daniele Giunchi Relatore: Prof. Antonio Messina.
Università Politecnica delle Marche
GPU, un microprocessore Un progetto che avrebbe dovuto cambiare il mondo e unintroduzione in un campo di ricerca davvero interessante...
Raccontiamo un esperienza VISITA ALLA MOSTRA-GIOCO GIOCHIAMO IN SICUREZZA.
Ricerca dellHiggs del Modello Standard nel canale ttH con CMS Massimiliano Chiorboli Università di Catania.
Works in progress.  Semplificazione e maggiore efficienza della gestione  Risparmio (nel medio periodo)  Riallocazione delle risorse (hardware e timesheet)
Masterclass 2011 L’esercizio Z ad ATLAS Lecce, 22 marzo 2011.
Ricerca dei bosoni di Higgs a LHC Riccardo Ranieri INFN e Università di Firenze XVI Ciclo di Incontri di Fisica delle Alte Energie Torino, Aprile.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
27/05/2004C.Bigongiari & M.Pieraccini INFN Workshop Castiadas (CA) 1 Stato e Prospettive del Calcolo di MAGIC M ajor A tmospheric G amma I maging C herenkov.
Dottorato in Fisica XX Ciclo Padova 7 Giugno 2005 Ezio Torassa Ricerca dell'Higgs a LEP II MHMH E CM =206 GeV Al crescere di  s diventano accessibili.
Informatica Generale Marzia Buscemi
EVOLUZIONE DEL PC Legge di Moore: La potenza dei calcolatori raddoppia ogni 18 mesi. Inizi anni 80 (Personal Computer IBM AT) Architettura 16 bit interna,
Dottorato in Fisica XXV Ciclo Padova 19 Aprile 2011 Ezio Torassa Corso avanzato di fisica del Modello Standard e di nuova fisica alla scala elettrodebole.
Ricerca di Quark Top Scalare con CMS ad LHC Gabriele Segneri Firenze, 15 Gennaio 2003.
20/4/2006S. Rosati - IFAE1 Ricerche del Bosone di Higgs del Modello Standard ad LHC Stefano Rosati INFN – Roma 1.
ATLAS Fabrizio Ferro – Tesi di Dottorato1 Università degli Studi di Genova Dottorato di Ricerca in Fisica XIV Ciclo Fabrizio Ferro Reconstruction.
Dottorato in Fisica XXV Ciclo Padova 12 Aprile 2011 Ezio Torassa Corso avanzato di fisica del Modello Standard e di nuova fisica alla scala elettrodebole.
Windows 2000 WG Status Report Gian Piero Siroli, Dip. di Fisica, Univ. di Bologna e INFN La Biodola 2002.
Paolo Bagnaia - L'Higgs a LHC1 Il bosone di Higgs a LHC.
M.Biasotto, Bologna, 28 giugno 2004 M.Biasotto, Bologna, 28 giugno LNL CMS T2 Legnaro Stato attuale e richieste 2004/2005.
GPU - Graphics Processing Unit Corso di Sistemi Paralleli Luigi La Torre Giugno 2012.
Università degli Studi di Napoli “Federico II” Ottimizzazione della selezione di muoni provenienti dal decadimento dei mesoni J/ψ prodotti in collisioni.
ATLAS al SLHC ( L=10 35 cm -2 s -1 √s= 14 TeV) Cosa è stato fatto: - Giugno 2004 : creato uno Steering Group “leggero” con il compito di organizzare workshop.
Alessandro Venturini* e Stefano Ottani ISOF – CNR Area della Ricerca di Bologna.
P. Morettini 29/10/ Paolo Morettini - ATLAS Italia.
2. Il Modello Standard del Microcosmo Ricerca del Bosone di Higgs a LHC Pergola Aprile Il Modello Standard (SM) è descritto nelle 3 diapositive.
+ COSA (COmputing on Soc Architectures ) Michele Michelotto – INFN Padova.
+ COSA (COmputing on Soc Architectures ) Tommaso Boccali – INFN Pisa.
D. Martello Dip. Fisica - Lecce Sintesi piani esperimenti CSN2 CNAF 7-marzo-2007.
TESTS CON ARCHITETTURA ARM E SOFTWARE HEP Tommaso Boccali – INFN Pisa.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
Utilizzo della VO di theophys per il calcolo lattice QCD G. Andronico M. Serra L. Giusti S. Petrarca B. Taglienti.
A.O.B.. Referee INFN L’INFN ci ha assegnato 2 referee: – Donatella Lucchesi (INFN PD) – Francesco Giacomini (CNAF) Inseriti in CSN1 Non chiarissima la.
IL CALCOLO DEGLI ESPERIMENTI AD LHC DOPO LA SCOPERTA DELL’HIGGS Tommaso Boccali INFN Pisa 1.
Study of coincidences due to 40 K photons between adjacent OMs Paolo Fermani & ROMA group Catania Università di Roma «La Sapienza» – INFN Roma.
Corrente elettrica Cariche in movimento e legge di Ohm.
ATLAS Italia – Sestri Levante, 15 Giugno 2010 G. Carlino – Richieste Run Efficiency = time for physics / total time LHC Efficiency = time with colliding.
Gruppo Server Commissione Calcolo e Reti 15 Marzo 2006.
Il calcolo per l’esperimento GERDA Luciano Pandola INFN, Laboratori del Gran Sasso Riunione della CSN2, LNF Frascati, 29 Novembre 2011.
ESPERIMENTO MOLTO COMPLESSO Pierluigi Paolucci - Liceo Mercalli
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
Pisa. Xrootd Pisa e’ ora insieme a Bari il nodo centrale europeo della federazione Xrootd di CMS – Per capirci, il CERN usa questi nodi per il fallback.
COSA f2f Meeting INFN-CNAF Bologna 3/11/2016 WP3 (status&update)
Pisa.
HEPMARK2 Michele Michelotto.
Transcript della presentazione:

Test di porting su architetture SoC F. Pantaleo for T. Boccali

Outline Soprattutto tests sulla Nvidia Jetson TK1 Soprattutto tests sulla Nvidia Jetson TK1 – Qualcosa su Odroid XU Nessun real update sul SW degli esperimenti LHC Nessun real update sul SW degli esperimenti LHC – Mostro qualcosa di CHEP – Vero scoglio e’ la (non) acquistabilita’ di ARMv8 a 64 bit Ce ne e’ uno a Princeton, di recente uno al CERN Ce ne e’ uno a Princeton, di recente uno al CERN ROOT5 con ARMv7 non ha mai funzionato fino in fondo, e il ROOT team ha preferito non spendere energie per farlo funzionare ROOT5 con ARMv7 non ha mai funzionato fino in fondo, e il ROOT team ha preferito non spendere energie per farlo funzionare La cosa cambia completamente con ROOT6/ARMv8 … ma ancora non ne ho avuto uno fra le mani La cosa cambia completamente con ROOT6/ARMv8 … ma ancora non ne ho avuto uno fra le mani CMS (not official): funziona tutto al volo CMS (not official): funziona tutto al volo Tanti piccoli test di SW hand-made, reale Tanti piccoli test di SW hand-made, reale – Soprattutto codice teorico e/o generatori MC

CHEP: CMS: CMS: – ontribution/493/material/slides/0.pdf ARMv8

Atom/ARMv8 alla pari come evt/s/thread e scalabilita’

Evt/(s*W) = Evt/(J) = direttamente traducibile in Ev/$ dato il prezzo della corrente Sembrerebbe da questi numeri che Intel abbia piu’ che colmato il gap? Notare pero’ che questo X-gene1 e’ lontano dall’essere ottimizzato

NVIDIA Jetson TK1 Noi 2 GB <200 Euro Arriva equipaggiata con Ubuntu CUDA kit completo 10-15W max

Odroid XU Ubuntu GB RAM 4-core Cortex A9 5 W

Tests eseguiti Codice scalare HEP Codice scalare HEP – Generatori MC, ROOT, Analisi CMS/Higgs Codice Multi threaded teorico Codice Multi threaded teorico – Parallelizzazione codice Passarino Codice CUDA teorico Codice CUDA teorico – Claudio Bonati Intel XEON vs Intel Atom vs Nvidia K1 vs Odroid Intel XEON vs Intel Atom vs Nvidia K1 vs Odroid – Non sempre tutte le combinazioni possibili…

PYTHIA Standard test MC05 (500 eventi, pp 14 TeV, Jets e loro caratteristiche) Standard test MC05 (500 eventi, pp 14 TeV, Jets e loro caratteristiche) Suite completa di test (> 20) Suite completa di test (> 20) MacchinaReal Time 05Tutti i testsRatio 05 (X/Intel) Odroid u2 30m22.565s45m0.935s 9 Nvidia K113m41.977s 26m10.149s 2.8 IntelCore i GHz 4m32.135s 9m23.435s 1 Marvell ARMADA XP (Dell Copper) 51m1.198s 79m52.159s 8.8

ROOT Calcolo dei ROOTMarks Calcolo dei ROOTMarks MacchinaROOTMark s Ratio ROOTMarks (X/Intel) Odroid u Nvidia K IntelCore i GHz Marvell ARMADA XP (Dell Copper)

CMS Analysis test Macro per calcolare fit alla massa dell’Higgs Macro per calcolare fit alla massa dell’Higgs – dati veri dell’analisi H to bb – Macro root compilata – Comprende I/O sequenziale (~ 1 GB di root files) MacchinaZinvHRatio ZinvH(X/Intel) Odroid u2 238 sec 10.8 Nvidia K1110 sec5.0 IntelCore i GHz 22 sec1 Marvell ARMADA XP (Dell Copper) 443 sec20

Test di codice teorico Case Study: Higgs Dalitz Decay Case Study: Higgs Dalitz Decay Tesi di laurea di P. Viviani (UniTo): parallelizzazione codice NLO di Passarino Tesi di laurea di P. Viviani (UniTo): parallelizzazione codice NLO di Passarino Integrazione su spazio delle fasi, tempo scalare per integrazione: Integrazione su spazio delle fasi, tempo scalare per integrazione: – O(10 6 ) punti da integrare: mesi su CPU scalare single thread – Codice fortran, non immediatamente riscrivibile in C++

Performance Utilizzati: Utilizzati: – 2x Intel Xeon E GHz (16 cores total) – 4x Intel Xeon E GHz (32 cores total) – Intel Atom SoC C GHz (8 cores, cluster di 4 nodi = 32 cores) – Una prima nota: il codice scala in modo quasi perfetto, non ci sono lock e/o inter thread communication a parte il reduce finale

XEON i5 XEON i7 Scaling ottimale in tutti i casi (HT attivo)

Nvidia K1 (OpenMP + FastFlow) CPUSeq timeBest parallel time Multi thread scaling Single core wrt i5 I5 2.2 GHz670 sec35.3 sec191 I7 2.0 Ghz1060 sec30.5 sec351.6 Atom 2.4 GHz 1960 sec285 sec Nvidia K11680 sec530 sec Un po’ sorprendente …

Come andare oltre? Serve test serio su SW di produzione HEP Serve test serio su SW di produzione HEP – Temo pero’ che serva davvero ARMv8 prima … avete stime? Servirebbe qualcosa di fisica applicata (come da progetto), per esempio Servirebbe qualcosa di fisica applicata (come da progetto), per esempio – Simulazioni di fisica medica ?

Questions?Questions?

BackupBackup

FastFlow UniPi, UniTo (vedere anche: Concurrency Forum Meeting)Concurrency Forum Meeting