Vittorio Rosato Servizio di Calcolo e Modellistica ENEA Casaccia Dai problemi scientifici alle architetture di calcolo ovvero come cucire con aghi e gomene Giovedì della Cultura Scientifica, Casaccia
Key-points 1. un legame stretto tra problemi e modelli di calcolo 2. I modelli di calcolo determinano le architetture sulle quali hanno maggiori possibilità di essere eseguiti efficientemente le piattaforme di calcolo dovrebbero essere“”science- driven”
Giovedì della Cultura Scientifica, Casaccia Invece… 3. Le architetture di calcolo sono funzionalizzate per altre classi di applicazioni (grafica, multimedia, internet etc.) dunque…… dunque…… 4. La computational science ha dovuto elaborare nuovi modelli operativi e/o a utilizzare enormi piattaforme di calcolo visto che non può guidare lo sviluppo delle architetture. Questa presentazione illustrera’ alcuni degli ambiti nei quali la presenza di questi problemi ha spinto l’ elaborazione di (nuovi) modelli operativi.
Giovedì della Cultura Scientifica, Casaccia L’approccio computazionale è ormai considerato come “la ”terza via” dell’approccio conoscitivo alla realtà Problema Modello Architettura Predizione Gedanken experiment Architetture: - seriali - parallele
Data partitioning farming Giovedì della Cultura Scientifica, Casaccia Distributed memoryShared memory Principali architetture parallele
Giovedì della Cultura Scientifica, Casaccia Problema Modello locali linearizzazione data partitioning modello sistolico comp1 com1 comp2 com2 globali (spettrali, n-corpi) data partitioning difficile modello sistolico complesso comp1 com1 comp2 com2
Data partitioning farming Giovedì della Cultura Scientifica, Casaccia Data partitioning (ripartizione dei dati tra i nodi di calcolo) Task partitioning (ripartizione del lavoro tra i nodi di calcolo) Principali architetture parallele
Giovedì della Cultura Scientifica, Casaccia Facciamo un esempio: modelli di reti complesse Reti complesse: grandi sistemi di nodi e archi che descrivono interazioni funzionali tra oggetti (o entità astratte). interattoma del lievito (N=10 3 ) coautorship (N=10 4 ) rete di routers di internet (N=10 4 ) catena alimentare (N=10 3 ) ………. …….. Ammasso globulare (N=10 6 )
Giovedì della Cultura Scientifica, Casaccia Calcolo di proprietà locali Calcolo del coeff. di clustering di una rete nodo della rete devo calcolare il numero di legami tra i suoi vicini e compararlo con il numero massimo di legami che essi potrebbero sviluppare C = 5/10 = 0.5
Giovedì della Cultura Scientifica, Casaccia Come implemento il calcolo di questa proprietà ? (1) Fornisco a tutti gli elementi di calcolo la struttura della rete (2) attribuisco il calcolo di c di un subset di nodi a ciascun elemento di calcolo.
Giovedì della Cultura Scientifica, Casaccia Calcolo di proprietà globali : dinamica di un ammasso globulare N=10 5 (1) Calcolo delle r ij (n= ) (2) Calcolo delle forze 1/ r ij (3) Integrazione eq. del moto per k= 10 4 volte Problemi: -enorme numero di ops -Struttura non omogenea -Bilanciamento carico
Giovedì della Cultura Scientifica, Casaccia (1) gruppi di dati sui processori (2) Calcolo r ij intra-gruppo (3) Trasmissione dati inter- proc. (4) Calcolo r ij intra-gruppo (5) …… Grande traffico sulla rete Buona scalabilità per n<16 (1) Calcolo r ij su ciascun proc. (2) Somma delle forze su i (3) …… Ridotto traffico sulla rete Buona scalabilità n<32
Giovedì della Cultura Scientifica, Casaccia Problemi computazionali complessi astrofisica (mod. cosmologici, mod. stellari) protein folding modelli quantistici di nano-strutture systems biology analisi e controllo di sistemi complessi real-time (analisi di immagine, compressione etc.) Termofluidodinamica, chimica delle reazioni Plasma physics
Giovedì della Cultura Scientifica, Casaccia
87% 68% 58% 64% 74%
Giovedì della Cultura Scientifica, Casaccia le cause principali….. Inoltre le prestazioni di (1) bandwidth e di latenza delle reti (2) bandwidth di accesso alle memorie (3) taglia delle memorie interne (cache) non hanno mostrato, nel tempo, lo stesso andamento della legge di Moore, dunque le piattaforme di calcolo sono - ”equilibrate”
Giovedì della Cultura Scientifica, Casaccia Il risultato di tutto questo é Source: The Divergence problem, H. Simon, Director NERSC, June 2003
Giovedì della Cultura Scientifica, Casaccia Soluzioni della tecnologia corrente: Earth Simulator 5192 processors ~ 40 Tflops (Tflops= 10 3 Miliardi op/sec)
Giovedì della Cultura Scientifica, Casaccia Wide-area computing farms (GRID) Una GRID è un insieme di piattaforme di calcolo distribuite su un’ampia regione che possono eseguire parti diverse dello stesso codice oppure ”repliche” dello stesso codice con dati diversi.
Giovedì della Cultura Scientifica, Casaccia Applicazioni scientifiche su GRID ”globali” folding.stanford.edu
Giovedì della Cultura Scientifica, Casaccia HW dedicato Un’altra strategia consiste nella progettazione di architetture massimamente efficienti per lo svolgimento di specifiche tasks. Esempi: (1) GRAvitational PipE (GRAPE) per simulazioni astrofisiche
Giovedì della Cultura Scientifica, Casaccia HW dedicato
Giovedì della Cultura Scientifica, Casaccia HW dedicato Esempio: (2) APE per simulazioni di LQCD
Giovedì della Cultura Scientifica, Casaccia
HW dedicato Si possono progettare device HW (microprocessori) specializzati per effettuare in mainera molto efficiente (e dunque rapida) specifiche analisi su grandi quantità di sequenze (DNA, proteine). Ylichron Su questa idea è in corso di realizzazione uno spin-off : Ylichron FPGA-based board (standard PCI) Automatic synthesis Automatic validation and check VHDL expression
Giovedì della Cultura Scientifica, Casaccia Conclusioni (1) Il mercato ha selezionato le nuove architetture di calcolo. Tranne alcune eccezioni di piattaforme ”science driven” (IBM BlueGene, vector machines) la comunità scientifica userà, nei prossimi anni, sistemi MPP basati su componenti COTS. (2) La GRID ha una duplice valenza: da un lato costituisce una soluzione sostenibile, dall’altro consente la realizzazione di progetti ad alto lavoro computazionale. Attribuiamo a questa strategia rilevanti implicazioni commerciali. (3) I sistemi HW/SW possono costituire una soluzione conveniente in alcuni campi applicativi: la bioinformatica, le applicazioni real- time, l’analisi delle immagini etc. Il miglioramento della tecnologia delle logiche programmabili consentirà, a breve, di utilizzare questa soluzione anche per problemi di calcolo scientifico (floating-point).