Università degli Studi di Napoli “Federico II” Facoltà di Ingegneria Dipartimento di Informatica e Sistemistica Corso di Sistemi ad elevate prestazioni.

Slides:



Advertisements
Presentazioni simili
Università degli Studi di Napoli Federico II Facoltà di Ingegneria Dipartimento di Informatica e Sistemistica Corso di Sistemi ad elevate prestazioni –
Advertisements

Cinematica del braccio di un robot
Lez. 41 Universita' di Ferrara Facolta' di Scienze Matematiche, Fisiche e Naturali Laurea Specialistica in Informatica Algoritmi Avanzati Programmazione.
GLI ORGANI AZIENDALI.
esponente del radicando
La Modifica dei Dati in una Base Dati La modifica dei dati contenuti allinterno di una base dati è unoperazione delicata Infatti, ogni potenziale problema.
Università degli Studi di Cagliari
Introduzione al calcolo parallelo SISTEMI INFORMATIVI AZIENDALI Pierpaolo Guerra Anno accademico 2009/2010.
Tipo Documento: unità didattica 0 Modulo 0 Compilatore: ??? Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione C.Corpo D.Riepilogo.
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 17/03/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
Evoluzione del MIPS: superpipeline e superscalari
Criticità sul controllo
Corso di Informatica Applicata - Lezione 3 - © 2005 Saverio De Vito Corso di Informatica Applicata Lezione 3 Università degli studi di Cassino Corso di.
Struttura dei sistemi operativi (panoramica)
Xscale Nicola Rebagliati 2001s135. Cose Xscale Xscale è una microarchitettura per processori che fornisce ottime prestazioni con bassi consumi energetici.
Estensioni allarchitettura di Von Neumann Vito Perrone Corso di Informatica A per Gestionali.
Corso di Matematica Discreta I Anno
Corso di Matematica Discreta cont. 2
Fondamenti di Informatica1 Software di base Tra il linguaggio macchina (basso livello) e i linguaggi evoluti (alto livello) esiste uno strato di software.
CPU (central process unit)
Equazione di Dirac per la y
Rete Sincrona Una rete sequenziale sincrona, è dotata di un ingresso E, di un segnale di Clock e uno di reset. Ad ogni fronte del Clock, deve essere campionato.
Elementi di programmazione ad oggetti a. a. 2009/2010 Corso di Laurea Magistrale in Ingegneria Elettronica Docente: Mauro Mazzieri, Dipartimento di Ingegneria.
INTRODUZIONE l sistema operativo è il primo software che lutente utilizza quando accende il computer; 1)Viene caricato nella memoria RAM con loperazione.
I primi insiemi che si incontrano in matematica sono quelli dei numeri;  daremo qui una breve descrizione dei principali insiemi numerici, delle loro operazioni.
Sistemi di numerazione
Metodo della moltiplicazione
1 Astrazioni sui dati : Ragionare sui Tipi di Dato Astratti dispense prof. G. Levi.
GESTIONE INTERRUPT CPU INTEL 8086
Algoritmi Paralleli e Distribuiti a.a. 2008/09 Lezione del 17/04/2009 Prof. ssa ROSSELLA PETRESCHI a cura del Dott. SAVERIO CAMINITI.
Sistemi ad elevate prestazioni Lezione 1
Università degli Studi di Napoli “Federico II” Facoltà di Ingegneria Dipartimento di Informatica e Sistemistica Corso di Sistemi ad elevate prestazioni.
Informatica Lezione 4 Scienze e tecniche psicologiche dello sviluppo e dell'educazione Anno accademico:
Definizioni e Proprietà
Di Luca Santucci e Riccardo Latorre LA CONDIVISIONE E L’ACCESSO ALLE RISORSE DI RETE.
Ugo de'Liguoro - Informatica 2 a.a. 03/04 Lez. 1 Cicli ed asserzioni Corso di Informatica 2 a.a. 2003/04 Lezione 1.
L’addizione e la sottrazione nell'Insieme N dei numeri naturali
Prima di iniziare… Durata attività: due lezioni frontali + una lezione laboratorio + compiti per casa Prerequisiti: elementi base architettura dei calcolatori.
La rappresentazione delle informazioni in un computer Seconda parte.
La rappresentazione delle informazioni in un computer [Terza parte]
Equazioni.
I processi.
Arch. Elab. - S. Orlando 1 Esercitazione su Instruction Level Parallelism Salvatore Orlando.
SISITEMI MONOPROGRAMMATI E MULTI PROGRAMMATI
CEFRIEL Consorzio per la Formazione e la Ricerca in Ingegneria dell’Informazione Politecnico di Milano introduzione alle architetture superscalari Come.
Algoritmi e Strutture Dati
Implementazione di dizionari Problema del dizionario dinamico Scegliere una struttura dati in cui memorizzare dei record con un campo key e alcuni altri.
WATCHDOG TIMER E’ un oscillatore interno al  C, ma indipendente dal resto dei circuiti, il cui scopo è quello di rilevare eventuali blocchi della CPU.
Parte 3 Lo stato: variabili, espressioni ed assegnazioni
Informatica Lezione 5 Scienze e tecniche psicologiche dello sviluppo e dell'educazione (laurea triennale) Anno accademico:
Moltiplicazione di un monomio per un polinomio
Tipo Documento: unità didattica 3 Modulo 7 Compilatore: Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione C.Corpo D.Riepilogo.
Sistema operativo Il Sistema Operativo gestisce le risorse hw e sw del sistema di elaborazione Facilita l'interazione tra utente e sistema Esistono diversi.
Informatica Generale Marzia Buscemi
Prof. ing. Paolo Bidello AA 2005/2006 Laboratorio Informatico Promemoria degli argomenti: Reti locali (LAN)
Rappresentazione dell'informazione
La codifica dei numeri.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Tipo Documento: unità didattica 3 Modulo 7 Compilatore: Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione C.Corpo D.Riepilogo.
Forma normale delle equazioni di 2° grado Definizione. Un'equazione di secondo grado è in forma normale se si presenta nella forma Dove sono numeri.
“ Pseudocodice ” Un programma per computer lavorerà su in insieme di “ variabili ” contenenti i dati del problema, soluzioni intermedie, soluzioni finali.
I Microprocessori Unità 3 del libro Internet Working Sistemi e reti.
Esponenziali e Logaritmi
Test di Fisica Soluzioni.
Lezione n° 10 Algoritmo del Simplesso: - Coefficienti di costo ridotto - Condizioni di ottimalità - Test dei minimi rapporti - Cambio di base Lezioni di.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Algoritmi Avanzati a.a.2010/2011 Prof.ssa Rossella Petreschi Complessità e Trasportabilità Lezione n°3.
Prof. Cerulli – Dott. Carrabs
Algoritmi Avanzati a.a.2011/2012 Prof.ssa Rossella Petreschi Interconnessione tramite reti Lezione n°6.
Transcript della presentazione:

Università degli Studi di Napoli “Federico II” Facoltà di Ingegneria Dipartimento di Informatica e Sistemistica Corso di Sistemi ad elevate prestazioni – Prof. Nicola Mazzocca Sistemi ad elevate prestazioni Lezione 4

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Architetture Superscalari L’utilizzo delle pipe porta dei vantaggi non in termini di attraversamento di una istruzione, che rimane invariato, ma in termini di produttività. L’utilizzo delle pipe porta dei vantaggi non in termini di attraversamento di una istruzione, che rimane invariato, ma in termini di produttività. Per ottenere ancora prestazioni migliori, allora, si può pensare di realizzare un architettura che presenti più pipe che eseguono diverse istruzioni in parallelo, così da aumentare la produttività del sistema, tale tipo di architettura viene chiamata Superscalare Per ottenere ancora prestazioni migliori, allora, si può pensare di realizzare un architettura che presenti più pipe che eseguono diverse istruzioni in parallelo, così da aumentare la produttività del sistema, tale tipo di architettura viene chiamata Superscalare Due pipe disgiunte Due pipe non disgiunte.

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Principali problematiche Le pipe devono condividere un unico accesso alla memoria comune per il prelievo delle istruzioni. Le pipe devono condividere un unico accesso alla memoria comune per il prelievo delle istruzioni. Se le pipe non sono del tutto separate ma condividono alcune delle stazioni nascono anche dei problemi di conflitto tra le pipe nell’utilizzo delle unità funzionali condivise Se le pipe non sono del tutto separate ma condividono alcune delle stazioni nascono anche dei problemi di conflitto tra le pipe nell’utilizzo delle unità funzionali condivise Un esempio di processore superscalare è il Pentium, tale processore è stato uno dei primi esempi con più pipe, infatti ne aveva già 2 (U e V), le quali però non erano usate in modo efficiente, poiché una era utilizzata sempre (pipe principale), l’altra solo se si era sicuri che non provocasse delle collisioni Un esempio di processore superscalare è il Pentium, tale processore è stato uno dei primi esempi con più pipe, infatti ne aveva già 2 (U e V), le quali però non erano usate in modo efficiente, poiché una era utilizzata sempre (pipe principale), l’altra solo se si era sicuri che non provocasse delle collisioni

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Collisioni nei Sistemi Superscalari con più Pipeline (1) Supponiamo di avere un processore che realizza l’operazione di addizione e di moltiplicazione floating-point. Supponiamo di avere un processore che realizza l’operazione di addizione e di moltiplicazione floating-point. Addizione Moltiplicazione

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Collisioni nei Sistemi Superscalari con più Pipeline (2) 7 stadi per la moltiplic. 9 stadi per l’addiz.

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Collisioni nei Sistemi Superscalari con più Pipeline (3) Ad esempio se parte la moltiplicazione X e un istante dopo anche la moltiplicazione Y, si hanno due sovrapposizioni (caselle XY dello schema seguente. Abbiamo ovviamente sovrapposto le griglie delle due moltiplicazioni). Ad esempio se parte la moltiplicazione X e un istante dopo anche la moltiplicazione Y, si hanno due sovrapposizioni (caselle XY dello schema seguente. Abbiamo ovviamente sovrapposto le griglie delle due moltiplicazioni). Sovrapponendo le maschere costruisco il vettore delle collisioni che può essere usato dal compilatore

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Vettore delle Collisioni (1) È da notare che non vale la proprietà commutativa: mettendo prima la moltiplicazione e poi l’addizione, non si verificano mai conflitti. È da notare che non vale la proprietà commutativa: mettendo prima la moltiplicazione e poi l’addizione, non si verificano mai conflitti. Quindi un altro modo per evitare conflitti è invertire le due operazioni in tale ordine, se possibile. Quindi un altro modo per evitare conflitti è invertire le due operazioni in tale ordine, se possibile. Occorre determinare tutti gli altri collision vector: esempio quello di un’addizione seguita da un’addizione, e quello della moltiplicazione seguita da una moltiplicazione. Occorre determinare tutti gli altri collision vector: esempio quello di un’addizione seguita da un’addizione, e quello della moltiplicazione seguita da una moltiplicazione. Se per ipotesi avessimo 8 operazioni floating point effettuabili in hardware, dovremmo realizzare ben 64 collision vector. Il compito del compilatore diviene sempre più difficile. Se per ipotesi avessimo 8 operazioni floating point effettuabili in hardware, dovremmo realizzare ben 64 collision vector. Il compito del compilatore diviene sempre più difficile.

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Vettore delle Collisioni (2) Supponiamo di dover eseguire una sequenza di istruzioni: Supponiamo di dover eseguire una sequenza di istruzioni: add mol mol add add mol… add mol mol add add mol… occorre il vettore di collisione addizione- moltiplicazione e poi quello moltiplicazione- moltiplicazione. occorre il vettore di collisione addizione- moltiplicazione e poi quello moltiplicazione- moltiplicazione. Adesso bisogna inserire la seconda moltiplicazione tenendo conto di eventuali conflitti non solo con la precedente moltiplicazione, ma anche con l’addizione che viene subito prima! Adesso bisogna inserire la seconda moltiplicazione tenendo conto di eventuali conflitti non solo con la precedente moltiplicazione, ma anche con l’addizione che viene subito prima!

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Hardware per la Gestione delle Collisioni

Sistemi ad elevate prestazioni - Prof. re Nicola Mazzocca Prossima Lezione Gestione delle ISR in sistemi pipelined Gestione delle ISR in sistemi pipelined Architetture VLIW Architetture VLIW