Il Supercalcolo Architetture dei sistemi di calcolatori.

Slides:



Advertisements
Presentazioni simili
Memoria Virtuale in Linux
Advertisements

© 2007 SEI-Società Editrice Internazionale, Apogeo Unità D1 Architetture di rete.
Unità D1 Architetture di rete.
ISA Server 2004 Enterprise Edition Preview. ISA Server 2004.
File System Cos’è un File System File e Directory
Cluster openMosix Linux Day ’04 Caserta Ing. Diego Bovenzi.
La rete in dettaglio: rete esterna (edge): applicazioni e host
Giuseppe Fabio Fortugno.
Realizzazione del file system
Operating System Concepts
Realizzazione del file system
Sistemi Operativi Sistemi Operativi per Architetture Parallele
Glossario. AGP Accelerated Graphics Port: architettura di bus che permette alle schede grafiche laccesso diretto al bus di sitema (fino a 100MHz), invece.
Algoritmi Paralleli e Distribuiti a.a. 2008/09
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
Input/Output.
Gestione dei dischi RAID
Disco magnetico (2) Ciascuna traccia è divisa in settori
IDUL 2010 RETI E PROTOCOLLI. INTERNET.. IDEE PRINCIPALI IN QUESTA LEZIONE Reti: Aspetto logico della rete e tipologie: peer-to-peer, a hub, a bus Trasmissione.
IDUL 2012 RETI E PROTOCOLLI. INTERNET.. IDEE PRINCIPALI IN QUESTA LEZIONE Reti: Aspetto logico della rete e tipologie: peer-to-peer, a hub, a bus Trasmissione.
IDUL 2009 RETI E PROTOCOLLI. INTERNET. IDEE PRINCIPALI IN QUESTA LEZIONE Reti: Aspetto logico della rete e tipologie: peer-to-peer, a hub, a bus Trasmissione.
Struttura dei sistemi operativi (panoramica)
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
La gestione dell'I/O Architettura degli elaboratori 1 - A. Memo La gestione dellI/O 4Prestazioni e generalità 4.1Modelli di funzionamento 4.2Dischi.
Sistemi Operativi Distribuiti: indice
3. Architettura Vengono descritte le principali componenti hardware di un calcolatore.
BUS di comunicazione Da Testo Maeran. BUS caratteristiche generali Semplicità (minori costi) Standard (in modo che chiunque produce HW lo possa.
Estensioni allarchitettura di Von Neumann Vito Perrone Corso di Informatica A per Gestionali.
Fondamenti di Informatica1 Software di base Tra il linguaggio macchina (basso livello) e i linguaggi evoluti (alto livello) esiste uno strato di software.
4 Cosa è una rete? ã Punto di vista logico: sistema di dati ed utenti distribuito ã Punto di vista fisico: insieme di hardware, collegamenti, e protocolli.
Reti di Calcolatori Reti di Calcolatori2 Il modello Client/Server I Sistemi di Rete Dal punto di vista del programmatore.
@2000 R. Bisiani1 R. Bisiani2 Dischi u Piatti multipli coperti da materiale magnetizzabile.
Reti di Calcolatori L-S Un Sistema Decentrato di Allocazione del Carico per Applicazioni di Calcolo Distribuito Mauro Bampo.
Corso di Informatica per Giurisprudenza Lezione 7
INTRODUZIONE l sistema operativo è il primo software che lutente utilizza quando accende il computer; 1)Viene caricato nella memoria RAM con loperazione.
Benvenuti a Un incontro informativo di grande valore ed alto contenuto sulla Virtualizzazione e sistemi ad alta disponibiltà per le PMI.
Architettura di Calcolo
L' ARCHITETTURA DI VON NEUMANN
La rete di istituto Maninder Bansal 5Bz Vital Ivo 5Bz Anno scolastico 2005/06.
Laboratorio Informatico: RETI E INTERNET I
U N INFRASTRUTTURA DI SUPPORTO PER SERVIZI DI FILE HOSTING Matteo Corvaro Matricola Corso di Reti di Calcolatori LS – Prof. A. Corradi A.A.
Architettura di storage ad alta affidabilita e bilanciamento di carico per volumi centrali e di esperimento A.Brunengo, M.Corosu INFN Sezione di Genova.
Architetture Parallele Massimizzare le prestazioni del sistema Obiettivo: Metodologie: Parallelizzare le attività del sistema Effettuare solo le operazioni.
Reti di calcolatori LS Manni Tiziano  IT e nuovi scenari applicativi …  … portabilità dei dati …  … condivisione dati …  … disponibilità.
Informatica Lezione 4 Scienze e tecniche psicologiche dello sviluppo e dell'educazione Anno accademico:
Dischi in RAID  Redundant Array of Independent Disk Configurazione che permette di combinare più dischi secondo obiettivi di performance e ridondanza.
I processi.
Migliorare le prestazioni delle cache
Gestione del processore (Scheduler)
IDUL 2013 RETI E PROTOCOLLI. INTERNET.. IDEE PRINCIPALI IN QUESTA LEZIONE Reti: Aspetto ‘logico’ della rete e tipologie: peer-to-peer, a hub, a bus Trasmissione.
1 Input/Output. 2 Livelli del sottosistema di I/O Hardware Gestori delle interruzioni Driver dei dispositivi Software di sistema indipendente dal dispositivo.
Sistemi di elaborazione dell’informazione Modulo 3 - Protocolli applicativi Unità didattica 1 - Domain Name System Ernesto Damiani Lezione 2 – Caratteristiche.
1 Input/Output. 2 Livelli del sottosistema di I/O Hardware Gestori delle interruzioni Driver dei dispositivi Software di sistema indipendente dal dispositivo.
Sistema operativo Il Sistema Operativo gestisce le risorse hw e sw del sistema di elaborazione Facilita l'interazione tra utente e sistema Esistono diversi.
1 Migrazione dei processi: Mosix. 2 Cosa è Mosix/OpenMOSIX ? OpenMOSIX è un è una patch del kernel di Linux che aggiunge funzionalit à avanzate di clustering.
Gestione della Memoria
1 Alcuni esempi di dispositivi Disco rigido, RAID, video.
Informatica Generale Marzia Buscemi
Corso di Laurea in Biotecnologie corso di Informatica Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
1 1. Introduzione alla gestione della memoria 2. Swapping 3. Memoria virtuale 4. Implementazione 5. Algoritmi di sostituzione Gestione della Memoria.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
I Microprocessori Unità 3 del libro Internet Working Sistemi e reti.
Il modello di Von Neumann
Dischi magnetici e scheduling del braccio del disco Pag. 216 – 224.
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
Gestione delle periferiche. Le periferiche sono dispositivi che permettono le operazioni di input/output.
HARDWARE (2). MEMORIE Due classi di memoria MEMORIA CENTRALE –media capacità - ottima velocità MEMORIA DI MASSA elevata capacità - bassa velocità.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Alessandro Tirel - Sezione di Trieste Storage servers & TCP Tuning Proposta di studio delle problematiche connesse alla fornitura di servizi di storage.
Transcript della presentazione:

Il Supercalcolo Architetture dei sistemi di calcolatori

Tassonomia di Flynn  SISD: Single instruction, single data  SIMD:Single instruction, multiple data  MISD: ??  MIMD  Multiprocessore  UMA: Uniform Memory Access  COMA: Cache Only Memory Access  NUMA: Not Uniform Memory Access  Multicomputer  MPP: Message Passing Processor  COW: Cluster of Workstation

UMA  L’accesso alla memoria è uniforme  Architettura a Bus  Sul Bus sono attestati i processori, le memorie e gli eventuali bridge (PCI, SCSI …)  Il problema è il mantenimento della coerenza dei dati tra le caches  Cache write through (pesante per il bus)  Snooping Cache  Cache write back con protocollo MESI

UMA  Il bus diventa il collo di bottiglia  Usare uno Split Transaction Bus migliora le prestazioni ma non troppo  Esistono anche reti di interconnessione Crossbar Switch tra processori e memorie ma devo aggiungere uno snooping bus per la coerenza delle cache  Importante la disposizione dei dati nelle memorie  Queste sono soluzioni estreme che costano molto

UMA  Potrei usare una rete multistage ma:  Costano comunque  Non standard  Ritardo aggiuntivo degli stages  Più bloccanti degli altri  Risoluzione confitti  Problemi di routing

UMA: e il S.O.?  Varie soluzioni per il kernel  Master/Slave: un processore dedicato al S.O.,gli altri solo applicazioni  Separate Executive: ogni processore fa girare una copia separata del S.O.  Simmetric Multi Processing: il S.O. gira dove capita => necessari punti di sincronizzazione nel kernel

NUMA  Ogni processore ha la sua memoria e accede più velocemente lì  È una soluzione scalabile: posso arrivare fino a migliaia di processori  Non causano problemi  Bandwidth tra CPU e memoria: si ingrandisce automaticamente  Latency: più o meno costante  Cost: crescita lineare  Phisical: problemi fisici (consumi, raffreddamento…)

NC-NUMA  No Cache NUMA  Metto in cache solo quello che ho nella mia memoria  Cruciale il piazzamento dei dati tra le memorie

CC-NUMA  Cache coherent NUMA  Come garantisco la coerenza?  Meccanismi directory based  Directory memory-based  L’elemento di directory, associato a una linea di memoria ha un array di processori dove è il dato  Directory cache-based  Lista linkata tra i processori

COMA  Cache only memory access  Esistono solo cache  Non usate  Problema dell’ultima copia  Problemi vari

Multicomputer  Caratterizzati dal Message Passing  Importante la rete di interconnessione

Rete di interconnessione: caratteristiche  Topologia  Diametro: distanza max o media tra due nodi  Bisection bandwidth: la larghezza di banda che attraversa ogni bisezione della rete  Dimentionality: numero di percorsi alternativi (per la fault tolerance)

Rete di interconnessione  Problemi di Routing  Store & forward è troppo lento  Cut Through  Decido sul routing all’inizio del messaggio  Se incontro un ostacolo  Virtual cut through: il messaggio si ammassa nel nodo ostacolo  Wormhole routing: blocco tutto e il messaggio resta spalmato su più nodi

Routing  Tipo di decisione di routing  Aritmetico  Decisione matematica a partire dall’indirizzo del destinatario  Topologia fissa e semplice  No fault tolerance  Souce based  La sorgente precalcola il percorso  Table driven  Gli algoritmi deterministici usano male la rete  Problemi di velocità  Rischio deadlock

I/O ad alte prestazioni  Due orientazioni:  Mass transfer: sequenziali e “prevedibili”  Importante il transfer rate  Transaction processing  Importante l’access time

I/O ad alte prestazioni  Anche i dischi crescono esponenzialmente  Nella densità (lineare e per traccia)  Meno nelle prestazioni  Sia in terminio di seek time che di transfer rate  Problematico perché intervengono problematiche fisiche (velocità di rotazione dei dischi e movimento dei bracci)

I/O ad alte prestazioni  Non blocking I/O (read)  Read anticipato  Chiamata bloccante dopo  Serie di chiamate non bloccanti  Call back signal (interrupt software)  O/S Bypass  Comunicazione diretta tra dispositivi e applicazioni  Pinning della memoria: divieto di paginazione

I/O ad alte prestazioni  Parallelismo: più dischi  Striping: suddivido i dati a strisce su più dischi  Stripe factor: numero dischi  Stripe depth: quanto è grande l’unità di suddivisione dati  RAID:  Redundant Array of Independent – Inexpensive Disk  Fault tolerance (duplicazione e controlli di errore)

Tecnologia RAID  RAID 0:  Separo i dati su più dischi  Parallelizzo le letture  Bene per i mass transfer  Bene per i transazionali

Tecnologia RAID  RAID 1  Mirroring  Raid 0 duplicato  Fault tolerance perché ho duplicazione  Non miglioro le prestazioni in lettura

Tecnologia RAID  RAID 2  Su alcuni dischi metto la codifica di Hamming  Poco usata  Costa e richiede sincronizzazione bit a bit  Bene solo per i mass transfer  Coda delle transazioni poco parallelizzabili

Tecnologia RAID  RAID 3  Come level 2 ma con la parità e non bit a bit  L’hamming code crea gli svantaggi come in RAID 2

Tecnologia RAID  RAID 4  Parità blocco a blocco su un disco  Bene per il transfer rate  Operazioni durante la modifica:  Leggere old data  Leggere old parity  Old data (XOR) old parity per avere la parità degli altri dischi  Trovare la nuova parità  Store data  Store parity  Male per le transazioni: gli aggiornamenti delle parità sono serializzati  Mai usati

Tecnologia RAID  RAID 5  Come RAID 4 ma i blocchi di parità sono distribuiti sui dichi

Tecnologia RAID  RAID 6 o RAID DP  Doppio meccanismo di ridondanza con bit su dischi distinti  Schema bidimensionale

Tecnologia RAID  RAID 1-0  Doppia virtualizzazione  È un array RAID 0 di dischi virtuali, ogni disco è un RAID 1  RAID 0-3  È un array RAID 0 di dischi virtuali e ogni disco è un RAID 3

SCSI  Il problema si sposta sull’I/O interconnect  Small Computer System Interface  Protocollo di comunicazione verso periferiche generiche  Bus o catena SCSI con indirizzamento (settato a mano)  Transazioni I/O di tipo Split Transaction

Esempi reali  HIPPI  SUPER HIPPI  HPN: High performance Network  SAN: System Area Network  Fast Ethernet-Gigabit Ethernet  Myrinet  Fibre Channel  NASD: Network Attached Storage Device

Constellation  Nome “esotico” per un CC-NUMA  Cluster di pochi nodi con molti processori per nodo

COW  Cluster Of Workstation  Un insieme di calcolatori indipendenti e di tipo COTS che cooperano per ottenere alte prestazioni su un grosso problema (o un grosso insieme di problemi)  Indipendenti perché funzionano anche fuori dal Cluster  COTS: componenti “di serie”

Cluster  Obiettivi:  Fault Tolerance  Scalabilità di costo  Scalabilità di prestazioni  Orientati al supercalcolo  Orientati al superlavoro transazionale

Caratterizzazione  Ruolo dei server aggiuntivi: attivo o passivo  Connessione ai dischi: interni ai nodi o nodo storage  Condivisione dati: shared nothing o shared data  Accesso ai dati: Read Only o Read & Write  Visione amministrativa: single image o configurazioni separate  Visione al programmatore: programmazione tradizionale o message passing  Visione esterna: Fuori (alle altre macchine) vedo la molteplicità?  Disposizione geografica: Locale o sparpagliata?

Esempi  A mano!  Download da Tucows o Download.com  o cracking codici  HTTP redirect  Rotating DNS  Prodotti di load balancing