GPU - Graphics Processing Unit Corso di Sistemi Paralleli Luigi La Torre - 744581 13 Giugno 2012.

Slides:



Advertisements
Presentazioni simili
Introduzione al Calcolo Parallelo
Advertisements

Modulo didattico “Hardware del P.C.”
Introduzione al calcolo parallelo SISTEMI INFORMATIVI AZIENDALI Pierpaolo Guerra Anno accademico 2009/2010.
Tipo Documento: unità didattica 0 Modulo 0 Compilatore: ??? Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione C.Corpo D.Riepilogo.
Glossario. AGP Accelerated Graphics Port: architettura di bus che permette alle schede grafiche laccesso diretto al bus di sitema (fino a 100MHz), invece.
GPU: processori manycore Annalisa Massini Calcolo Intensivo a.a. 2010/2011.
Calcolo intensivo Annalisa Massini.
GPU: processori manycore
2 Sistema composto da un numero elevato di componenti, in cui ogni componente svolge una sua funzione elaborazione dati memorizzazione dati trasferimento.
Hyper Threading Technology
Computer Graphics Marco Tarini Università dellInsubria Facoltà di Scienze MFN di Varese Corso di Laurea in Informatica Anno Accademico 2005/06 prove generali.
Riunione CRESCO Infrastruttura HPC Cresco Analisi Preliminare.
Sistemi Operativi Distribuiti: indice
3. Architettura Vengono descritte le principali componenti hardware di un calcolatore.
Introduzione Cosa è un Sistema Operativo ?
Estensioni allarchitettura di Von Neumann Vito Perrone Corso di Informatica A per Gestionali.
Fondamenti di Informatica1 Software di base Tra il linguaggio macchina (basso livello) e i linguaggi evoluti (alto livello) esiste uno strato di software.
EVOLUZIONE DEL PC Legge di Moore: La potenza dei calcolatori raddoppia ogni 18 mesi Metà anni 80 (Personal Computer IBM AT) Architettura 16 bit interna,
Architettura degli elaboratori
Reti di Calcolatori Reti di Calcolatori2 Il modello Client/Server I Sistemi di Rete Dal punto di vista del programmatore.
CPU (central process unit)
Architettura di un calcolatore
UNIVERSITA’ STUDI DI ROMA “FORO ITALICO”
Architettura dell’elaboratore
SCHEDE Audio e Video.
Il Calcolatore Elettronico
Appunti di Informatica
Architettura di Calcolo
I blocchi fondamentali dell’elaborazione Componenti e funzionamento del calcolatore I blocchi fondamentali dell’elaborazione.
INFORMAZIONI GENERALI Web site: Att. DidatticaIns. UniversitarioA.A PROGRAMMA.
La Tecnica PIPELINE Il DLX - Pipeline.
La Tecnica PIPELINE Il DLX - Pipeline.
Tratto da “HW PC” – O. Maeran
Introduzione all'uso del PC
Unità centrale di processo
Antialiasing tratto da: Han-Wei Shen.
Corso di Programmazione Grafica e Laboratorio Introduzione a OpenGL Prof. Daniele Marini.
Architetture per la grafica Daniele Marini Corso Di Programmazione Grafica Tratto da appunti di: Tomas Akenine-Möller Department of Computer Engineering.
IL MICROPROCESSORE CARATTERISTICHE STRUTTURA EVOLUZIONE.
Sistemi Elettronici Programmabili: La Memoria Principale 6-1 Sistemi Elettronici Programmabili La memoria principale.
I processi.
Graphic Processing Unit GPU. ARCHITETTURA DI COMUNICAZIONE.
GPGPU General Purpose Computation on GPU Emanuele Ruffaldi 2005 Corso su Elasticità non lineare ed Oggetti Deformabili.
3  Sistema composto da un numero elevato di componenti, in cui ogni componente svolge una sua funzione  elaborazione dati  memorizzazione dati 
SCHEDA INFORMATIVA DI UNITÀ. Introduzione Applicazione della gerarchia di memoria –Memoria cache fra la CPU e la memoria centrale Il processore vedrà.
SCHEDA INFORMATIVA DI UNITÀ. Introduzione Applicazione della gerarchia di memoria –Memoria cache fra la CPU e la memoria centrale Il processore vedrà.
Luglio 2004Generalità Hardware1 Luglio Generalità Hardware2 MACCHINA DI VON NEUMAN (1947) BUS Processore Elaborazione Controllo Memoria Ingresso.
Tipo Documento: unità didattica 3 Modulo 7 Compilatore: Supervisore: Data emissione: Release: Indice: A.Scheda informativa B.Introduzione C.Corpo D.Riepilogo.
Calcolatori Elettronici Valutazione delle Prestazioni Francesco Lo Presti Rielaborate da Salvatore Tucci.
Clocking Il segnale di Clock definisce quando i segnali possono essere letti e quando possono essere scritti Fronte di discesa (negativo) Falling edge.
Sistemi embedded per l’auto: ricevitore GPS
Sistema operativo Il Sistema Operativo gestisce le risorse hw e sw del sistema di elaborazione Facilita l'interazione tra utente e sistema Esistono diversi.
Corso di Laurea in Scienze e Tecnologie Chimiche corso di Informatica Generale Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Informatica Generale Marzia Buscemi
1 Informatica Generale Susanna Pelagatti Ricevimento: Mercoledì ore presso Dipartimento di Informatica, Via Buonarroti,
Fabio Casale, Matteo Sosso
Parte IElementi di informatica1 Introduzione all’hardware di un calcolatore Parte I.
TESI DI LAUREA TRIENNALE IN GPU-CUDA ENVIRONMENT
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Informatica Lezione 4 Psicologia dello sviluppo e dell'educazione (laurea magistrale) Anno accademico:
MODELLI E COMPUTER ovvero…. ENEAi giovedì della cultura scientifica
SEMINARI CAMO 2003 LA SIMULAZIONE NUMERICA COMPIE 50 ANNI
Le componenti di un computer
Architettura del computer Il computer menù I L C O M P U T E R Il computer, quindi, é una macchina programmabile, cioè una macchina che può essere utilizzata.
I Microprocessori Unità 3 del libro Internet Working Sistemi e reti.
Uso Didattico dell'Informatica Storica 07 STORIA DEI MICROPROCESSORI E INTRODUZIONE ALLA VIRTUALIZZAZIONE prof. Cuoghi Giampaolo ITIS “A.Volta” Sassuolo.
HARDWARE (2). MEMORIE Due classi di memoria MEMORIA CENTRALE –media capacità - ottima velocità MEMORIA DI MASSA elevata capacità - bassa velocità.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Breve Storia 3d prima generazione (escludiamo Wolf3d, Doom e Duke3d, che erano una sorta di 2D)  per ogni triangolo che compone una mesh calcoliamo la.
Componenti base di un computer Gli elementi fondamentali La Cpu La Ram L’ Hard disk.
Transcript della presentazione:

GPU - Graphics Processing Unit Corso di Sistemi Paralleli Luigi La Torre Giugno 2012

Outline  Introduzione  Evoluzione nel tempo  Hardware GPU  Fermi  Kepler  Conclusioni

Introduzione - 1  Progettata per scaricare e accelerare il rendering 2D/3D dalla CPU  Architettura core SIMD  Core operano a frequenze basse  Centinaia di core  Unità programmabile  I principali vendor  NVDIA  AMD

Introduzione - 2  CPU vs GPU

Introduzione - 3  Motivazioni

Evoluzione nel tempo - 1  1980:  Chip TTL  IBM: Intel 8088  Silicon Graphics Inc. (SGI)  1990:  0 Generazione  II Generazione RealityEngine (SGI) Voodoo (3dfx) GeForce256 (NVIDIA), Radeon 7500 (ATI): nasce il termine GPU (1999). “Fixed Function” pipeline

Evoluzione nel tempo - 2  2000:  III Generazione  VII Generazione GeForce 3 - Pipeline semi programmabili: Shaders GeForce FX, Radeon Pipeline programmabili completamente GeForce 8 - Processore altamente parallelo. Streaming Multiprocessor Architettura Fermi (NVIDIA): Prima GPU progettata per GPGPU  2010 e oltre:  Architettura Kepler  APU (Accelerated Processig Unit): CPU + GPU

Hardware GPU  N multiprocessori con M core ciascuno  SIMD - Ogni core condivide un Istruction Unit con altri core in un multiprocessore

Hardware GPU - Memorie (Modello Cuda) - 1  Global Memory  Memoria più grande. Fino a 4 GB  Alto bandwidth (GB/s)  Latenza molta alta  Local Memory  Poco spazio di memoria  Accessibile solo da un streaming processor  Lenta come Global Memory  Shared Memory  16 KB condivisi da un multiprocessor  Memoria veloce  Può essere considerata come una cache L1

Hardware GPU - Memorie (Modello Cuda) - 2  Constant Memory  64 KB solo lettura per tutti i blocchi  Abbastanza lenta  Latenza piuttosto alta, se dati non in cache  Texture Memory  Solo lettura per ogni blocco  Lenta come Global Memory  Utilizzata per l’interpolazione lineare delle immagini

Architettura Fermi - 1  512 CUDA core  4 GPC (Graphic Processing Cluster)  16 SM  768 KB L2 Cache  4 Raster Engine  1581 GFLOPs  244 W

Architettura Fermi - 2  32 CUDA core  Operazioni di Shading e geometria, oltre ai calcoli puramente computazionali e fisici  16 KB L1 Cache  4 SFU (Special Function Units)  Gestiscono le istruzioni di interpolazione  2 Warp Scheduler  PolyMorph Engine  Gestisce l’output, tessellation

Tessellation - Esempio

Architettura Kepler  1536 CUDA core  4 GPC  8 SMX  512 KB L2 Cache  4 Raster Engine  3090 GFLOPs  195 Watt

Architettura Kepler - SMX  192 CUDA core  64KB L1 Cache  32 SFU  PolyMorph Engine 2.0  4 Warp Scheduler

Fermi vs Kepler  Miglioramento Performance/Watt FermiKepler # Transistor3 miliardi3,54 miliardi CUDA core Core clock772 Mhz1006 Mhz GFLOPs TDP244 W195 W

Conclusioni  GPU è passato da specifici single core, pipeline “Fixed Function” esclusivamente per la grafica a un set di core paralleli e altamente programmabili  Core GPU in continuo aumento

References  GPU History Paper GPU History Paper  Hardware GPU Hardware GPU  Architettura Fermi Architettura Fermi  Architettura Kepler Architettura Kepler