POLITECNICO DI MILANO Politecnico di Milano A.A. 2005/06 MECCANISMI DI SINCRONIZZAZIONE PER SISTEMI MULTIPROCESSORE BASATI SUL DISPOSITIVO D740 Candidato:

Slides:



Advertisements
Presentazioni simili
Implementazione di un sistema di gestione per un IP-Core in ambiente GNU\Linux embedded: Infrared Data Association Relatore: Prof. Fabrizio FERRANDI Correlatore:
Advertisements

Meccanismi di IPC Problemi classici di IPC
UNIVERSITÀ DEGLI STUDI DI PARMA
Referenti: Prof. Anna Antola Ing. Marco Domenico Santambrogio
Francesco Redaelli - Davide Sacchi
Politecnico di Milano Realizzazione di un componente per un sistema dedicato: integrazione del componente RC6 a 128 bit in EDK Relatore: Prof. Fabrizio.
Politecnico di Milano UNA METODOLOGIA PER LA STIMA DELLE RISORSE HARDWARE IN ARCHITETTURE RICONFIGURABILI Relatore: Prof. Fabrizio FERRANDI Correlatore:
Politecnico di Milano Sviluppo di una applicazione per DIOPSIS 740: Rotazione e Ridimensionamento di immagini Sviluppo di una applicazione per DIOPSIS.
Relatore: Prof. Anna Antola
Carlo Di Federico - Matricola n Roberto Gonella - Matricola n
BAnMaT Light: un tool per la rilocazione software dei bitstream
BAnMaT:un framework per l’analisi e la manipolazione di bitstream orientato alla riconfigurabilità parziale Relatore: Prof. Fabrizio FERRANDI.
POLITECNICO DI MILANO Valutazione del tool PlanAhead per la realizzazione di architetture riconfigurabili Chiara Fornoni: Relatore:
Politecnico di Milano Realizzazione di una Applicazione basata su Riconfigurabilit à Dinamica: Riconoscimento di Contorni di Immagini A.A. 2004/2005 Relatore:
Realizzazione di un componente per un sistema dedicato: sviluppo dell’algoritmo di crittografia RC6 a 128 bit Relatore: Prof. Fabrizio Ferrandi Correlatore:
Relatore: Prof. Fabrizio Ferrandi
Politecnico di Milano Sviluppo di strumenti per l'analisi e la manipolazione di bitstream per la riconfigurabilità parziale Relatore: Prof. Fabrizio FERRANDI.
POLITECNICO DI MILANO NERD: Net-based Environment for Reconfigurable Devices Realizzazione di un Framework Distribuito Multi Utente per la Riconfigurabilità
Politecnico di Milano Realizzazione di un algoritmo di controllo per la riconfigurabilit à dinamica di moduli SystemC Relatore: Fabrizio Ferrandi Correlatore:
POLITECNICO DI MILANO DRCP: Come gestire in modo efficiente la riconfigurazione parziale dinamica su FPGA Luca Cerri: Relatore: Prof.
Relatore: Prof. Fabrizio FERRANDI
POLITECNICO DI MILANO Framework per lo sviluppo di descrizioni HW basato su ImpulseC tramite l'uso di algoritmi evolutivi Relatore: prof.ssa Anna Maria.
Stefano Magnoni : Arber Ngjela : Relatore: Prof. Francesco BRUSCHI
1 Processi e Thread Processi Thread Meccanismi di comunicazione fra processi (IPC) Problemi classici di IPC Scheduling Processi e thread in Unix Processi.
1 Processi e Thread Meccanismi di IPC, Inter Process Communication (1)
1 Processi e Thread Meccanismi di IPC (1). 2 Comunicazioni fra processi/thread Processi/thread eseguiti concorrentemente hanno bisogno di interagire per.
Università degli studi di Trieste – Tesi di laurea triennale in Ingegneria elettronica PROTOCOLLO DI COMUNICAZIONE TRA PC E MICROCONTROLLORE PER UN’INTERFACCIA.
Tesi di Laurea Triennale in Ingegneria Elettronica Applicata
Laureando: Marco DALLE FESTE
Relatore:. Prof. Fabrizio FERRANDI Correlatore:. Ing. Marco D
Realizzazione del file system
Realizzazione del file system
Scheduling della CPU Concetti di base Criteri di scheduling
Introduzione al calcolo parallelo SISTEMI INFORMATIVI AZIENDALI Pierpaolo Guerra Anno accademico 2009/2010.
2 luglio 2006URM2 – ING- OOP0304 OL G. Cantone e A. Lomartire 1 Programmazione Orientata agli Oggetti Processi, task e thread Java (ed esempi) Università
MAIS WP5 – Architectures Luca Negri Politecnico di Milano Roma – novembre 05.
Process synchronization
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
Università degli Studi di Roma La Sapienza
Laureando: Nome COGNOME Matricola
CONTROLLO DI SUPPLY CHAIN MEDIANTE TECNICHE H-INFINITO E NEGOZIAZIONE
Struttura dei sistemi operativi (panoramica)
I Thread.
FACOLTÁ DI INGEGNERIA CORSO DI LAUREA INGEGNERIA INFORMATICA Progetto e Sviluppo di un Algoritmo di Scheduling per il Sistema RTAI Candidato: Luca Marzario.
Sistemi Operativi GESTIONE DEI PROCESSI.
Estensioni allarchitettura di Von Neumann Vito Perrone Corso di Informatica A per Gestionali.
Gestione della memoria logica e fisica degli elaboratori x86
INTRODUZIONE l sistema operativo è il primo software che lutente utilizza quando accende il computer; 1)Viene caricato nella memoria RAM con loperazione.
Università di Pisa Facoltà di Ingegneria Corso di laurea in Ingegneria delle Telecomunicazioni Misure su un prototipo di array di antenne in microstriscia.
Università Politecnica delle Marche
TECNICHE DI INPUT/OUTPUT
Relatore: Prof. Carla VACCHI Correlatore: Ing. Daniele SCARPA
PROGETTO DI UN FILTRO POLIFASE FIR DECIMATORE PER IMPIEGO IN UN SISTEMA MULTISTANDARD UMTS-WLAN RELATORE: Prof. Carla Vacchi CORRELATORE: Ing. Everest.
UNIVERSITÀ DEGLI STUDI DI PAVIA
Marco Losito - matr Paola Mussida - matr
Tesi di Laurea in Ingegneria Meccanica
Seconda Università degli Studi di Napoli Facoltà di Economia Corso di Informatica Prof.ssa Zahora Pina.
Stima del flusso ottico per il controllo dei movimenti oculari
Threads.
Pippo.
Prima di iniziare… Durata attività: due lezioni frontali + una lezione laboratorio + compiti per casa Prerequisiti: elementi base architettura dei calcolatori.
1 Introduzione Sistema di calcolo Valutazione dell’impatto delle varie modifiche sulle prestazioni globali del sistema Modifiche all’architettura.
1 Esercitazione finale per il corso di Sistemi Operativi (A.A. 2001/2002)
Sistemi embedded per l’auto: ricevitore GPS
Corso di Laurea in Biotecnologie corso di Informatica Paolo Mereghetti DISCo – Dipartimento di Informatica, Sistemistica e Comunicazione.
Università degli Studi di Firenze Facoltà di Ingegneria Dipartimento di Sistemi e Informatica Corso di Laurea in Ingegneria Informatica Modelli e strumenti.
A.A Roma Tre Università degli studi “Roma Tre” Facoltà di Ingegneria Corso di Laurea in Ingegneria Elettronica Servizi di localizzazione a livello.
INTRODUZIONE AI SISTEMI OPERATIVI. Introduzione Il software può essere diviso un due grandi classi: Il software può essere diviso un due grandi classi:
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
CHORUS EFFECT Sviluppo di Software per l’Acquisizione e l’Elaborazione in Tempo Reale di Segnali su Processori DSP. Università degli Studi del Sannio.
Transcript della presentazione:

POLITECNICO DI MILANO Politecnico di Milano A.A. 2005/06 MECCANISMI DI SINCRONIZZAZIONE PER SISTEMI MULTIPROCESSORE BASATI SUL DISPOSITIVO D740 Candidato: Davide Rossignoli Matricola: Relatore: Prof. Anna Antola Correlatore: Ing. Marco Domenico Santambrogio

2 Sommario Obiettivi Descrizione dellarchitettura D740 e JTST La funzione di cross-correlazione Sincronismo tra i processori con semafori e buffer Sincronismo mediante coda ciclica Test su scheda JTST Conclusioni

3 Applicazione per la cross-correlazione mediante semafori (con problemi di prestazioni globali) + Meccanismo di sincronizzazione a coda ciclica Applicazione per il calcolo della cross-correlazione con coda ciclica Miglioramento prestazioni del sistema globale Obiettivi

4 Chip a due processori: - ARM7TDMI RISC - mAgic DSP Parallelismo e sincronizzazione (mediante Interrupt e PARM) Elevata capacità di calcolo (giga- operazioni/s) Diopsis 740

5 Permette lo scambio di dati tra i due processori 2 modalità di funzionamento: SYSTEM MODE : ARM accede a tutta la memoria mAgic RUN MODE : ARM accede alla PARM In System Mode il mAgic è in attesa! Memoria Condivisa PARM

6 Utilizzata per stabilire una relazione tra due segnali Localizzazione epicentri di eventi sismici Punto di max-somiglianza La cross-correlazione

7 ARM riempie il buffer 1 mAgic preleva dal buffer 2 ARM riempie il buffer 2 mAgic preleva dal buffer 1 Sincronizzazione con semafori Vantaggi Semplice implementazione Svantaggi mAgic sempre in attesa dellARM Basse prestazioni globali Buffer dinamici non risolvono il problema non solo un problema di architettura disponibile

8 2 array contenenti n segnali ciascuno, un array per i risultati e due indici per i processori Posizione del segnale nellarray : Indice nella coda % Lunghezza Coda Segnale in posizione 2 nellarray S1 Segnale in posizione 2 nellarray S2 Risultato tra i due segnali Es: Lunghezza Coda: 4 Indice di un processore: 18 Posizione nella coda: 2 Coda ciclica e cross-correlazione (1)

9 ARMmAgic mAgic non è rimasto troppo indietro, ARM non sovrascrive dati da processare ARM ha già caricato nuovi dati Per stampare solo dati corretti (quindi già elaborati) Coda ciclica e cross-correlazione (2)

10 HyperTerminal ® Prova su scheda JTST (1)

11 Creazione soluzione con utilizzo di un solo processore Creazione soluzione su PC librerie a disposizione per le prestazioni simulazione mediante threads del parallelismo Risultati ottenuti: ARM-only (Scheda) 1 min 10 s (100 iter.) ARM-mAgic (Scheda) 1 min (100 iter.) PROBLEMA: - alcune librerie C non implementate in MADE - mancanza di supporto allanalisi delle prestazioni Singolo processore (PC) 43 s Doppio processore (PC) 30 s Prova su scheda JTST (2)

12 Problemi di prestazioni riscontrati a causa di : accesso lento della memoria condivisa PARM limitatezza della memoria PARM (512 words x 2) Miglioramenti possibili : utilizzo del buffer ADDA System MODE con mappaggio in ARM avendo a disposizione più memoria PARM Considerazioni Simulazione su PC guadagno del 17% nonostante loverhead per i threads Soluzione a singolo processore utilizzando solo ARM non si passa dalla memoria PARM Confronto con la soluzione precedente codice mAgic era ottimizzato a livello ASM buffer dinamici non risolvevano il problema il metodo di sincronizzazione non vincola più le prestazioni migliore gestione della memoria condivisa

13 Possibilità di analizzare le prestazioni nellambiente di sviluppo MADE Ottimizzazioni sorgenti mAgic con codice ASM Caricamento segnali in ADDA e gestione sincronismo mediante SYSTEM MODE Possibili sviluppi futuri

14 Fine Presentazione Grazie per lattenzione!