La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

DIS - Dipartimento di Informatica e Sistemistica Calcolatori Elettronici II Programmazione C/Assembler per i processori ARM Prof. A. Mazzeo Dipartimento.

Presentazioni simili


Presentazione sul tema: "DIS - Dipartimento di Informatica e Sistemistica Calcolatori Elettronici II Programmazione C/Assembler per i processori ARM Prof. A. Mazzeo Dipartimento."— Transcript della presentazione:

1 DIS - Dipartimento di Informatica e Sistemistica Calcolatori Elettronici II Programmazione C/Assembler per i processori ARM Prof. A. Mazzeo Dipartimento di Informatica e Sistemistica Università Degli Studi di Napoli Federico II

2 DIS - Dipartimento di Informatica e Sistemistica Programmazione mista C/Assembly l Le routines che effettuato chiamate ad altri moduli devono rispettare convenzioni comuni per i parametri passati e ricevuti l Per il processore ARM queste convenzioni sono espresse dallARM Procedure Call Standard (APCS)

3 DIS - Dipartimento di Informatica e Sistemistica Lo standard APC l APCS è un insieme di regole per la chiamata di funzioni in segmenti di codici compilati o assemblati separatamente l Definisce: »I vincoli nelluso dei registri »Convenzioni per lo stack »Il formato di uno stack backtrace data structure »Il supporto ai meccanismi di condivisione delle librerie di ARM l Esistono diverse versioni di APCS, non compatibili tra loro, fra cui il programmatore deve scegliere

4 DIS - Dipartimento di Informatica e Sistemistica Chiamata di una routine ASSEMBLY da C l La routine assembly invocata nel programma C deve essere esportata AREA |mul64$$code|, CODE, READONLY EXPORT mul64 mul64 MOV ip, a1, LSR #16 ;ip = a_hi MOV a4, a2, LSR #16 ;a4 = b_hi l Il programma C deve dichiarare che utilizzerà una funzione implementata esternamente extern int64 mul64(unsigned a, unsigned b);

5 DIS - Dipartimento di Informatica e Sistemistica Chiamata di una routine ASSEMBLY da C l La routine assembly invocata nel programma C deve essere esportata AREA |mul64$$code|, CODE, READONLY EXPORT mul64 mul64 MOV ip, a1, LSR #16 ;ip = a_hi MOV a4, a2, LSR #16 ;a4 = b_hi l Il programma C deve dichiarare che utilizzerà una funzione implementata esternamente extern int64 mul64(unsigned a, unsigned b); Esporta il simbolo per renderlo visibile allesterno Esporta il simbolo per renderlo visibile allesterno ip <-parte alta di a a4 <-parte alta di b ip <-parte alta di a a4 <-parte alta di b

6 DIS - Dipartimento di Informatica e Sistemistica Uso e denominazione dei registri l Tutti i registri che non sono utilizzati nel ruolo per essi definito dallAPCS possono essere usati come registri generali

7 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 1/5 l Realizzare la somma tra due interi a 64 bit l Un programma C che realizzi una tale operazione non ha accesso al flag di carry dello Status Register l Il programma C a tale scopo realizzato (ARM_home\examples\candasm\ADD64_1.C) potrebbe essere: void add_64(int64 *dest, int64 *src1, int64 *src2) { unsigned hibit1=src1->lo >> 31, hibit2=src2->lo >> 31, hibit3; dest->lo=src1->lo + src2->lo; hibit3=dest->lo >> 31; dest->hi=src1->hi + src2->hi + ((hibit1 & hibit2) || (hibit1!= hibit3)); return; }

8 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 2/5 l Compilare il file add64_1.c armcc –apcs 3/32bit –S add64_1.c »Il flag –apcs 3/32bit forza lutilizzo dellAPCS 3 nella versione a 32 bit »Visualizzare il file add64_1.s contenente il codice assembly generato

9 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 3/5 AREA |C$$code|, CODE, READONLY |x$codeseg| DATA add_64 STMDB sp!,{v1,lr} LDR v1,[a2,#0] MOV a4,v1,LSR #31 LDR ip,[a3,#0] MOV lr,ip,LSR #31 ADD ip,v1,ip STR ip,[a1,#0] MOV ip,ip,LSR #31 LDR a2,[a2,#4] LDR a3,[a3,#4] ADD a2,a2,a3 TST a4,lr TEQEQ a4,ip MOVNE a3,#1 MOVEQ a3,#0 ADD a2,a2,a3 STR a2,[a1,#4]! LDMIA sp!,{v1,pc} AREA |C$$data|,DATA |x$dataseg| EXPORT add_64 END È immediato verificare che il codice ottenuto non risulta essere efficiente

10 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 3/5 AREA |C$$code|, CODE, READONLY |x$codeseg| DATA add_64 STMDB sp!,{v1,lr} LDR v1,[a2,#0] MOV a4,v1,LSR #31 LDR ip,[a3,#0] MOV lr,ip,LSR #31 ADD ip,v1,ip STR ip,[a1,#0] MOV ip,ip,LSR #31 LDR a2,[a2,#4] LDR a3,[a3,#4] ADD a2,a2,a3 TST a4,lr TEQEQ a4,ip MOVNE a3,#1 MOVEQ a3,#0 ADD a2,a2,a3 STR a2,[a1,#4]! LDMIA sp!,{v1,pc} AREA |C$$data|,DATA |x$dataseg| EXPORT add_64 END È immediato verificare che il codice ottenuto non risulta essere efficiente INFATTI ACCEDE ALLO STACK ANCHE PER UN SALVATAGGIO DI CONTESTO CHE COINVOLGE POCHI REGISTRI RISPETTO A QELLI DI CUI DISPONE INFATTI ACCEDE ALLO STACK ANCHE PER UN SALVATAGGIO DI CONTESTO CHE COINVOLGE POCHI REGISTRI RISPETTO A QELLI DI CUI DISPONE

11 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 3/5 AREA |C$$code|, CODE, READONLY |x$codeseg| DATA add_64 STMDB sp!,{v1,lr} LDR v1,[a2,#0] MOV a4,v1,LSR #31 LDR ip,[a3,#0] MOV lr,ip,LSR #31 ADD ip,v1,ip STR ip,[a1,#0] MOV ip,ip,LSR #31 LDR a2,[a2,#4] LDR a3,[a3,#4] ADD a2,a2,a3 TST a4,lr TEQEQ a4,ip MOVNE a3,#1 MOVEQ a3,#0 ADD a2,a2,a3 STR a2,[a1,#4]! LDMIA sp!,{v1,pc} AREA |C$$data|,DATA |x$dataseg| EXPORT add_64 END È immediato verificare che il codice ottenuto non risulta essere efficiente Store a blocchi: Salva con una istruzione Più registri a partire da SP Store a blocchi: Salva con una istruzione Più registri a partire da SP Load a blocchi: Carica con una istruzione più registri Load a blocchi: Carica con una istruzione più registri

12 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 4/5 l Partiamo da codice C per la somma a 64 bit senza considerare il flag di Carry (add64_2.c) #include "int64.h" void add_64(int64 *dest, int64 *src1, int64 *src2) { dest->lo=src1->lo + src2->lo; dest->hi=src1->hi + src2->hi; return;} l Ottenere il codice assembly armcc –li –apcs 3/32bit –S add64_2.c

13 DIS - Dipartimento di Informatica e Sistemistica Perché programmare in Assembly 5/5 add_64 LDR a4,[a2,#0] LDR ip,[a3,#0] ADD a4,a4,ip STR a4,[a1,#0] LDR a2,[a2,#4] LDR a3,[a3,#4] ADD a2,a2,a3 STR a2,[a1,#4]! MOV pc,lr Analizzando il codice si osserva che la prima ADD produce la low order word mentre la seconda la high order word. Il codice desiderato può essere ottenuto semplicemente sostituendo la prima ADD con ADDS (ADD e SET flag) e la seconda con ADC (ADD with Carry) ADDS a4,a4,ip ADC a2,a2,a3

14 DIS - Dipartimento di Informatica e Sistemistica Leffetto dellAPCS l a1 contiene un puntatore alla struttura di output della funzione l a2 ed a3 contengono i puntatori alle strutture passate in input alla funzione l a4 ed ip sono utilizzati in luogo dei registri v per non salvare il contenuto di tali registri sullo stack l Nessun registro è stato salvato sullo stack per il ritorno dalla funzione basta MOV pc,lr l Per ritornare un valore, ad esempio il valore del flag di carry, usare il registro a1 MOVa1, #0 ADCa1, a1, #0 »Il codice è disponibile nel file (ARM_home\examples\candasm\add64_3.s)

15 DIS - Dipartimento di Informatica e Sistemistica Salvataggio dei registri sullo stack l Tornando alla prima versione dellassembly possiamo osservare che essendo utilizzati localmente i registri v1 ed lr sono preservati sullo stack l Il ritorno dalla funzione è ottenibile mediante LDMIA sp!,{v1,pc} add_64 STMDB sp!,{v1,lr} LDR v1,[a2,#0] MOV a4,v1,LSR #31 LDR ip,[a3,#0] MOV lr,ip,LSR #31 ADD ip,v1,ip STR ip,[a1,#0] MOV ip,ip,LSR #31 LDR a2,[a2,#4] LDR a3,[a3,#4] ADD a2,a2,a3 TST a4,lr TEQEQ a4,ip MOVNE a3,#1 MOVEQ a3,#0 ADD a2,a2,a3 STR a2,[a1,#4]! LDMIA sp!,{v1,pc}

16 DIS - Dipartimento di Informatica e Sistemistica Dettagli sullAPCS 1/2 l I registri sb, sl, fp, ip, sp sono utilizzati con funzioni dedicate nellAPCS; laddove non dovessero essere utilizzati per i ruoli definiti dallAPCS i registri possono essere utilizzati come registri generali l Le funzioni definite dallAPCS per i registri dedicati: »ip Utilizzato esclusivamente durante le chiamate di funzione. È convenzionalmente utilizzato come un registro locare. In altri casi può essere utilizzato come un registro temporaneo corruttibile »lrContiene lindirizzo di ritorno alluscita dalla funzione. Può essere utilizzato come registro temporaneo preservandone il valore sullo stack. Questultimo valore può essere direttamente ricaricato nel PC

17 DIS - Dipartimento di Informatica e Sistemistica Dettagli sullAPCS 2/2 »spstack pointer »slstack limit, utilizzato se il controllo dei limiti dello stack è esplicito (cioè realizzato dal codice in occorrenza di un push sullo stack). Se il controllo è implicito (effettuato dallhardware) il registro può essere utilizzato come v7. »fpframe pointer. Contiene o zero o un puntatore allultimo frame generato sullo stack. »sbstatic base. Nel caso di codice rientrante consente laccesso ad un array di puntatori a dati statici. Nel caso di codice non rientrante può essere usato come v6.

18 DIS - Dipartimento di Informatica e Sistemistica Passaggio e ritorno di strutture 1/3 l Generalmente le strutture sono passate attraverso registri o eventualmente (se le dimensioni o il numero lo esigessero) attraverso lo stack. l Il registro a1 punta allarea di memoria utilizzata per la memorizzazione dei risultati (per funzioni che ritornano strutture) »È come se struct s f(int x) fosse compilata come void f(struct s *result, int x)

19 DIS - Dipartimento di Informatica e Sistemistica Passaggio e ritorno di strutture 2/3 Si consideri il seguente codice ( ARM_home\candasm\two_ch.c ) typedef struct two_ch_struct { char ch1; char ch2; } two_ch; two_ch max( two_ch a, two_ch b ) { return (a.ch1>b.ch1) ? a : b; } »Il codice assembly corrispondente può essere ottenuto mediante armcc –S two_ch.c –apcs 3/32bit

20 DIS - Dipartimento di Informatica e Sistemistica Passaggio e ritorno di strutture 3/3 l Il codice assembly corrispondente evidenzia che: »Gli argomenti, il frame pointer, lo stack pointer, il link register e il current pc, sono salvati sullo stack (nellordine inverso rispetto a quello in cui sono stati elencati essendo lo stack discendente) »a2 ed a3 sono usati come variabili temporanee e memorizzano la parte di interesse delle strutture passate »a1 è un puntatore allarea di memoria in cui porre i risultati max MOV ip,sp STMDB sp!,{a1-a3,fp,ip,lr,pc} SUB fp,ip,#4 LDRB a3,[fp,#-&14] LDRB a2,[fp,#-&10] CMP a3,a2 SUBLE a2,fp,#&10 SUBGT a2,fp,#&14 LDR a2,[a2,#0] STR a2,[a1,#0] LDMDB fp,{fp,sp,pc}

21 DIS - Dipartimento di Informatica e Sistemistica Ritorno di strutture integer-like 1/3 l Una integer-like structure: »È non più grande di una parola »Ha campi per i quali il byte offset è nullo l Ad esempio sono integer-like structure structunion polymorphic_ptr{ unsigned a:8, b:8, c:8, d:8; struct A *a; } struct B *b; int *i; } »Non è un integer-like structure quella dellesempio precedente l Una integer like structure ha il suo valore di ritorno in a1

22 DIS - Dipartimento di Informatica e Sistemistica Ritorno di strutture integer-like 2/3 l Si consideri il codice seguente (half_str.c) typedef struct half_words_struct { unsigned field1:16; unsigned field2:16; } half_words; half_words max( half_words a, half_words b ) { half_words x; x= (a.field1>b.field1) ? a : b; return x;} l Mediante lopzione –S si ottenga il codice assembly corrispondente armcc –S half_str.c –apcs 3/32bit

23 DIS - Dipartimento di Informatica e Sistemistica Ritorno di strutture integer-like 3/3 l Il codice ottenuto evidenzia che il valore della struttura è ritornato direttamente in a1 max MOV a3,a1,LSL #16 MOV a3,a3,LSR #16 MOV a4,a2,LSL #16 MOV a4,a4,LSR #16 CMP a3,a4 MOVLE a1,a2 MOV pc,lr

24 DIS - Dipartimento di Informatica e Sistemistica Ritorno di integer-like stuctures mediante registri 1/5 l Utilizzando il registri come puntatori per lo scambio di strutture si ha un overhead elevato. l Luso della keyword __value_in_regs forza il passaggio delle strutture di dimensioni inferiori alle quattro parole attraverso i registri argomento a1-a4

25 DIS - Dipartimento di Informatica e Sistemistica Ritorno di integer-like stuctures mediante registri 2/5 l Problema: realizzare una routine ottimizzata per il prodotto di interi a 64 bit. l Il codice C non sarebbe ottimizzato (C flag) l Luso della memoria è da evitare. l Si consideri il codice contenuto nei file mul64.s, mul64.h, int64.h e multest.c

26 DIS - Dipartimento di Informatica e Sistemistica Ritorno di integer-like stuctures mediante registri 3/5 l Il file mul64.s evidenzia che la struttura è ritornata attraverso i registri a1 ed a2 Mul64MOV ip, a1, LSR #16 MOV a4, a2, LSR #16 BIC a1, a1, ip, LSL #16 BIC a2, a2, a4, LSL #16 MUL a3, a1, a2 MUL a2, ip, a2 MUL a1, a4, a1 MUL a4, ip, a4 ADDS ip, a2, a1 ADDCS a4, a4, #&10000 ADDS a1, a3, ip, LSL #16 ADC a2, a4, ip, LSR #16 MOV pc, lr

27 DIS - Dipartimento di Informatica e Sistemistica Ritorno di integer-like stuctures mediante registri 4/5 l Affinché ciò avvenga nel file int64.h la funzione mul64 è dichiarata come segue __value_in_regs extern int64 mul64(unsigned a, unsigned b); l Per compilare, assemblare e lincare i file si proceda come segue armasm mul64.s –o mul64.o armcc –c multest.c –apcs 3/32bit Armlink mul64.o multest.o –o multest

28 DIS - Dipartimento di Informatica e Sistemistica Ritorno di integer-like stuctures mediante registri 5/5 l Per lesecuzione > armsd -li multest A.R.M. Source-level Debugger, version 4.10 (A.R.M.) [Aug 26 1992] ARMulator V1.20, 512 Kb RAM, MMU present, Demon 1.01, FPE, Little endian. Object program file multest armsd: go Enter two unsigned 32-bit numbers in hex eg.(100 FF43D) 12345678 10000001 Least significant word of result is 92345678 Most significant word of result is 1234567 Program terminated normally at PC = 0x00008418 0x00008418: 0xef000011.... : > swi 0x11 armsd: quit Quitting >

29 DIS - Dipartimento di Informatica e Sistemistica


Scaricare ppt "DIS - Dipartimento di Informatica e Sistemistica Calcolatori Elettronici II Programmazione C/Assembler per i processori ARM Prof. A. Mazzeo Dipartimento."

Presentazioni simili


Annunci Google