1 Macchine astratte, linguaggi, interpretazione, compilazione
2 Macchine astratta §una collezione di strutture dati ed algoritmi in grado di memorizzare ed eseguire programmi §componenti della macchina astratta l interprete l memoria (dati e programmi) l controllo l operazioni “primitive” Interprete Programma Dati op1 op2 …... opn Controllo Operazioni primitive Memoria
3 Il componente di controllo §una collezione di strutture dati ed algoritmi per l acquisire la prossima istruzione l gestire le chiamate ed i ritorni dai sottoprogrammi l acquisire gli operandi e memorizzare i risultati delle operazioni l mantenere le associazioni fra nomi e valori denotati l gestire dinamicamente la memoria l …...
4 L’interprete controllo operazioni start stop acquisisci la prossima istruzione decodifica acquisisci gli operandi seleziona esegui op1esegui op2esegui opnesegui alt... memorizza il risultato
5 Il linguaggio macchina M macchina astratta L M linguaggio macchina di M è il linguaggio che ha come stringhe legali tutti i programmi interpretabili dall’interprete di M §i programmi sono particolari dati su cui opera l’interprete
6 Macchine astratte: implementazione M macchina astratta i componenti di M sono realizzati mediante strutture dati ed algoritmi implementati nel linguaggio macchina di una macchina ospite M O, già esistente (implementata) è importante la realizzazione dell’interprete di M può coincidere con l’interprete di M O M è realizzata come estensione di M O altri componenti della macchina possono essere diversi può essere diverso dall’interprete di M O M è realizzata su M O in modo interpretativo altri componenti della macchina possono essere uguali
7 Dal linguaggio alla macchina astratta M macchina astratta L M linguaggio macchina di M L linguaggio M L macchina astratta di L implementazione di L = realizzazione di M L su una macchina ospite M O se L è un linguaggio ad alto livello ed M O è una macchina “fisica” l’interprete di M L è necessariamente diverso dall’interprete di M O M L è realizzata su M O in modo interpretativo l’implementazione di L si chiama interprete esiste una soluzione alternativa basata su tecniche di traduzione (compilatore?)
8 Implementare un linguaggio L linguaggio ad alto livello M L macchina astratta di L M O macchina ospite implementazione di L 1: interprete (puro) M L è realizzata su M O in modo interpretativo l scarsa efficienza, soprattutto per colpa dell’interprete (ciclo di decodifica) implementazione di L 2: compilatore (puro) i programmi di L sono tradotti in programmi funzionalmente equivalenti nel linguaggio macchina di M O i programmi tradotti sono eseguiti direttamente su M O M L non viene realizzata l il problema è quello della dimensione del codice prodotto §due casi limite che nella realtà non esistono quasi mai
9 La macchina intermedia L linguaggio ad alto livello M L macchina astratta di L M I macchina intermedia L M I linguaggio intermedio M O macchina ospite traduzione dei programmi da L al linguaggio intermedio L M I + realizzazione della macchina intermedia M I su M O MLML MIMI MOMO Programma in LProgramma in L M I realizzazione traduzione
10 Interpretazione e traduzione pura M L = M I interpretazione pura M O = M I traduzione pura possibile solo se la differenza fra M O e M L è molto limitata L linguaggio assembler di M O l in tutti gli altri casi, c’è sempre una macchina intermedia che estende eventualmente la macchina ospite in alcuni componenti MLML MIMI MOMO Programma in LProgramma in L M I realizzazione traduzione
11 Il compilatore quando l’interprete della macchina intermedia M I coincide con quello della macchina ospite M O che differenza c’è tra M I e M O ? l il supporto a tempo di esecuzione (rts) collezione di strutture dati e sottoprogrammi che devono essere caricati su M O (estensione) per permettere l’esecuzione del codice prodotto dal traduttore (compilatore) M I = M O + rts il linguaggio L M I è il linguaggio macchina di M O esteso con chiamate al supporto a tempo di esecuzione
12 A che serve il supporto a tempo di esecuzione? §un esempio da un linguaggio antico (FORTRAN) l praticamente una notazione “ad alto livello” per un linguaggio macchina §in linea di principio, è possibile tradurre completamente un programma FORTRAN in un linguaggio macchina puro, senza chiamate al rts, ma... l la traduzione di alcune primitive FORTRAN (per esempio, relative all’I/O) produrrebbe centinaia di istruzioni in linguaggio macchina se le inserissimo nel codice compilato, la sua dimensione crescerebbe a dismisura in alternativa, possiamo inserire nel codice una chiamata ad una routine (indipendente dal particolare programma) tale routine deve essere caricata su M O ed entra a far parte del rts §nei veri linguaggi ad alto livello, questa situazione si presenta per quasi tutti i costrutti del linguaggio l meccanismi di controllo l non solo routines ma anche strutture dati
13 Il caso del compilatore C §il supporto a tempo di esecuzione contiene l varie strutture dati la pila dei records di attivazione –ambiente, memoria, sottoprogrammi, … la memoria a heap –puntatori,... l i sottoprogrammi che realizzano le operazioni necessarie su tali strutture dati §il codice prodotto è scritto in linguaggio macchina esteso con chiamate al rts
14 Implementazioni miste quando l’interprete della macchina intermedia M I non coincide con quello della macchina ospite M O esiste un ciclo di interpretazione del linguaggio intermedio L M I realizzato su M O l per ottenere un codice tradotto più compatto l per facilitare la portabilità su diverse macchine ospiti si deve riimplementare l’interprete del linguaggio intermedio non è necessario riimplementare il traduttore
15 Compilatore o implementazione mista? §nel compilatore non c’è di mezzo un livello di interpretazione del linguaggio intermedio l sorgente di inefficienza la decodifica di una istruzione nel linguaggio intermedio (e la sua trasformazione nelle azioni semantiche corrispondenti) viene effettuata ogni volta che si incontra l’istruzione §se il linguaggio intermedio è progettato bene, il codice prodotto da una implementazione mista ha dimensioni inferiori a quelle del codice prodotto da un compilatore §un’implementazione mista è più portabile di un compilatore §il supporto a tempo di esecuzione di un compilatore si ritrova quasi uguale nelle strutture dati e routines utilizzate dall’interprete del linguaggio intermedio
16 L’implementazione di Java §è un’implementazione mista l traduzione dei programmi da Java a byte-code, linguaggio macchina di una macchina intermedia chiamata Java Virtual Machine l i programmi byte-code sono interpretati l l’interprete della Java Virtual Machine opera su strutture dati (stack, heap) simili a quelle del rts del compilatore C la differenza fondamentale è la presenza di una gestione automatica del recupero della memoria a heap (garbage collector) l su una tipica macchina ospite, è più semplice realizzare l’interprete di byte-code che l’interprete di Java byte-code è più “vicino” al tipico linguaggio macchina
17 Tre famiglie di implementazioni §interprete puro M L = M I interprete di L realizzato su M O l alcune implementazioni (vecchie!) di linguaggi logici e funzionali LISP, PROLOG §compilatore macchina intermedia M I realizzata per estensione sulla macchina ospite M O (rts, nessun interprete) C, C++, PASCAL §implementazione mista traduzione dei programmi da L a L M I i programmi L M I sono interpretati su M O Java i “compilatori” per linguaggi funzionali e logici (LISP, PROLOG, ML) alcune (vecchie!) implementazioni di Pascal (Pcode)
18 Implementazioni miste e interpreti puri §la traduzione genera codice in un linguaggio più facile da interpretare su una tipica macchina ospite §ma soprattutto può effettuare una volta per tutte (a tempo di traduzione, staticamente) analisi, verifiche e ottimizzazioni che migliorano l l’affidabilità dei programmi l l’efficienza dell’esecuzione §varie proprietà interessate l inferenza e controllo dei tipi l controllo sull’uso dei nomi e loro risoluzione “statica” l ….
19 Analisi statica §dipende dalla semantica del linguaggio §certi linguaggi (LISP) non permettono praticamente nessun tipo di analisi statica l a causa della regola di scoping dinamico nella gestione dell’ambiente non locale §altri linguaggi funzionali più moderni (ML) permettono di inferire e verificare molte proprietà (tipi, nomi, …) durante la traduzione, permettendo di l localizzare errori l eliminare controlli a tempo di esecuzione type-checking dinamico nelle operazioni l semplificare certe operazioni a tempo di esecuzione come trovare il valore denotato da un nome
20 Analisi statica in Java §Java è fortemente tipato l il type checking può essere in gran parte effettuato dal traduttore e sparire quindi dal byte-code generato §le relazioni di subtyping permettono che una entità abbia un tipo vero (actual type) diverso da quello apparente (apparent type) l tipo apparente noto a tempo di traduzione l tipo vero noto solo a tempo di esecuzione l è garantito che il tipo apparente sia un supertype di quello vero §di conseguenza, alcune questioni legate ai tipi possono solo essere risolte a tempo di esecuzione l scelta del più specifico fra diversi metodi overloaded l casting (tentativo di forzare il tipo apparente ad un suo possibile sottotipo) l dispatching dei metodi (scelta del metodo secondo il tipo vero) §controlli e simulazioni a tempo di esecuzione