1 Class Analyses as Abstract Interpretations of Trace Semantics Tratto da un testo di: Fausto Spoto & Thomas Jensen Brigo Matteo Vitturi Mattia
2 Sommario Introduzione Un semplice linguaggio Stati concreti Trace semantics Watchpoint semantics Analisi e Valutazioni
3 Introduzione Studieremo una trace semantic per un semplice linguaggio imperativo orientato agli oggetti attraverso luso di watchpoints Per far ciò definiremo una gerarchia di semantiche Lo scopo è quello di verificare che la semantica che otterremo alla fine sarà focalizzata sui watchpoint Ogni astrazione del dominio computazionale arriva sempre ad una semantica ancora orientata ai watchpoint
4 Gerarchie di semantiche
5 Un semplice linguaggio Definiamo ora il linguaggio su cui effettueremo le operazioni di astrazione Si tratta di un linguaggio object-oriented basato su java In tale linguaggio ogni espressione ha un tipo
6 I Tipi Tale tipo può essere int (lunico tipo base) o una classe definita dallutente Un Type Environment assegna a un insieme finito di variabili il loro tipo Id: Insieme di identificatori contente out e this K: Insieme di classi ordinate da una relazione di sottoclasse tale che sia una relazione di ordine parziale completo Type: linsieme dei tipi dato da {int} unito a K Vars: Sottoinsieme di Id contenente ancora out e this
7 Espressioni [1] Le variabili locali sono introdotte da un costrutto let I punti del programma dove lanalisi statica deve essere incentrata devono essere definiti come watchpoint I booleani sono interi (true se >=0, false altrimenti)
8 Espressioni [2] La grammatica è definita come segue: Con: t Type, k K, i Z, f,m Id, v,v,v1,…,vn Vars vthis. Gli operatori + e = operano come operatori su interi Il costrutto let non introduce variabili già presenti in scope
9 Ulteriori definizioni [1] Una classe contiene: Variabili locali (fields) Funzioni (methods) Un metodo ha un insieme di variabili di input/output (parameters) in cui è incluso out, che contiene il risultato, e this, ovvero loggetto dove è stato chiamato il metodo Fields è un insieme di mappe che uniscono ogni classe con il Type Environment delle sue variabili locali (this non può essere un field)
10 Ulteriori definizioni [2] Methods è un insieme di mappe complete che associa i metodi di ciascuna classe con un insieme finito di identificatori di metodi Par è un insieme di mappe che unisce ogni metodo con il Type Environment dei sui parametri Code è un insieme di mappe che unisce ogni metodo con il suo codice sintatticamente corretto e type-checked
11 Assunzioni [1] Segue una lista di assunzioni fatte sul programma Prog da analizzare, specificato da una relazione dordine K*, un insieme M, una mappa F appartenente a Fields, una mappa M appartenente a Methods, una mappa P appartenente a Pars e una mappa C appartenente a Code.
12 Assunzioni [2] Siano k1,k2 appartenenti a K con k1 k2, si ha che: 1.dom(F(k1)) dom(F(k2)) e F(k1) | dom(F(k2))= (k2) (i field sono ereditati); 2.dom(M(k1)) dom(M(k2)) (methods sono ereditati o overridden); 3.Sia m appartenente a dom(M(k2)); allora pars=dom(P(M(k1)(m)))=dom(P(M(k2)(m))) (il nome e numero dei parametri in caso di overriding non varia);
13 Assunzioni [3] 4.Sia v appartenente a pars\{out, this}; allora P(M(k1)(m))(v) P(M(k2)(m))(v) (i parametri di input diversi da this sono una specializzazione upward) 5.Sia v appartenente a {out, this}; allora P(M(k2)(m))(v) P(M(k1)(m))(v) (out e this sono una specializzazione downward) 6.Sia k appartenente a K e m appartenente a dom(M(k)); allora P(M(k)(m))(this) k (la variabile this di un metodo ha un tipo che è superclasse del tipo della classe del metodo); 7.Sia v appartenente a M; allora il codice C(v) è type-checked e tutte le variabili che occorrono sono generate da un construtto let o sono tra i parametri P(v).
14 Esempio [1]
15 Esempio [2]
16 Stati concreti Per rappresentare valori concreti abbiamo bisogno di valori interi, nil e location ovvero la posizione in memoria dove si trova il dato Nei dati concreti vi sarà un environment dove sono definite le variabili e una memory dove sarà rappresentata la mappa che unisce variables a locations
17 Environment E costituito da coppie Type Value dove: Value rappresenta un valore intero, una location o nil Se Type è intero Value sarà intero, mentre varrà nil o una location nel caso in cui Type sia appartenente a K La correttezza di tipo ci assicura che: non ci siano puntatori pendenti le variabili siano collegate a locations che contengono oggetti permessi dal loro environment
18 Possibili stati I possibili stati in un certo punto del programma sono dati dalle coppie (variabile,valore associato) Memoria La variabile this non potrà avere valore nil Questo porterà ad una semplificazione sostanziale durante lo studio delle analisi Tale definizione è consistente con la specifica di Java
19 Operazioni sugli stati [1]
20 Operazioni sugli stati [2]
21 Semantica delle operazioni La put_field(σ1)(σ2) memorizza il valore res dello stato σ2 in v, che altro non è che la variabile fornito da σ1 nelloggetto o.
22 Trace semantic [1] Sia T un insieme di sequenze non vuote di computazioni, dove σ rappresenta ciascuna traccia. Una sequenza di tracce sarà: Convergente, qualora la sua denotazione possa essere completamente computata e la sua esecuzione termina Divergente, qualora un pezzo di codice esegua un loop infinito Parziale, qualora una parte di codice non possa completamente eseguita se contiene metodi non stabili σ 1 … σ n rappresenta una computazione convergente I watchpoint sono rappresentati dalle frecce identificate con una etichetta ( l )
23 Trace semantic [2] Sia t appartenente a T: fst(t) indica il primo stato di t con(t): indica che t è convergente Se con(t) allora lultimo stato di t è lst(t) I comandi e le espressioni sono identificati ad una mappa da uno stato iniziale a una traccia t. Per le espressioni se con(t) allora lst(t)(res) è il valore dellespressione.
24 Trace semantic [3] Lordinamento sulle tracce viene fatto dando una semantica a punti fissi alle istruzioni iterative (istruzione while) ed ai metodi ricorsivi. Listruzione while viene trattata seguendo il pattern standard definito per le semantiche denotazionali while-loops Lordinamento sulle tracce è un CPO
25 Operazioni sulle tracce [1] Firma delle operazioni sulle tracce
26 Operazioni sulle tracce [2]
27 Watchpoint semantics [1] Siamo dunque interessati unicamente alle transizioni etichettate Queste ultime possono essere individuate tramite la collezione di stati che sono preceduti da una transizione etichettata Possiamo definire unastrazione: w: T (Label P(Σ))
28 Perché una nuova semantica? Per definizione w(t) è più astratto di t e richiede meno spazio in memoria, ciò è dovuto a Una computazione a punti fissi più astratta richiede meno iterazioni Possiamo unire più watchpoint durante il calcolo dei punti fissi (come nel caso di while e do c, dove c ha un watchpoint) Le strutture dati sono più piccole Si elimina loperazione di widening necessaria nelle trace semantic per evitare tracce infinite
29 Watchpoint semantics [2] Vogliamo osservare gli stati solo nei watchpoint. Quindi: Vedremo una traccia come un insieme di stati, Un insieme di stati per ogni watchpoint. Le watchpoint bags sono linsieme di possibili Type Environment ottenibili da una etichetta l. Nota: vengono usate per raccogliere informazioni sui watchpoint.
30 Da traces a watchpoint traces Lastrazione da traces a watchpoint traces avviene grazie alla funzione Dove la funzione w(t) appartiene ad una watchpoint bag e α w è la funzione che trasforma la traccia in una watchpoint traces.
31 Watchpoint semantic statica Serve per ottenere informazioni sulle proprietà degli stati Si tratta di una AI di una semantica statica e possiamo ancora chiamarla statica Parte dellinformazione viene persa durante lastrazione, che unisce tutti i percorsi di esecuzione in una watchpoint trace statica
32 Esempio Linsieme delle tracce S è tale che, se lo stato finale è σ 1 non viene osservato nessun watchpoint e α st non contiene più questa informazione
33 Watchpoint semantic astratta La WS statica usa elementi del P(Σ), elementi del watchpoint bag e denotazioni statiche. La WS astratta riduce questi elementi alle operazioni sulle denotazioni statiche. La WS astratta è dunque una semplificazione della WS statica Sarà la WS usata dalle nostre Class Analyses
34 Analisi e Valutazioni Definiamo 3 class analyses: Rapid type analysis (rt) Dataflow analysis (df) Constraint analysis (ps) Per ognuna di queste viene definito un dominio astratto e le operazioni astratte ottimali che induce Quali sono gli obiettivi? Mostrare la relazione tra tempo e lo spazio necessari per numero di watchpoints analizzati Dimostrare lefficacia del framework proposto per il test di analisi
35 Rapid Type Analysis In termini di AI, questa tecnica equivale a definire unastrazione che raccoglie le classi degli oggetti nella memoria degli stati Raccoglie linsieme N di classi create dal comando new Le classi di una espressione e in un type environment sono N type (e) Deve contenere una classe compatibile con il tipo di this Nota: ha una bassa precisione, ma la sua importanza è data dalla sua applicabilità
36 Dataflow Analysis Ogni variabile è approssimata per eccesso dallinsieme delle classi degli oggetti limitati a tale variabile negli stati concreti I campi sono astratti nella loro approssimazione peggiore Un environment astratto mappa variabili a valori astratti consistenti con il loro tipo
37 Constraint analysis Ad ogni variabile di programma e campo è dato un insieme di classi Tali insiemi sono correlati tra di loro da delle restrizioni che modellano il dataflow del programma Il suo dominio è composto da un abstract environment, identico a quello dellanalisi df, e da una memoria astratta (ossia un abstract environment per i fields delle classi) Si suppone che i fields possano essere identificati unicamente dal loro nome Poiché la WS definita è flow sensitive, la stessa variabile può avere approssimazioni diverse in punti diversi del programma
38 Valutazioni Sperimentali E stato usato per eseguire i test un analizzatore chiamato LOOP (Localized for Object-Oriented Programs), che fornisce unimplementazione in PROLOG della WS presentata Per effettuare i benchmark sono stati usate come applicazioni di test 4 programmi: clone visit inv figures La macchina su cui sono stati effettuati i test è un Pentium III 660Mhz con 512MB di RAM
39 LOOP analyser: implementa la semantica a tracce semantic: implementa le sue operazioni combinators: le operazioni sono compilate come chiamate a metodo typenv: implementa il type environment aux: implementa funzioni ausiliarie
40 Esempi di Analisi: rt
41 Esempi di Analisi: df
42 Esempi di Analisi: ps
43 Risultati