Sharegrid e la ricerca in campo economico Riccardo Boero Dipartimento di Scienze Economiche e Finanziarie “G. Prato” - UniTo
La struttura ora Accesso al Peer di TOP-IX da una macchina del dipartimento Porta aperta per comunicazione con peer Accesso utenti dipartimento tramite ssh e/o VNC Accesso tramite MyGrid: basta aprire il file tgz
MyGrid da eco83
La struttura domani mattina 2 processori quadcore + 2 core di un altro processore quadcore NUOVI DEDICATI a ShareGrid 512 mega ram per core, upgrade già previsto Aule informatiche???
Applicazioni 3 utilizzi principali –Stima di dati –Neutralizzazione effetti random seed –Esplorazione spazio parametri Per comprendere fenomeni per la progettazione di organizzazioni ottimali ma anche per decidere, governare e valutare le politiche pubbliche
Applicazioni: stima dati 1 Unità di lavoro a tempo equivalente per unità produttiva piemontese –Dato del 2001, completo da censimento –Registro UnionCamere aggiornato: manca occupazione –Conosco valori aggregati Rilevazione Continua Forza Lavoro –Processo di stima per comune (1206), per settore 4 digit ATECO (514), con stimatore a 2 parametri e per oltre 500 mila unità –Algoritmo su distribuzione passato e dati
Applicazioni: stima dati 2 Flussi veicolari –Grafo viabilità –Comportamento indagine mobilità da comune a comune e con che mezzo –Stima tramite modello di “shortest path” della rete e capacità tratti –Ripetizione perché saturazione dipende da quale comune si inizia
Utilizzo modello Piemonte 1 Oltre 500mila agenti Distanze di trasporto Dinamiche probabilistiche Esplorazione spazio parametri
Utilizzo modello Piemonte 2 ~25 mila unità TA Effetti non lineari filiera Esportazioni e innovazioni Stessi motivi prima
Esempio di esecuzione: il modello Piemonte Un singolo file jar di quasi 6 mega Funzionalità di store sulle macchine di ShareGrid Programmino per creare file.jdf con distribuzione adhoc dei parametri (random seed uniformi in un sottinsieme di variabili long accettate dal generatore librerie cern colt): job : label : PAREI_INMENO requirements : environment = gridlabtop task : init : store PAREI.jar PAREI.jar remote : java -jar $STORAGE/PAREI.jar final : get 1.txt results/INMENO/1.txt
In MyGrid:
Utilizzo macchine e vantaggi Finora ambiente TOP-IX (12) Sostanzialmente ShareGrid ha ridotto a 1/12 il tempo di elaborazione Ed era sufficiente per le mie esigenze Ora da un lato non basta più (scalabilità) e dall’altro iniziamo anche a contribuire hardware
Cosa vorrei ancora da ShareGrid Dal middleware, possibilità di accesso ai task in esecuzione in programmazione, in Java, per poter costruire applicazioni di calcolo master-worker per l’ottimizzazione, tipo GA sugli spazi dei parametri Mi basta sapere se un task ha concluso, senza dover fare un parser dello standard output GRAZIE