LIBI e BioinfoGRID Giorgio Maggi INFN e Dipartimento Interateneo di Fisica - Politecnico di Bari 29 agosto 2007
G. Maggi 29 agosto 2007 Le persone Il progetto BioinfoGRID si conclude il 31 dicembre 2007 Il progetto LIBI conclude il suo secondo anno il 12 sett 2007 e andrà avanti ancora per due anni (più eventuali prolungamenti).
G. Maggi 29 agosto 2007 L’attività svolta Biomed Grid School Villa Monastero, Varenna, Italy, May 2007 5 giorni di scuola dal lunedì al venerdì 32 studenti Deliverables BioinfoGRID BioinfoGRID_D6.3 (INFN+ITB): Report and CD-ROM of the Grid technical training courses lessons BioinfoGRID_D4.2 (ITB+INFN): Report on performance evaluation of Functional Analogous Finder.
G. Maggi 29 agosto 2007 L’attività svolta Valutazione tools di accesso a database relazionali da grid
DB Access tools -- LIBI Meeting July 2007 TESTBED Lecce Catania Trieste Padova CNAF Bologna Test Database: Bioinformatics database containing just a “molecule table” with about tuples (350MB, PostgreSQL ). Other Databases: Sakila (MySQL 23 tables) World (MySQL 6 tables) Dellstore ( PostgreSQL 8 tables) uniutrdb_test (MySQL 35 tables) go_5_06 (MySQL 18 tables) homo_sapiens (MySQL 74 tables) 2MASS (PostgreSQL) Population db ( PostgreSQL ) I DB sono installati su 2 DB server configurati in alta disponibilità, che possono essere usati per qualunque necessità di LIBI GRelC G-DSE OGSA-DAI AMGA Bari
DB Access tools -- LIBI Meeting July 2007 preliminary results
DB Access tools -- LIBI Meeting July 2007 preliminary results
DB Access tools -- LIBI Meeting July 2007 preliminary results G. Donvito et al. - Comparative evaluation of tools providing access to different types of data resources exposed on the Grid - oral presentation to the EGEE User Forum 07
G. Maggi 29 agosto 2007 L’attività svolta
G. Maggi 29 agosto 2007 L’attività svolta Porting ed esecuzione di applicazioni di bioinformatica (challenges) A Tulipano et al. - Gene Analogue Finder: a GRID solution for finding functionally analogous gene products. - accettato per la pubblicazione su BMC Bioinformatics. L.Carota et al. - Grid efficiency for high throughput and data-intensive analysis of bacterial genomic sequences. - Poster EGEE User Forum 07 F. Mignone et al. - CSTGrid: a whole genome comparison tool for the identification of coding and non-coding conserved sequences.- oral presentation EGEE User Forum 07 G Donvito et al. - Alternative Splicing Prediction on EGEE infrastructure. - oral presentation EGEE User Forum 07 L Carota et al. - "High Throughput Comparison of Prokaryotic Genomes" - accettato per la conferenza "Parallel Bio-Computing"in Polonia e la pubblicazione successiva su "Lecture Notes in Computer Science" di Springer Verlag.
G. Maggi 29 agosto 2007 Le applicazioni ported su grid FAF-Functional Analogous Finder: find genes with similar functionalities MultiBLAST on Demonstrator: an easy way to run BLAST multiple queries in a Grid infrastructure. Rosetta: a protein structure prediction method used to predict the three- dimensional structure of the “never born proteins”. CSTGrid: a whole genome comparison tool for the identification of coding and non-coding conserved sequences. ASPic: Alternative Splicing Prediction on EGEE infrastructure PAML and MrBayes application on the EGEE infrastructure Massively evolutionary task by BLAST on grid. DNAfan: a software tool for automated extraction and analysis of user-defined sequence regions Tool comune: JST Job Submitting Tool
G. Maggi 29 agosto 2007 L’attività svolta Operazione dei servizi specifici di LIBI
Enabling Grids for E-sciencE Workshop LIBI, Giovinazzo 2 luglio I servizi disponibili sull’infrastruttura Grid per LIBI Servizi implementati presso INFN-Bari –1 WMS (RB gLite) –1 CE LCG2 (produzione, batch system: Torque/MAUI) –1 CE gLite (pre-production) –1 CE Cream (rilasciato ed in test. Prototipo disponibile a Bari) –2 SE (d-Cache + Classic SE) Fino a 4 TB di storage –1 GridICE server (monitoring) –1 LFC (catalogo di grid) –1 HLR (accounting) –1 UI con Genius A disposizione dei singoli utenti Gestisce le applicazioni installate sul portale Genius –1 server OGSA-DAI –1 server GrelC –1 server G-DSE –1 server AMGA –1 server CONSTANZA –2 DB server in alta disponibilità Servizi implementati centralmente al CNAF –VOMS server (CNAF) (con il gruppo LIBI) –1 LFC (catalogo di grid)
G. Maggi 29 agosto 2007 L’attività svolta GridICE upgrades
G. Maggi 29 agosto 2007 Upgrade di GridICE E’ stata avviata una profonda revisione di GridICE Upgrade alla nuova versione di LEMON Nuovi sensori per il job monitoring (più veloci e robusti) Monitoring dell’uso delle risorse con il dettaglio dei gruppi e ruoli VOMS e a livello utente Selezione delle informazioni mostrate sulla base dell’identità e del ruolo dell’utente (dashboard per le piccole VO) Storage monitoring (d-Chache) Nell’All Hands meeting del luglio 2007 è stato messo a punto un piano di interventi per completare la revisione e aggiungere le nuove funzionalità (display delle informazioni aggregate, upgrade database e tabelle, notifiche,….). A. Pierro et al - “GridICE: a Monitoring Tool for Grid System. Recent Evolution, Use Cases and Interoperability” - High-Performance Distributed Computing” (HPDC 2007). June Monterey Bay California G. Cuscela et al - "Monitoring the user/application activities on the grid” - accepted for oral presentation to CHEP 2007
G. Maggi 29 agosto 2007
Attività prevista per il 2008 LIBI Gestione e manutenzione dei servizi e dei DB specifici di LIBI tools per il download e indexing dei DB in flat files (in particolare per BLAST) Tools per l’accesso ai flat file indicizzati su grid (Parrot, FUSE) Tool di sottomissione di job alla grid (JST) Porting di applicazioni di bioinformatica e di workflow Portale Genius Completamento del test di valutazione dei tool di accesso ai DB relazionali da grid ed implementazione del servizio Integrazione del WMS Glite e del CE CREAM, in particolare dell’interfaccia a WS, nell’infrastruttura del laboratorio LIBI Partecipazione all’upgrade di gridICE in particolare per quanto riguarda le notifiche e le funzioni di dashboard per le piccole VO.
G. Maggi 29 agosto 2007 Le richieste finaziarie Inventario Bari: 1 server AMGA 1 server per accesso ai DB ( almeno uno tra OGSA-DAI, GrelC, G-DSE) 1 CE CREAM (accesso via WEb services per LIBI) 1 User Interface (separare UI utenti da quella dedicata al Portale GENIUS) 2 macchine per test 2 stazioni di lavoro