BioVeL is funded by the European Commission 7th Framework Programme (FP7). It is part of its e-Infrastructures activity. Biodiversity Virtual e-Laboratory.

Slides:



Advertisements
Presentazioni simili
Lo sviluppo delle PMI tra Innovazione e Competenze. Il progetto MASTER Valentina Castello.
Advertisements

P. Capiluppi Organizzazione del Software & Computing CMS Italia I Workshop CMS Italia del Computing & Software Roma Novembre 2001.
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
Queuing or Waiting Line Models
Le politiche della Commissione Europea sull'accesso aperto. Il ruolo delle biblioteche accademiche Salone del libro di Torino, 10 maggio 2012 Maddalena.
FASTVID RENTALS: BUSINESS MODELING 1. Business Modeling One of the major problems with most business engineering efforts, is that the software engineering.
Giovanni Biondi ICT e trasformazione della Scuola.
8 Maggio 2002Workshop CCR - La Biodola W2K Coordination Group & HEP-NT Report Enrico M.V. Fasanelli Gian Piero Siroli.
Comunicazioni La storia trasparente della CSN1 Sanzioni in arrivo per l’arcicattivo: Zoccoli: HERA-B A Luglio ti puniremo ! E ora bisogna.
Layered Grid Architecture. Application Fabric “Controlling elements locally”: Access to, & control of, resources Connectivity “Talking to Grid elements”:
Presentazione dei Servizi di Genova ICT cloud-based platform and mobility services available, universal and safe for all users.
Mobilità tra i Paesi del Programma KA103 A.A. 2014/2015 (KA103) Mobility Tool+ e il Rapporto Finale Claudia Peritore Roma luglio 2015.
Alessandra De Cugis Progetto Tempi e Orari del Comune di Milano Time in the cities, a holistic approach for urban time issues, the case of Milan Paper.
Project Review Novembrer 17th, Project Review Agenda: Project goals User stories – use cases – scenarios Project plan summary Status as of November.
Il progetto ARTISAN Angelo Frascella – ENEA (8 Luglio 2011)
XzelCloud Cloud Advanced Services on large-scale Federated Infrastructures Call ICT-7 (23 Apr ‘14) Marco Verlato (INFN-PD)
DECIDE DECIDE ( Diagnostic Enhancement of Confidence by an International Distributed Environment ) Laura Leone - GARR DECIDE Project Coordinator Dalla.
INFN—Catania Giuseppe Andronico Bologna, 23 Gennaio 2014.
ORGANISATION OF THE EDUCATION SYSTEM IN ITALY 2010/2011.
I PROGETTI EUROPEI COME UN POSSIBILE STRUMENTO DI DIFFUSIONE DI COMPETENZE TECNOLOGICHE Antonio Budano (INFN-ROMA3)
INFRA - Progetti europei verso altre regioni e verso altre comunità scientifiche F. Ruggieri R. Barbera A. Masoni M. Verlato G. Donvito D. Cesini 1WS INFC.
Il progetto EGI-InSPIRE Luciano Gaido INFN-Torino II Workshop congiunto CCR-INFNGRID Acireale, maggio 2010.
EU-IndiaGrid2 (RI ) Framework Programme 7 ( ) Research infrastructures projects EU-IndiaGrid2 Sustainable e- infrastructures.
FONDACloud Federated EnvirONment for Data Analysis in the Cloud Call ICT-7 (23 Apr ‘14) Luciano Gaido (INFN-TO)
Project IOLI Practical exemple in Italy and in Sicily Il presente progetto è finanziato con il sostegno della Commissione europea. L’autore è il solo responsabile.
STMan Advanced Graphics Controller. What is STMan  STMan is an advanced graphic controller for Etere automation  STMan is able to control multiple graphics.
Futuro di EGI EGI è menzionato esplicitamente nel draft delle nuove calls EU ( H2020 ) Da ultima versione (per me) data 18-9 di –HORIZON 2020 – WORK PROGRAMME.
Definizione del piano delle attività di progetto L’esperienza CoBaSys Donata Franzi IMT Alti Studi lucca Università degli Studi di Modena e Reggio Emilia.
Silvia Minardi, Pavia 14 December maps and directions hours.
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
17th International Conference on Computing in High Energy and Nuclear Physics March 2009 Prague Esperienza di un portale “application oriented”
Who we are EUAsiaGrid 1Istituto Nazionale di Fisica Nucleare (Italy) (coordinator) 2CESNET (Czech Republic) 3University of Manchester (UK) 4HealthGrid.
PANNON GÉP PANNON GÉP KFT Production of agricoltural tools and equipments since Our company is distinguished for the use of high quality material.
Claudio Grandi INFN Bologna Centres of Excellence in H2020 Claudio Grandi INFN-Bologna.
 APRE Daniela Mercurio - APRE LUMSA Finanziamenti europei a sostegno della digitalizzazione in Europa.
VO-Neural Project e GRID Giovanni d’Angelo Dipartimento di Scienze Fisiche Università degli Studi di Napoli Federico II Martina Franca 12 – 23 Novembre.
I.I.S. ENRICO MATTEI School TYPE: High School Science;
Summary di (quasi) tutti gli utenti non presentati…
Bando FIRB 2003 Progetti strategici di ricerca per la costituzione, il potenziamento e la messa in rete di centri di alta qualificazione scientifica, pubblico-privati.
Riunione INFN – Bologna, 17 January 2013
EU-IndiaGrid Project Joining European and Indian grids for escience
Effort EGI (Cloud e dintorni)
Engineering Faculty University of Messina, Italy Marco Scarpa
Luciano Gaido H2020: Evol-EGI status Luciano Gaido
Dichiarazione dei servizi di sito nel GOCDB
Alberto Masoni EU-IndiaGrid Project Manager INFN Sezione di Cagliari
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
I progetti PI2S2 e TriGrid VL
Metriche SE monitoring G.Donvito G.Cuscela INFN Bari
L’infrastruttura grid italiana nel contesto internazionale
(Breve) Riassunto del workshop WLCG
ViralPack: Un pacchetto integrato di bioinformatica su Genius
Futuro Mobilità H2IT L. Crema.
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Drafts H2020.
PI2S2 Regional Operation Centre Sistema di Supporto Sistema di Monitoring Rita Ricceri Consorzio Cometa Tutorial per Site Administrator Messina,
The Scientific Revolution
Job Application Monitoring (JAM)
ONEDATA - distributed data caching -
WARGI-DSS Andrea Sulis, Ph.D.
Highlights del meeting ESPP di Cracovia Settembre 2012 (FISICA DI G1)
Enabling Cosmic Rays worldwide
Studente : Andrea Cassarà Classe: 5AII A.S. 2014/2015 Link Sito
The paper is available free of charge at:
SWORD (School and WOrk-Related Dual learning)
A comparison between day and night cosmic muons flux
Italian RDA Node Emma Lazzeri – CNR-ISTI
Studies on the Laccase-Catalyzed Oxidation of Hydroxy-Chalcones
Wikipedia Wikipedia è un'enciclopedia online, collaborativa e libera. Grazie al contributo di volontari da tutto il mondo, Wikipedia ad ora è disponibile.
Transcript della presentazione:

BioVeL is funded by the European Commission 7th Framework Programme (FP7). It is part of its e-Infrastructures activity. Biodiversity Virtual e-Laboratory Under FP7, the e-Infrastructures activity is part of the Research Infrastructures programme, funded under the FP7 'Capacities' Specific Programme. It focuses on the further development and evolution of the high-capacity and high-performance communication network (GÉANT), distributed computing infrastructures (grids and clouds), supercomputer infrastructures, simulation software, scientific data infrastructures, e-Science services as well as on the adoption of e-Infrastructures by user communities. BioVeL is free and available via internet. contact Alex Hardisty: 1

BioVeL is one of a number of projects across Europe contributing to LifeWatch, and it will make a key contribution towards implementation of these initiatives by enabling better sharing of skills and data, and faster production of outputs in biodiversity science. LifeWatch is the research infrastructure programme, initiated in the European Strategy Forum on Research Infrastructures (ESFRI), to construct and operate facilities, including new virtual laboratories for biodiversity research. The ultimate objective of the LifeWatch project is to explore patterns of biodiversity and processes of biodiversity across time and space-scales. LifeWatch anticipates and encourages projects like BioVeL, acting in a local, bottom-up manner to contribute towards its construction. BioVeL will eventually hand over the results of its work – an e-Infrastructure of robust discoverable tools for use in workflows and sharing of workflows more widely in the community – to LifeWatch for continued operation. Biodiversity Virtual e-Laboratory 2

BioVeL è un consorzio di 15 partners appartenenti a 9 nazioni 1.Cardiff University, UK – Coordinator 2.Centro de Referência em Informação Ambiental, Brazil 3.Foundation for Research on Biodiversity, France 4.Fraunhofer-Gesellschaft, Institute IAIS, Germany 5.Free University of Berlin – Botanical Gardens and Botanical Museum, Germany 6.Hungarian Academy of Sciences Institute of Ecology and Botany, Hungary 7.Max Planck Society, MPI for Marine Microbiology, Germany 8.National Institute of Nuclear Physics, Italy 9.National Research Council: Institute for Biomedical Technologies and Institute of Biomembrane and Bioenergetics, Italy 10.Netherlands Centre for Biodiversity (NCB Naturalis), The Netherlands 11.Stichting European Grid Initiative, The Netherlands 12.University of Amsterdam, Institute of Biodiversity and Ecosystem Dynamics, The Netherlands 13. University of Eastern Finland, Finland 14. University of Gothenburg, Sweden 15.University of Manchester, UK 3

Biodiversity Virtual e-Laboratory 4 Progetto di 3 anni, iniziato il 1 settembre 2011

Semplificare la possibilità di importare dati dalle proprie librerie o da quelle di altri ricercatori “Workflow” (serie di step di data-analisi) che consentono di processare una grande quantità di dati Costruire il proprio workflow con la possibilità di selezionare e applicare successivi “servizi” di data processing Accedere a librerie di workflow e ri- usare workflow esistenti Ridurre i tempi di ricerca e l’overhead per imparare ad usare i tool Contribuire al progetto LifeWatch e GEO BON. Biodiversity Virtual e-Laboratory BioVeL is a powerful data processing tool Part of a workflow to study the ecological niche of the horseshoe crab 5

118k€ di finanziamento per l’INFN Impegno su due WP: WP4 (Outreach, dissemination and support) 1.5PM Outreach activities to the communities, international initiatives and other projects; Dissemination of tools and results available with participation to conferences and biodiversity related events WP7 (Services access, operation and management) 14PM Deploy, commission and operate services on behalf of the biodiversity science community; Gain access (where necessary) to underlying e-infrastructures (e.g., NGIs/EGI) for the execution of computationally intensive services. The Italian National Institute of Nuclear Physics (INFN) brings Grid and other distributed computing expertise to the provision of services, notably but not exclusively for the phylogenetics service set. INFN brings software engineering effort and expertise and capability for hosting services Biodiversity Virtual e-Laboratory e INFN 6

Servizi utilizzati piattaforma di Cloud di Amazon per i servizi Core nei casi in cui è richiesta una cospicua quantità di calcolo o di storage si preferiscono partner specializzati nel calcolo scientifico INFN-Bari fornisce questo tipo di servizio almeno per il periodo coperto del progetto. C’è interesse da parte della comunità di BioVeL/Lifewatch (e in particolare della componente italiana) per continuare questo rapporto anche dopo la fine di BioVel in Lifewatch. L’interesse di Bari è anche legato alla possibilità di sfruttare lle risorse computazionali del PON ReCaS e le expertise legate al progetto PRISMA Altri esempi di resource providers Il Centro de Referência em Informação Ambiental, Brazil ha fatto domanda alla EGI Cloud Task Force di poter provare quell’infrastruttura per ospitare il loro software SARA, Olanda, è uno degli “scientific cloud providers” che si stanno avvicinando al progetto per offrire supporto anche se non sono partner di Biovel Biodiversity Virtual e-Laboratory 7

Web service Logical Design 8 >1000 jobs && >1 month of CPU Response time: few days Few hundreds- thousand of jobs Response time: from few minutes to few hours Single fast execution per real time analysis ~10 concurrent execution Response time: ~ 5-10 seconds

Web service Logical Design 9 >1000 jobs && >1 month of CPU Response time: few days Few hundreds- thousand of jobs Response time: from few minutes to few hours Single fast execution per real time analysis ~10 concurrent execution Response time: ~ 5-10 seconds 2 workflow engine supportate Taverna Loni

Upload the user’s inputs Run MrBayes: a MPI application that could run for several hours Pass the output to the next services 10 Check the convergence of the model Retrieving the output and parsing the XML calculate the consensus tree of the posterior distribution of MrBayes output Graphical view of the tree

Web service Logical Design 11 >1000 jobs && >1 month of CPU Response time: few days Few hundreds- thousand of jobs Response time: from few minutes to few hours Single fast execution per real time analysis ~10 concurrent execution Response time: ~ 5-10 seconds I web services popolano la task queue

Rest Web service example Insert Jobs: {blast}&arguments={ 2.nexhttp://localhost:8080/RestService/services/QueryJob/InsertJobs?NAME= {blast}&arguments={ 2.nex ArgOne; ArgTwo;} ArgTwo;} Select Jobs: ces/QueryJob/SelectJobs?FLAG={ ces/QueryJob/SelectJobs?FLAG={20b3c bf b4-ad7c-7b40bc706741} 12

Stress test di performance e affidabilità già passati: 100’000 inserimenti di fila … nessun memory-leak o altri problemi Fino a 100 client concorrenti senza problemi 1000 tasks inserite in una singola chiamata REST ~1M of tasks gestiti dal DB+backend A lot of experience in porting Bioinformatics application over EGI distributed computing infrastructure: Hmmer, MrBayes, Blast, PAML, MUSCLE, EMBOSS, Biopython, AmpliconNoise, ABCtool, Bowtie, BayeSSC, GeoKS, hyphy, raxmlHPC, phylocom, consensus_xml, Matlab, etc… 25 different services already provided to users communities Test & Results 13

Soap Web service example wsdlpull ' pServiceMethodsPort?wsdl' InsertJobs admin admin test_loni ’MatLabRUN1 input_test 12; MatLabRUN2 input_test2 24' wsdlpull ' pServiceMethodsPort?wsdl' SelectJobs admin admin 20b3cbf b4-ad7c-7b40bc

Web service Logical Design 15 >1000 jobs && >1 month of CPU Response time: few days Few hundreds- thousand of jobs Response time: from few minutes to few hours Single fast execution per real time analysis ~10 concurrent execution Response time: ~ 5-10 seconds JST Evoluzione di un Tool utilizzato a Bari fin dal progetto FIRB LIBI Utilizza la tecnica dei pilot job e una coda centrale di task Usato sia per la sottomissione a grid che alle risorse locali

Web service Logical Design 16 >1000 jobs && >1 month of CPU Response time: few days Few hundreds- thousand of jobs Response time: from few minutes to few hours Single fast execution per real time analysis ~10 concurrent execution Response time: ~ 5-10 seconds Gestione dei file di INPUT: WebDav

Spesso la dimensione degli input files è dell’ordine del Gbyte quindi può essere difficile fare l’upload con un web service standard Gli utenti di Bioinformatica di solito non hanno esperienza di uso degli storage element di grid É necessario rendere disponibile una interfaccia user-friendly per trasferire grandi quantità di dati e di files dal PC dell’utente agli storage element di grid. Questo servizio: Deve avere un client in tutte le piattaforme software (Windows/MacOS/Linux) Fornire vari sistemi di autenticazione fra cui almeno “username/password” Fornire ottime performance anche su reti ad alta latenza Fornire la possibilità di ridurre i trasferimenti fra i servizi di calcolo e i pc degli utenti (i files temporanei devono essere già diponibili all’infrastruttura di calcolo senza) Input files: problems 17

Screenshots: WebDav DataManagement Service 18

 Accesso ai file mediante un browser.  Semplicità di condivisione dei file con altri colleghi Screenshots: WebDav DataManagement Service 19

Giacinto Donvito (INFN-ReCaS) Pasquale Notarangelo (INFN) Domenico Diacono (INFN) Saverio Vicario (CNR) Bachir Balech (CNR) People involved in the development 20

Workshops on e-Science Workflows in Budapest th of February EGI Community Forum Proceedings: BITS NETTAB Conference & Proceeding 21

We have a high scalable and solid service that could be used to supports execution of applications over different computing infrastructure This is a classical example of SaaS We have also a high performance data transfer and sharing service It is quite easy to add new application as the users requires it The technical solution has been already presented with success at few national and international conferences We already used the same framework to support different application coming from different communities This highlight the generality of the solution and the possibility to exploit synergies with other project We are already providing CPU and Storage facilities to the project via user friendly “cloud” interfaces Conclusions & To-do 22