Obbiettivi kickoff Presentazione del progetto e di alcune possibile tecnologie da utilizzare Capire i reciproci (infn-garr) requirement Organizzare gruppi.

Slides:



Advertisements
Presentazioni simili
Le politiche della Commissione Europea sull'accesso aperto. Il ruolo delle biblioteche accademiche Salone del libro di Torino, 10 maggio 2012 Maddalena.
Advertisements

Federazione Nazionale Commercio Macchine Cantiermacchine Cogena Intemac Unicea Unimot ASSOCIAZIONE ITALIANA PER LA PROMOZIONE DELLA COGENERAZIONE.
G. Martellotti Roma RRB 16 Aprile Presentazione M&O cat A (per LHCb i M&O cat B sono gestiti autonomamente e non sono scrutinati fino al 2005/2006)
1 M&O cat A - consuntivo provvisorio modifica del preventivo 2004 M&O cat B ancora non sono previsti. (saranno presentati al RRB di Aprile) Profili.
8 Maggio 2002Workshop CCR - La Biodola W2K Coordination Group & HEP-NT Report Enrico M.V. Fasanelli Gian Piero Siroli.
Installation and evaluation of the Globus toolkit Massimo Sgaravatto INFN Padova.
Comunicazioni La storia trasparente della CSN1 Sanzioni in arrivo per l’arcicattivo: Zoccoli: HERA-B A Luglio ti puniremo ! E ora bisogna.
Storage (ieri, oggi e domani) Luca dell’Agnello INFN-CNAF.
Gaetano Maron, Presentazione T2 LNL-Padova, Legnaro 22 dicembre Il Servizio Tecnologie Informatiche ed Elettroniche dei LNL Gaetano Maron.
Il progetto ARTISAN Angelo Frascella – ENEA (8 Luglio 2011)
Istituto Nazionale di Fisica Nucleare Il “Calcolo” in Gruppo V Gaetano Salina INFN, Sezione di Roma II.
Calcolo a LHC Concezio Bozzi, INFN Ferrara per il gruppo di referaggio: F. Bossi, CB, R. Ferrari, D. Lucchesi, D. Martello, [M. Morandin], S. Pirrone,
FONDACloud Federated EnvirONment for Data Analysis in the Cloud Call ICT-7 (23 Apr ‘14) Luciano Gaido (INFN-TO)
MM news & status -Final Design Review -NA for NSW -altre attività MM.
Computing CMS Richieste 2010 M.Paganoni, 22/7/09.
Aggiornamento attivita’ gruppo Windows Gian Piero Siroli, Dip. di Fisica, Università di Bologna e INFN CCR, ottobre 2007.
PRIN NAPOLI Enzo Capone, Gianpaolo Carlino, Alessandra Doria, Rosario Esposito, Leonardo Merola, Silvio Pardi, Arturo Sanchez Pineda.
MSc in Communication Sciences Program in Technologies for Human Communication Davide Eynard Facoltà di scienze della comunicazione Università della.
Organizzazione e Formazione per l’arresto cardiaco in ospedale Overview Epidemiologia dell’ arresto intraospedaliero Criticita’ organizzative Applicazioni.
Claudio Grandi INFN Bologna Centres of Excellence in H2020 Claudio Grandi INFN-Bologna.
20-21/03/2006Workshop sullo storage - CNAF Alessandro Brunengo.
Attività Big Data/Data Science in HEP (CERN e US)
Status Report Gruppo Storage CCR CCR 14-15/03/2006.
Online U. Marconi Bologna, 5/9/2016.
Riunione INFN – Bologna, 17 January 2013
I costi del Calcolo LHC un update –
EU-IndiaGrid Project Joining European and Indian grids for escience
Engineering Faculty University of Messina, Italy Marco Scarpa
Calorimetro LAR ATLAS Italia Roma 28 novembre 2008
Richieste di upgrade dei link di accesso alla rete Geografica
Collegamento a Garr-X Il collegamento alla nuova rete Garr-X dovrà garantire il massimo della efficienza nella gestione della banda. Per identificare opportunamente.
Dichiarazione dei servizi di sito nel GOCDB
Cloud per HA nei Servizi
Alberto Masoni EU-IndiaGrid Project Manager INFN Sezione di Cagliari
PRIN Roma1 – status Luciano Barone, Alessandro De Salvo
Gruppo storage CCR Nuove attivita’ 2007 Alessandro Brunengo CCR - Roma
Stato Acquisti Switch/Router T2
From 8 to 80 boxes. From FBSNG to Condor CPU Satura !
I progetti PI2S2 e TriGrid VL
Comunicazioni Riunione ATLAS-Italia
Assegnazione risorse Stato INFN CNAF,
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
Analisi dei dati dell’Esperimento ALICE
JetWalk: Agenda e review committee
NETGROUP Incontro Technology Tracking 2008
Parlando di network i discorsi naturalmente diventano complessi (creazione di un intero ecosistema virtuale comparabile ad uno reale): Separazione layers.
(Breve) Riassunto del workshop WLCG
R&D fase 2 – RPC 4st meeting
INFN-TS INFN - Sezione di Trieste - C. Strizzolo - L. Strizzolo.
Gigi Cosentino - LNL 20 ottobre 2016
INFN Il calcolo scientifico presso la sede INFN di Padova e di Legnaro
ATLAS PRIN Next Steps Alessandro De Salvo
ONEDATA - distributed data caching -
Cos' è l'Augmented Reality? Perchè è diversa dalla Virtual Reality?
Gruppo Proxmox ImoLUG: vedere provare condividere
le Attivita' Computing Analisi Muoni: Detector(s) e Trigger
Ingegneria del Software 2
Highlights del meeting ESPP di Cracovia Settembre 2012 (FISICA DI G1)
Report giornata di Technology tracking
X. Specifications (IV).
La richiesta si basa sulle seguenti considerazioni:
P. Giannetti per il gruppo FTK
Proposal for the Piceno Lab on Mediterranean Diet
Study of Bc in CMSSW: status report Silvia Taroni Sandra Malvezzi Daniele Pedrini INFN Milano-Bicocca.
Preliminary results of DESY drift chambers efficiency test
ATLAS PRIN Roma1 - status Alessandro De Salvo
CdS 2017: embargo fino a TAUP2017
Kickoff meeting IDDLS GARR contribution
Wikipedia Wikipedia è un'enciclopedia online, collaborativa e libera. Grazie al contributo di volontari da tutto il mondo, Wikipedia ad ora è disponibile.
Tommaso Boccali (INFN-Pisa / CERN)
Transcript della presentazione:

Obbiettivi kickoff Presentazione del progetto e di alcune possibile tecnologie da utilizzare Capire i reciproci (infn-garr) requirement Organizzare gruppi di lavoro Definizione canali di comunicazione Definizione next step

IDDLS: Italian Distributed Data Lake for Science

Motivation HL-LHC computing needs are above the expected technology evolution (15%/yr) and funding (flat) We need to optimize hardware usage and operational costs High fraction of the infrastructure and operation costs is due to Storage IDDLS kickoff - GARR - Roma 24/01/2019

Some ideas on reducing Storage costs Reduce hardware cost: better exploiting the concept of QoS(Quality of Service) Probably today we replicate more than we need Reducing the number of copies Reduce Operational Cost: deploy fewer (larger) storage services maintaining high standards in availability and reliability Create large storage repositories that “look like one, but it is composed of many”  the DataLake Co-location of Storage and CPU will not be guaranteed anymore Need technologies for quasi-transparent data access from remote locations Smart Caching Site A EOS 2 copies Site B CEPH 3 copies Site C dCache Raid-N A stronger integration of sites could lead to a reduction of the number of copies IDDLS kickoff - GARR - Roma 24/01/2019

On the definition of the Data Lake Very diverse understanding of the expression data lake. Attempts to define it by ‘name space’ or ‘region’ or ’country’ all failed. Looks like one thing, but is composed of many Stolen from Vincent (NDGF) IDDLS kickoff - GARR - Roma 24/01/2019

Sinergie in Europa IDDLS ESCAPE WLCG BELLE-II XDC@INFN Comunità di utenti interessate all’utilizzo della tecnologia XDC@INFN WLCG-Demonstrator@NA SCORES@NA Xcache@PG Sviluppo SW per la creazione del DataLake WLCG-DOMA Creazione dell’infrastruttura HW IDDLS kickoff - GARR - Roma 24/01/2019

ESCAPE: Astro-particle cluster (including SKA) Sinergie in Europa IDDLS ESCAPE WLCG BELLE-II Comunità di utenti interessate all’utilizzo della tecnologia XDC WLCG-Demonstrator@NA SCORES@NA Xcache@PG WLCG-DOMA Sviluppo SW per la creazione del DataLake ESCAPE: Astro-particle cluster (including SKA) Creazione dell’infrastruttura HW 32 partner (CNRS lead) 16Meuro 800keuro INFN The scientific drive towards combining and aligning data from different facilities online and offline will open-up the way towards the implementation of a data-lake infrastructure for astronomy and physics and it will be offered as a pillar infrastructure to be connected to EOSC for the next decades’ data challenges. IDDLS kickoff - GARR - Roma 24/01/2019

The project INFN-GARR collaboration to realize a prototype of an Italian DataLake exploiting: Last generation networking technologies provided by GARR DCI (Data Center Interconnection) equipment SDN (Software Defined Network) deployment Software for creating scalable storage federations provided by INFN eXtreme-DataCloud project (H2020 - INFN lead) SCoRES project (INFN-NA) Real life use cases for testing CMS ATLAS BELLE-II Possibly involving LNGS experiments (XENON) and VIRGO Possible topologies of the GARR Network with DCI and SDN for the DataLake IDDLS kickoff - GARR - Roma 24/01/2019

Lab deployment at GARR for testing Mixed Lab+WAN deployment Timeline 3 years project First year Technology scouting for DCI equipment to be deployed by GARR Application (INFN) requirements analysis Network equipment acquisition (INFN and GARR) and Lab testing Deployment on mixed Lab+WAN environment of the networking equipment Creation of the DataLake on sites connected with standard networking and first prototype using DCI Second year Testing of the mixed (Lab+WAN) configuration Final creation of the DataLake on the 3 INFN sites with DCI systems Performance evaluation and comparison Possible acquisition of new equipment with increased performance Third year Deployment only on WAN of the networking equipment Optimization of the DataLake Performance evaluation Final consideration Lab deployment at GARR for testing Mixed Lab+WAN deployment IDDLS kickoff - GARR - Roma 24/01/2019

2019 Milestone (semplificate) 30/06/2019: Scelta degli apparati di networking per la creazione del Datalake 31/12/2019: Deployment degli apparati di rete in una configurazione Lab+WAN – primi portotipi DataLake su apparati DCI e standard 31/12/2019: Primi run per la valutazione delle performance sui prototipi IDDLS kickoff - GARR - Roma 24/01/2019

Budget richiesto 200k - contributo inkind del GARR con sistemi DCI per tre sedi INFN I anno richiesta tasca di 65k al CNAF per 3 apparati di rete per connettività verso sistemi GARR a 100gbs 3 switch con uplink a 100gbs + 3 NIC + ottiche per 3 sedi gli apparati saranno distribuiti alle sede opportune quando decise studio in fase di progetto per decidere quale sia la migliore topologia Missioni: 1.5 per ciascuna sede che ne ha fatto richiesta First year IDDLS budget II anno: possibili nuove acquisizione di apparati di rete più performanti da parte di INFN, budget similare III anno non sono previsti acquisti IDDLS kickoff - GARR - Roma 24/01/2019

Budget Assegnato IDDLS kickoff - GARR - Roma 24/01/2019

Sedi e personale GARR: 3x15% Sede Personale FTE 7 2 1.4 0.2 1.6 BARI 3 Tecnologi Tecnici Ricerc./Borse TOT CNAF 7 2 1.4 0.2 1.6 BARI 3 +0.9 1.3 LNF 1 0.1 LNL 4 0.6 +0.4 1.0 NA 0.3 +0.1 +0.5 PG 0.9 PI +0.45 +0.3 1.05 RM1 TOT. 21 +1 6 +2 2.9 +1.05 0.4 0.5 +2.2 7.05 GARR: 3x15% IDDLS kickoff - GARR - Roma 24/01/2019

Afferenze Vedi excel IDDLS kickoff - GARR - Roma 24/01/2019

Gruppi di lavoro WP1 – Management Coordinamento, rapporti CSN5 e referee, organizzazione meeting Progress report periodici Procedure acquisti WP2 - Studio, definizione e implementazione dei link ad alta velocità Scouting tecnologico delle soluzioni Data Centre Interconnect (DCI) Identificazione dei requisiti degli esperimenti INFN Integrazioni delle componenti HW e SW delle tecnologie DCI Sperimentazione mista laboratorio e infrastruttura di rete geografica Condivisione dello spettro in ambiente protetto; Modelli di provisioning Modelli di gestione e controllo Sperimentazione su infrastruttura geografica su 3 siti IDDLS kickoff - GARR - Roma 24/01/2019

Gruppi di lavoro WP3 – Creazione del DataLake Definizione dello stato dell’arte delle tecnologie esistenti Implementazione del DataLake con tecnologie basate su protocollo HTTD/XROOTD con e senza sistemi di caching Implementazione del DataLake con tecnologie differenti (eventuali) WP4 – Testing del DataLake Definizione della testsuite del progetto basata sul software degli esperimenti rappresentati, almeno CMS, ATLAS e BELLEII Esecuzione della testsuite sul DataLake sfruttando sia i siti interconnessi con tecnologie di tipo DCI che di tipo legacy Interazione con sedi INFN o legate all’ente produttrici di dati (i.e. LNGS, CASCINA) che possano essere interessate a testare le soluzioni dell progetto Valutazione delle performance ottenute IDDLS kickoff - GARR - Roma 24/01/2019