La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

+ Call di Big Data (EINFRA- 1). + La call … + + Cosa abbiamo in mano (come INFN) 1. L’infrastruttura 1 Tier1 + 12 Tier2 O(25000) cores O(20) PB di Disco.

Presentazioni simili


Presentazione sul tema: "+ Call di Big Data (EINFRA- 1). + La call … + + Cosa abbiamo in mano (come INFN) 1. L’infrastruttura 1 Tier1 + 12 Tier2 O(25000) cores O(20) PB di Disco."— Transcript della presentazione:

1 + Call di Big Data (EINFRA- 1)

2 + La call …

3 +

4 + Cosa abbiamo in mano (come INFN) 1. L’infrastruttura 1 Tier1 + 12 Tier2 O(25000) cores O(20) PB di Disco O(20) PB di tape Centri interconnessi almeno a 10 Gbit/s 2. Esperienza di gestione Big data Sostanzialmente LHC come volume, ma anche oltre 3. Tools 4. Clienti… 5. Progetti gia’ pensati

5 + Infrastruttura I ns centri sono stati costruiti per il computing di LHC (che non e’ considerato interessante per H2020), ma hanno esperienza riguardo al supporto per comunita’ scientifiche diverse Compchem Biology Fisica medica L’INFN pare intenzionata a valorizzare I centri esistenti, in un’ottica multidisciplinare Esiste un’nfrastruttura europea gia’ rodata (WLCG) di siti simili ai nostri, il che permette facilita’ di contatto La rete fra I nostri centri e’ gia’ tale da rendere invisibile la non localita’ delle risorse per quasi tutti gli use case I siti (come insieme, magari non come singolo sito) sono “garantiti” rimanere in essere dal loro utilizzo primario LHC ha gia’ piani chiari fino al 2022, piani ancora in via di studio fino al 2030 e oltre

6 + Esperienza di gestione di BigData Un solo esempio: per un singolo esperimento, il T1 al CNAF gestisce da solo ~ 10 PB di dati Trasferisce almeno 10 PB anno via Geant/GARR Non credo che questi numeri siano rilevanti per la “long tail of science”, li possiamo usare per certificare che lo sappiamo fare

7 + Tools Punto importante: non credo che sia di nostro interesse sviluppare tools da zero Abbiamo pero’ Una libreria di tools gia’ sviluppati dai vari esperimenti (data movement, cataloghi, ecc ecc) che sappiamo utilizzare Abbiamo le capacita’ e l’interesse ad integrare questi strumenti in un pacchetto completo, da offrire come soluzione semplice per la long tail of science Come nel caso precedente, non abbiamo bisogno di dimostrare che tali strumenti siano “sufficienti”, perche’ funzionano in casi ben + complessi Anzi spesso possiamo decidere di utilizzare strumenti + semplici, tanto la scala non e’ un problema

8 + Tools 2 Pero’: insisto, secondo me la nostra forza sono l’infrastruttura esistente + gli use case Se convenisse (per cordate etc) basare il proposal su tool di altro tipo (eudat?) non sarebbe un gran male Anche se non mi risulta che Eudat abbia mai dimostrato l’efficacia dei suoi tools sulle nostre scale

9 + Clienti L’INFN non e’ solo I grandi esperimenti, abbiamo anche tanti (tantissimi) piccoli esperimenti MCD e’ che tutti raccolgono dati … e piu’ piccoli sono, meno personale hanno da dedicare a problematiche di calcolo A me piacerebbe poter offrire un pacchetto completo di tools per il DM di tali esperimenti (non solo di fisica) Semplice da amministrare (installabile facilmente via VM su non piu’ di qualche macchina) Semplice per gli utenti (== webservices o simili) Completo: data movement (ASO….), data access (soluzioni di caching), cataloghi di metadata, tools di ricerca

10 + Progetti gia’ pensati Pegasus/Pides per la data preservation

11 + Domande Appoggiarsi Eudat? Entriamo tardi, solo briciole? Appoggiarsi a Egi? Fare cordata italiana e basta? Tecnologicamente siamo ok, politicamente (a livello EU) non so Richia di essere tanto lavoro, con Se va bene grande guadagno (ma probabilita’ medio bassa) Se va male, un pugno di mosche (piu’ probabile)


Scaricare ppt "+ Call di Big Data (EINFRA- 1). + La call … + + Cosa abbiamo in mano (come INFN) 1. L’infrastruttura 1 Tier1 + 12 Tier2 O(25000) cores O(20) PB di Disco."

Presentazioni simili


Annunci Google