CSN3 – 20 marzo 2006 Francesco Forti, INFN-Pisa per il gruppo di referaggio
20/3/06 F.Forti - Tier2 ALICE 2 Sommario I Tier-2 nell’INFN Le richieste dell’esperimento Incertezze Il percorso di referaggio I criteri di valutazione Il ranking dei siti Proposta dei referee Prossimi passi Conclusioni
20/3/06 F.Forti - Tier2 ALICE 3 Princìpi del Tier2 Il Tier2 serve una comunità di riferimento, ma è una risorsa per l’intero esperimento Non è una farm di gruppo I fisici dell’esperimento devono impegnarsi fortemente per la costruzione ed il running del Tier2 (come fanno per l’hardware) Le risorse del Tier2 devono essere condivise: Accessibilità tramite Grid per l’esperimento Sharing con altri esperimenti Devono essere considerate risorse per tutto l’INFN (e non solo...) Il direttore deve impegnarsi a supportare il Tier2: spazi: un Tier2 medio ospiterà a regime circa 120 Box CPU e 40 box disco (600TB) per un totale di 6-8 racks infrastrutture: devono essere già largamente disponibili e supportate dalla struttura (power+cooling) manpower: un minimo di 2 FTE spalmati su 4 persone deve trattarsi di personale strutturato o strutturabile.
20/3/06 F.Forti - Tier2 ALICE 4 Le richieste degli esperimenti Presentati i progetti di massima Dimensione, infrastruttura, personale 10 sedi per 13 centri Diversi livelli di maturità dei progetti BariALICE CMS CataniaALICE CNAFLHCb LNFATLAS LNLALICE CMS MilanoATLAS NapoliATLAS PisaCMS Roma1ATLAS CMS TorinoALICE 1 box oggi = 5 kSI2K 1 box 2010 = 20 kSI2K ? 1 box oggi = 5 kSI2K 1 box 2010 = 20 kSI2K ? Fattore ~2 di sicurezza
20/3/06 F.Forti - Tier2 ALICE 5 MoU INFN Nelle fasi finali della firma. Numeri congelati. Tier2 rappresentati da una federazione
20/3/06 F.Forti - Tier2 ALICE 6 Finanziamento dei TIER2 CPU e dischi sono finanziati dalle commissioni scientifiche nazionali I e III Gli interventi infrastrutturali sono finanziati sui fondi delle sezioni principalmente attraverso la Commissione Calcolo e Reti
20/3/06 F.Forti - Tier2 ALICE 7 Richieste di Alice ORIGINARIORIDOTTO
20/3/06 F.Forti - Tier2 ALICE 8
20/3/06 F.Forti - Tier2 ALICE 9 Incertezze Il modello di computing è ancora preliminare Target performance non sempre raggiunta Modello di analisi distribuita untested La quantità di risorse di calcolo richieste è solo un educated guess Lo share INFN del computing non è fissato a priori Dipenderà dall’effettivo coinvolgimento dei gruppi italiani e dalle risorse disponibili Nessuno sa quanti dati verranno da LHC nei primi anni Ci potrebbe essere un ridimensionamento iniziale Per i computer, il tempo (di acquisto) è denaro Specificatamente per ALICE Maggiori incertezze per il timing del run Pb-Pb Ignota la molteplicita’ degli eventi entro grossi fattori L’evoluzione della tecnologia oltre il è estremamente nebulosa Fine della corsa al GHz Avvento dei multi core Problema della potenza assorbita
20/3/06 F.Forti - Tier2 ALICE 10 Percorso di referaggio Sono state visitate tutte le sedi proposte U.Dosselli, F.F., M.Morandin + referee Incontro con Direttore, Gruppo calcolo, Esperimenti Visita ai locali presenti e futuri Molto istruttivo e utile – grazie per l’accoglienza. Grande variabilità di situazioni Elementi principali di indagine Quantità di risorse di computing richieste: sono giustificate dalla prevista attività del Tier2 ? Supporto sistemistico e di manpower degli esperimenti: esiste un supporto sufficiente da parte del gruppo calcolo, esiste un gruppo sperimentale forte e motivato ? Aspetti infrastrutturali (spazio, potenza, raffreddamento): quanto è costosa l’infrastruttura necessaria, e quanto di questi costi è a carico INFN ?
20/3/06 F.Forti - Tier2 ALICE 11 Numero di Tier2 Nessun esperimento è in grado di dimostrare che gli serve veramente la potenza di calcolo e quantità di storage che chiede Nessun esperimento è in grado di dimostrare che gli servono 4 Tier2 INFN Tuttavia le richieste non sono irragionevoli Dimensionamento dei centri in modo da essere gestibili da una sezione di media grandezza In linea con i modelli di calcolo degli esperimenti Però avere molti Tier2 aumenta il livello di duplicazione infrastrutture e dati Essenziale (maggiore) collaborazione: I centri Tier2 e non-Tier2 devono e dovranno collaborare tra loro e con il Tier1 per la costruzione e l’operazione delle strutture
20/3/06 F.Forti - Tier2 ALICE 12 Princìpi guida Prudenza Partenza alla giusta velocità Flessibilità Prevedere contingenza e scalabilità per adattarsi ai prevedibili mutamenti Gradualita’ Prevedere una crescita continua e modulare Ottimizzazione delle risorse disponibili Risorse umane distribuite Strutture esistenti Finanziamenti esterni all’INFN
20/3/06 F.Forti - Tier2 ALICE 13 Non tutti Non vogliamo far partire tutti Tier2 adesso Le incertezze di cui sopra impongono prudenza quantità di calcolo, modello distribuito, quantità dati LHC Non esiste una chiara e documentata necessità I costi non sarebbero assorbibili sul bilancio 2006 Questioni Quali criteri ? Quanti e quali centri iniziano nel 2006 ? Cosa succede degli altri centri ? Ovviamente i Tier2 che iniziano sono soggetti a verifiche periodiche
20/3/06 F.Forti - Tier2 ALICE 14 Criteri Gli elementi principali sono Motivazione del gruppo dell’esperimento e quantità di manpower dedicata Esistenza di una chiara e consistente comunità di riferimento nell’esperimento Manpower reperibile nel gruppo calcolo Capacità della sede di gestire il sistema ed esperienza pregressa su farm e grid Maturità e completezza del progetto Complessità e costo dell’intervento infrastrutturale necessario Finanziamento infrastrutturale esterno all’INFN Seguono alcune riflessioni ed i criteri utilizzati
20/3/06 F.Forti - Tier2 ALICE 15 Tier2 ed esperimento I Tier2 sono pezzi di esperimento Vanno considerati alla stregua di sottorivelatori che i fisici dell’esperimento progettano, costruiscono ed operano avvalendosi del supporto tecnico di sezione Non si possono considerare un servizio che il gruppo calcolo fornisce e l’esperimento utilizza I Tier2 hanno bisogno di un gruppo di fisici motivati che li costruisca ed operi Le responsabilità dovrebbero essere assegnate a personale strutturato I Tier2 forniscono servizi a tutti e quindi Incoraggiamo a trovare collaborazioni tra sezioni per costituire i gruppi di supporto ai Tier2 Abbiamo motivato le sezioni non candidate Tier2 a seguire questa strada non assegnando nessun finanziamento per i Tier3.
20/3/06 F.Forti - Tier2 ALICE 16 Valutazione Tier2/esperimento Dimensione del gruppo FTE del gruppo in sezione Manpower esperimento FTE di esperimento (fisici) dedicata al Tier2 Esperienza in GRID Esperienza pregressa in attivita’ Grid Comunita' di riferimento Dimensione della comunita’ di riferimento del Tier2
20/3/06 F.Forti - Tier2 ALICE 17 Infrastruttura Spazio, Potenza elettrica, UPS, gruppo elettrogeno, raffreddamento, network (non CPU, dischi) Casistica tecnica Ristrutturazione della sala esistente Allargamento della sala esistente a locali più o meno vicini Creazione di una nuova sala macchine distante dalla esistente Casistica finanziaria Finanziamento integrale INFN Finanziamento INFN utilizzando in parte fondi di dotazione o fondi CCR già assegnati Finanziamento parziale di altri enti o progetti Finanziamento totale di altri enti o progetti Il costo per l’INFN può essere molto diverso nei vari casi
20/3/06 F.Forti - Tier2 ALICE 18 Manpower di sezione Quante persone servono per un Tier2 ? Poche ma buone Non è necessario uno stuolo di persone, ma servono invece forze specifiche dedicate, con buona esperienza di farm e grid Le persone devono essere già strutturate o strutturabili nel piano di sviluppo della sezione Non è pensabile avere personale in più per il Tier2 I Tier2 dovranno operare per lungo tempo, ed il personale a tempo determinato non garantisce la continuità
20/3/06 F.Forti - Tier2 ALICE 19 Valutazione Infrastruttura e Servizi Maturita' del progetto infrastrutturale Quanto il progetto e’ maturo e finalizzato Manpower tecnico e tecnologo FTE tecnici di sezione+esperimento Stato attuale infrastrutture Quanto sono gia’ pronte le infrastrutture Disponibilita' finanziamenti esterni Se sono disponibili finanziamenti non INFN Necessita' di nuovi finanziamenti Necessita’ di soldi freschi INFN Dimensioni farm attuali Indicazione dell’attivita’ di farming pregressa La valutazione è comune per i Tier2 doppi.
20/3/06 F.Forti - Tier2 ALICE 20 Meccanismo della valutazione Si assegna un voto ad ogni criterio Si mediano i voti con dei pesi a formare due valutazioni: Infrastruttura e servizio Esperimento Le due valutazioni vengono poi mediate per la valutazione finale. Abbiamo verificato una sostanziale stabilita’ dei risultati. Insufficiente1 Scarso2 Sufficiente3 Buono4 Ottimo5
20/3/06 F.Forti - Tier2 ALICE 21 BARI Gruppo Alice (comunità di riferimento): 24.1 FTE Progetto da realizzare il Tier2 doppio in una nuova sala da acquisire ed attrezzare Possibilita’ di spostamenti futuri Possibilita’ di realizzarla all’interno del dipartimento Costo: circa 526K totalmente a carico INFN forse il 20-30% a carico dotazioni di sezione Manpower Tec 3.4 FTE per due TIER2 Attivita’ pregressa: Molto attivo in GRID, con contributo molto grande rispetto al numero di macchine disponibili (una quarantina in tutto)
20/3/06 F.Forti - Tier2 ALICE 22 ALICE-BARI T2 Personale del servizio calcolo dedicato al Tier2 a tempo indeterminato3 corrispondenti a (3x0.3) = 0.9 FTE a tempo determinato1 corrispondenti a (1x0.3) = 0.3 TFE TOTALI4 corrispondenti a 1.2 FTE Comunità di riferimento ALICE-Bari Numero totale dei ricercatori31 per un totale di 24.1 FTE Strutturati16 per un totale di 9.6 FTE Post-doc 4 per un totale di 4.0 FTE Dottorandi e Borsisti11 per un totale di 10.5 FTE Fisici direttamente coinvolti per il T2 Strutturati 4 Non strutturati 2 Tecnologi direttamente coinvolti 0 Tecnici direttamente coinvolti 3 per un totale di 1.2 FTE( ) N.B. Dati presi dai libroni INFN “Preventivo per l’anno 2006” Alice-HMPID, Alice-PIX, Alice-GRID
20/3/06 F.Forti - Tier2 ALICE 23 CATANIA Gruppo Alice: 7 persone Infrastruttura largamente disponibile Da allargare alla sala adiacente Finanziamenti addizionali PON, TriGrid Manpower tec 2 FTE sezione + grosso gruppo di personale temporaneo GRID Attivita’ pregressa Molto attivo Farm di grandi dimensioni gia’ esistente
20/3/06 F.Forti - Tier2 ALICE 24
20/3/06 F.Forti - Tier2 ALICE 25 LEGNARO-PADOVA Gruppo Alice: 10.8 FTE Progetto di Tier2 doppio CMS-Alice Infrastruttura da incrementare significativamente Progetto iniziale Nuova sala 009 in aggiunta alla ristrutturazione di 0022 Costo: 740K+IVA Nuovo progetto di 10 giorni fa Estensione della sala 009 Costo: 549K+IVA A carico INFN, ma largamente sostenuto dal Laboratorio FTE tec per due Tier2 1.5 staff temp da PD a partire dal 2007 Attivita’ pregressa Gruppo Alice poco coinvolto in attivita’ di calcolo e Grid sino ad adesso Farm esistente di grosse dimensioni, di provenienza CMS Gruppo CMS molto attivo in Grid e calcolo
20/3/06 F.Forti - Tier2 ALICE 26 LEGNARO
20/3/06 F.Forti - Tier2 ALICE 27 Legnaro – Padova Servizio Calcolo personale a tempo indeterminato5 (LNL) + 8 (PD) a tempo determinato0 (LNL) + 1 (PD) FTE dedicati al Tier 2 a tempo indeterminato1.5 (LNL) + 2 (PD: 1 dal 2007, 1 dal 2008) a tempo determinato1.2 (LNL) Comunita’ ricercatori nelle sedi LNL+PD 11 (a tempo indeterminato) + 5 (a tempo determinato) totale 10.8 FTE ricercatori della comunita’ di riferimento (Udine) 1 (a tempo indeterminato) totale 0.5 FTE Fisici direttamente coinvolti gestione (3 persone, 2 FTE) staff: 3, post-doc: 0, altri: 0 Tecnologi direttamente coinvolti: 0 Tecnici direttamente coinvolti: 0
20/3/06 F.Forti - Tier2 ALICE 28 TORINO Gruppo Alice: 30 persone Tier2 nella sala calcolo attuale, suddivisa Costo infrastruttura: 220K IVA inclusa A carico totale INFN (recente potenziamento con fondi di sezione) FTE Tec 2.5 staff + 1 temp + gruppo pers GRID Attivita’ pregressa Gruppo di ricercatori molto coinvolti nel calcolo Farm funzionante di medie dimensioni
20/3/06 F.Forti - Tier2 ALICE 29
20/3/06 F.Forti - Tier2 ALICE 30 Ranking
20/3/06 F.Forti - Tier2 ALICE 31 Tier2 Ranking
20/3/06 F.Forti - Tier2 ALICE 32 Proposta dei referee Finanziare nel 2006 i Tier2 di Torino e Catania Entita’ del finanziamento da discutere Naturalmente saranno soggetti a verifiche periodiche. Mettere nell’incubatore Bari e Legnaro Che cosa significa ?
20/3/06 F.Forti - Tier2 ALICE 33 L’incubatore di TIER2 Alcuni TIER2 sono leggermente piu’ prematuri degli altri e vengono messi in incubatore I motivi di immaturita’ individuati sono: Bari: infrastruttura non ben definita e costosa Legnaro: gruppo poco coinvolto nelle attivita’ di calcolo non si tratta nè di una approvazione preventiva nè di una bocciatura definitiva queste sedi vengono mantenute su “life support”, con una crescita modesta, ma sufficiente a mantenere l’attività e rispondere alle esigenze dell’esperimento la sede deve diventare o rimanere attiva in GRID e nei SC, DC, possibilmente collaborando con i Tier2 alla soluzione dei problemi comuni Se per questo sono necessarie risorse, vanno finanziate Ci saranno momenti di verifica per valutare se modificare questo schema
20/3/06 F.Forti - Tier2 ALICE 34 Come si esce dall’incubatore ? Per far partire ulteriori Tier2 si devono verificare alcune condizioni: la sede risolve i suoi punti di debolezza i Tier2 finanziati dell’esperimento funzionano con alta efficienza si capisce che il modello di analisi distribuita degli esperimenti LHC funziona si dimostra che la potenza di calcolo addizionale è effettivamente necessaria nei tempi previsti
20/3/06 F.Forti - Tier2 ALICE 35 Prossimi passi Discussione con l’esperimento - Fatto Sviluppo dei progetti dettagliati per i Tier2 approvati Armonizzazione tra soluzioni sulla base delle linee guida della CCR Determinazione dell’entita’ del finanziamento Esame delle esigenze a breve termine Definizione del piano temporale di verifica
20/3/06 F.Forti - Tier2 ALICE 36 BACKUP
20/3/06 F.Forti - Tier2 ALICE 37 Piano finanziario Nostra proposta di settembre 2005, approvata in commissione con finanziamento 0 (escluse infrastrutture) Costi infrastrutturali non chiari: tra >1.5 e <5 M€ ?