La presentazione è in caricamento. Aspetta per favore

La presentazione è in caricamento. Aspetta per favore

Claudio Grandi INFN Bologna IFAE 2004 - Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN -

Presentazioni simili


Presentazione sul tema: "Claudio Grandi INFN Bologna IFAE 2004 - Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN -"— Transcript della presentazione:

1 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN - Bologna

2 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 2 Outline Le problematiche del calcolo ad LHC Griglie Computazionali (GRID) I progetti GLOBUS e Condor I progetti di sviluppo del middleware per HENP LHC Computing Grid (LCG)

3 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Le problematiche del calcolo ad LHC

4 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 4 Calcolo per gli esperimenti LHC Gli esperimenti LHC sono “grandi”, con partecipanti distribuiti sull’intero globo. Anche la mole dei dati è “grande”: non possono essere replicati tutti in tutti i siti. L’accesso ai dati deve essere garantito ad ognuno, indipendentemente dalla sua locazione e dalla sua preparazione informatica (l’utente non è in generale un esperto di software). La produzione di dati simulati (oggi) ma soprattutto l’analisi (sempre) non sono concentrate in un unico sito ma distribuite su molti (se non tutti) i siti.

5 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 5 Accesso ai dati distribuiti

6 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 6 Modello di calcolo a-la Monarc Tier 1 Tier2 Center Online System CERN Center PBs of Disk; Tape Robot CNAF Center IN2P3 Center FNAL Center RAL Center Institute Workstations ~ MBytes/sec Gbps 0.1 to 10 Gbps Physics data cache ~PByte/sec ~ Gbps Tier2 Center ~ Gbps Tier 0 +1 Tier 3 Tier 4 Tier2 Center Tier 2 Experiment

7 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 7 Il problema… È necessario “nascondere” all’utente la complessità del sistema sottostante L’utente deve lavorare come se: avesse di fronte un unico cluster di macchine i dati fossero su un unico pool di dischi accessibile da ogni macchina del cluster e da ogni utente tutti i dati fossero sul pool di dischi lo spazio disco accessibile in scrittura dall’utente fosse sul pool di dischi e “virtualmente” infinito È impossibile?!?

8 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Griglie computazionali: GRID

9 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 9 Da dove nasce la Grid? Il concetto è introdotto da Ian Foster e Carl Kesselman È un “paradigma” di utilizzo delle risorse distribuite Si materializza negli anni ’90 in Globus, nato per interconnettere alcuni centri di calcolo USA Evoluzione: utilizzo dei Web Services (WSDL) –Open Grid Service Infrastructure (OGSI): introdotto nel 2001 –WS Resource Framework (WSRF): introdotto il 20/1/2004 (!) rimpiazza OGSI ma non c’ è ancora nulla…

10 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 10 Una definizione di Grid Grid è l'insieme delle tecnologie software che consentono la condivisione di risorse e la risoluzione coordinata di problemi nell'ambito di organizzazioni virtuali multi istituzionali, dinamiche e scalabili [ I.Foster]

11 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 11 Organizzazioni Virtuali I partecipanti: insieme dinamico di individui e istituzioni Le risorse: computers, software, dati, strumenti Grid fornisce la capacità di negoziare la condivisione delle risorse fra le diverse parti in causa (fornitori e clienti) e quindi uso dell’insieme delle risorse risultanti per perseguire uno scopo [I.Foster]

12 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 12 Un parallelo: la rete elettrica La rete elettrica Richiesta di risorse (potenza: KWatt installati) Si inserisce la spina di un apparecchio elettrico Si usa l’apparecchio: non è necessario sapere da dove arriva l’energia elettrica!!! La manutenzione è a carico del fornitore La Grid Computazionale Richiesta di risorse (CPU, disco, ecc…) Si collega alla rete un computer Si usa il computer: non è necessario sapere da dove arrivano le risorse!!! La manutenzione e’ a carico del fornitore

13 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 13 Accesso alle risorse con Grid Grid

14 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 I progetti GLOBUS e Condor

15 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 15 L’iniziativa Globus Nasce agli Argonne National Laboratories (ANL) E’ un toolkit e un insieme di servizi che indirizzano problemi tecnici chiave: modello “bag of services” modulare non è una soluzione “verticalmente integrata” strumenti di infrastruttura generale (middleware) che possono essere applicati a molti domini applicativi Utilizza standard e implementazioni “open source” ovunque possibile

16 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 16 Globus: architettura a layers Core services Local OS A p p l i c a t i o n s Diverse global services Application Fabric Controllo locale ed accesso alle risorse Connectivity Comunicazione tra le risorse e sicurezza delle transazioni Resource Controllo dell’uso condiviso delle singole risorse Collective Coordinamento e condivisione di gruppi di risorse Supporto per una varietà di ambienti locali (OS, etc…) Supporto per una varietà di utenti finali Il toolkit implementa i Core services che devono essere semplici e generali

17 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 17 Globus: componenti base Fabric Layer: –meccanismi di base: start di programmi accesso ai files … Connectivity Layer: –comunicazione via IP –sicurezza tramite Grid Security Infrastructure (GSI) basata su meccanismi a chiave pubblica (TSL/SSL, certificati X.509 & Certification Authorities, ecc…). meccanismo uniforme per la autenticazione e autorizzazione degli utenti Autenticazione: verifica dell’identità di un utente (o una risorsa) Autorizzazione: accesso alle risorse ad uno specifico utente

18 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 18 Globus: componenti base Resource Layer: –Usa GSI per la sicurezza –Grid Resource Allocation Management (GRAM) gira su ogni risorsa; garantisce il controllo remoto delle risorse –GridFTP (FTP modificato) per il trasferimento files –Grid Resource Information Server (GRIS) raccoglie e pubblica dinamicamente le informazioni sulla risorsa (ad es. memoria installata, code dponibili, ecc…) Collective Layer: esempi: –Metacomputing Directory Service (MDS): GRIS e GIIS –Grid Index Info Server (GIIS) raccoglie, e pubblica informazioni selezionate da diversi GRIS –Resource Broker seleziona risorse adatte per un job –Replica Catalog e Replica Services gestiscono l’accesso e la copia dei dati distribuiti

19 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 19 Accesso ad una risorsa Grid Security Infrastructure Job Manager GRAM client API calls to request resource allocation and process creation. MDS client API calls to locate resources Query current status of resource Create RSL Library Parse Request Allocate & create processes Process Monitor & control Site boundary ClientMDS: Grid Index Info Server Gatekeeper MDS: Grid Resource Info Server Local Resource Manager MDS client API calls to get resource info GRAM client API state change callbacks Da: “ Introduction to Grid Computing and the Globus Toolkit™”

20 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 20 Condor Sviluppato alla University of Wisconsin negli anni ’80 Punta a fornire “cicli di CPU” altrimenti non utilizzati Gestiti insiemi (pool) di calcolatori eterogenei L’INFN lo utilizza dal 1997 su scala geografica Robusto, ma ha alcune limitazioni per HEP: –sistema monolitico (e non totalmente open source) –inefficiente nell’accesso a grandi moli di dati distribuiti –usa canali di rete non sicuri per la comunicazione –alcune componenti di Condor usate dai progetti grid

21 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 I progetti di sviluppo del middleware per HEP

22 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 22 Principali progetti Grid per HENP PPDG –Produce il Virtual Data Toolkit (include Globus, Condor, …) –Stretta collaborazione con ciascuno degli esperimenti European DataGrid –Servizi di alto livello basati su Globus e Condor-G –Supporto per diverse scienze GriPhyN –Partner di PPDG per VDT. Introduce i Virtual Data European DataTAG –Europeo, dedicato all’interoperabilità con gli USA iVDGL –Americano, dedicato all’interoperabilità con l’Europa Progetti in fase di start-up: EGEE (UE), Grid3 (USA)

23 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 23 Architettura di DataGrid Collective Services Information & Monitoring Replica Manager Grid Scheduler Local Application Local Database Underlying Grid Services Computing Element Services Authorization Authentication and Accounting Replica Catalog Storage Element Services SQL Database Services Fabric services Configuration Management Configuration Management Node Installation & Management Node Installation & Management Monitoring and Fault Tolerance Monitoring and Fault Tolerance Resource Management Fabric Storage Management Fabric Storage Management Grid Fabric Local Computing Grid Grid Application Layer Data Management Job Management Metadata Management Object to File Mapping Service Index Da: B.Jones

24 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 24 Esempio di Job Submission UI JDL Logging & Book-keeping ResourceBroker Job Submission ServiceStorageElementComputeElement InformationService Job Status ReplicaCatalogue DataSets info Author. &Authen. Job Submit Event Job Query Job Status Input “sandbox” Input “sandbox” + Broker Info Globus RSL Output “sandbox” Job Status Publish grid-proxy-init Expanded JDL SE & CE info Da: B.Jones

25 Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 LHC Computing Grid LCG

26 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 26 Ruolo di LCG LCG è il progetto CERN nato nel 2002 che supporta tutte le esigenze di calcolo di LHC –infrastruttura hardware, librerie numeriche, event- generators, persistenza dei dati, grid, ecc… Due releases di sistemi grid: LCG-1 e LCG-2 –Basate su middleware di VDT, DataGrid e DataTAG E’ in fase iniziale il progetto ARDA (assieme ad EGEE) –Middleware e strumenti software comuni agli esperimenti per il supporto all’analisi dei dati –Userà anche software dagli esperimenti, in particolare Alien: sistema grid per il supporto all’analisi dati distribuita di ALICE, che usa direttamente middleware di basso livello (non dai “grid projects”)

27 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 27 Decomposizione funzionale di Alien Program Root SE Wrapper Node VO Job Catalog File Catalog Posix Data Placement Batch queue Internal User ID VO Unix ID UI External User ID Job Optimizer CE

28 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 28 Utilizzo di LCG in CMS User Interface BOSS DB McRunjob + ImpalaLite CMSProd RefDB JDL Grid (LCG) Scheduler RLS SE CE CMS software CE CMS software CE CMS software CE SE WN SE CE CMS software Job metadata Dataset metadata Push data or info Pull info Grid Information System (bdII)

29 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 29 Data challenges su grid Produzione dati simulati su Grid3 negli USA per il Data Challenge 2004 di CMS Jobs nel sistema AliEn di Alice durante il Data Challenge 2004 Number of simulated events

30 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 30 I servizi di ARDA

31 Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 31 Conclusioni Gli strumenti grid forniscono una grande opportunità per gestire l’accesso a dati e risorse distribuiti –In modo sicuro e con la corretta gestione dei privilegi –In modo trasparente per l’utente Tre anni di (faticosa) esperienza con i progetti grid hanno permesso di identificare le componenti base –Gli esperimenti hanno costruito prototipi per i loro sistemi di calcolo anche se a volte privilegiando aspetti diversi sia in termini di funzionalità che di affidabilità –Alcuni strumenti sono già “in produzione” Il prossimo passo è quello di consolidare gli strimenti per reggere all’impatto dell’analisi dati di LHC –LCG al CERN, assieme ai progetti grid EGEE e Grid3, ci deve fornire il sistema in tempo per l’inizio della presa dati Non ci sono vere alternative a grid per gestire i dati di LHC!!!


Scaricare ppt "Claudio Grandi INFN Bologna IFAE 2004 - Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN -"

Presentazioni simili


Annunci Google