Claudio Grandi INFN Bologna IFAE 2004 - Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN -

Slides:



Advertisements
Presentazioni simili
Introduzione al prototipo Grid-SCoPE
Advertisements

EUCIP IT Administrator Modulo 4 - Uso Esperto della Rete Reti informatiche: Introduzione AICA © 2005.
Il Caso O.S.B. Organizzazione Servizi Bancari Dr. Giuseppe Mazzoli AltaVia Consulting Snc Società di consulenza per l'informatica e l'e-business.
ISA Server 2004 Enterprise Edition Preview. ISA Server 2004.
Java Enterprise Edition (JEE)
1 Università degli Studi di Modena e Reggio Emilia Facoltà di Ingegneria – Sede di Modena Corso di Laurea in Ingegneria Informatica – Nuovo Ordinamento.
1 Area Comunicazione e Sviluppo Web09/10/2003Sito Web Provincia di Torino Provincia di Torino Area Relazioni e Comunicazione 1 01/12/03 Portale della Provincia.
Cluster openMosix Linux Day ’04 Caserta Ing. Diego Bovenzi.
23/01/01Alberto Masoni – GR1 - Roma1 I MODELLI DI CENTRI REGIONALI POSIZIONE DI ALICE ITALIA CENTRO ITALIANO: CPU 450 KSI95, DISCO 400 TB (INSIEME TIER-1.
Distributed Object Computing
Architettura Three Tier
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
1 La farm di ATLAS-Napoli 1 Gb/s 7 nodi con 2 CPU PIII a 1 GH, RAM 512 MB, 2 schede di rete a 100 Mb/s. Server con 2 CPU PIII a 1 GH, RAM 1 GB, 2 schede.
Griglie computazionali
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 ATTIVITA DEL GRUPPO TECNICO OPERATIVO Riunione del Comitato Tecnico sullInteroperabilità MUR,
Proposta di integrazione e consolidamento delle risorse presenti nellinfrastruttura Grid dellItalia Meridionale (L. Merola, )
1 STATO DELLINTEGRAZIONE TRA I 4 PROGETTI AVVISO 1575/2004 Riunione del Comitato Tecnico sullInteroperabilità MUR, 20/12/2007 S.Pardi.
Remote file access sulla grid e metodi di interconnesione di rete M. Donatelli, A.Ghiselli e G.Mirabelli Infn-Grid network 24 maggio 2001.
Proposta di integrazione e consolidamento delle risorse presenti nellinfrastruttura Grid dellItalia Meridionale (L. Merola, )
1 Riunione del 29 Marzo 2007 IL PROGETTO SCoPE Prof. Guido Russo I lavori Le apparecchiature Il portale.
per la fisica delle alte energie
Test del Monitoraggio del Tracker usando un Tier2 M.S. Mennea, G. Zito, N. De Filippis Università & INFN di Bari Riunione Consorzio – Torino 18 Novembre.
2) Sistemi operativi Lab. Calc. AA2004/05 - cap.2.
Workshop CNAF – Bologna 8 Luglio 2011 FARO Accesso Web a risorse e servizi remoti in ambiente Grid/Cloud A. Rocchi, C. Sciò, G. Bracco, S. Migliori, F.
La facility nazionale Egrid: stato dell'arte Egrid-Team Trieste, 9 ottobre 2004.
4 Cosa è una rete? ã Punto di vista logico: sistema di dati ed utenti distribuito ã Punto di vista fisico: insieme di hardware, collegamenti, e protocolli.
Flavia DonnoCommissione I, Perugia Novembre I progetti di integrazione di GRID EU-US Flavia Donno INFN Sezione di Pisa Riunione Comm. I sul.
Grid Computing Sergio Andreozzi (INFN-CNAF). A chi interessano i dati prodotti da LHC? Circa 5,000 scienziati –sparsi nel mondo –appartenenti ad istituzioni/università
Grid Computing Sergio Andreozzi. Chi è interessato ad analizzare i dati generati da LHC? Circa 5,000 scienziati –distribuiti nel mondo –appartenenti ad.
Reti di Calcolatori L-S Un Sistema Decentrato di Allocazione del Carico per Applicazioni di Calcolo Distribuito Mauro Bampo.
Gruppo Directory Services Rapporto dell'attivita' svolta - Marzo 2000.
Alessandro Italiano INFN - CNAF Grid.it 14 Febbraio 2003 Servizi Generali: RB, UI, RC Information System Alessandro Italiano Grid.it 16 febbraio 2003.
1 Riunione Testbed - 17 gennaio Agenda - stato del testbed di INFN-GRID (L. Gaido) - le risorse del CNAF (A. Italiano) - report sullo stress test.
25 ottobre 2002infn1 FIRB-Grid WP3,5 Grid deployment.
LNL M.Biasotto, Bologna, 13 dicembre Installazione automatica Massimo Biasotto – INFN LNL.
INFN-GRID WP1 20 novembre 2000 Sperimentazione GridFTP Luciano Gaido 1 Progetto INFN-GRID Sperimentazione GridFTP Riunione WP1 (GLOBUS) Cnaf, 20 novembre.
1 Il testbed di LCG Riunione Testbed – CNAF, 17 gennaio 2003 L. Gaido.
Il calcolo distribuito in ATLAS
1 M. Biasotto – Legnaro, 22 Dicembre 2005 Prototipo Tier 2 di Legnaro-Padova INFN Legnaro.
5 Feb 2002Stefano Belforte – INFN Trieste calcolo per CDF in Italia1 Calcolo per CDF in Italia Prime idee per lanalisi di CDF al CNAF Numeri utili e concetti.
U N INFRASTRUTTURA DI SUPPORTO PER SERVIZI DI FILE HOSTING Matteo Corvaro Matricola Corso di Reti di Calcolatori LS – Prof. A. Corradi A.A.
Stefano Di Giovannantonio ECM Consulting Solution Expert
Servizi Grid ed agenti mobili : un ambiente di sviluppo e delivering
EGEE is a project funded by the European Union under contract IST Using SRM: DPM and dCache G.Donvito,V.Spinoso INFN Bari
Sistemi Informativi sul Web
Simulatore per un servizio di consistenza su architettura Grid
Reti di calcolatori LS Manni Tiziano  IT e nuovi scenari applicativi …  … portabilità dei dati …  … condivisione dati …  … disponibilità.
FESR Trinacria Grid Virtual Laboratory ADAT (Archivi Digitali Antico Testo) Salvatore Scifo TRIGRID Second TriGrid Checkpoint Meeting Catania,
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
FESR Consorzio COMETA Pier Paolo CORSO Giuseppe CASTGLIA Marco CIPOLLA Industry Day Catania, 30 Giugno 2011 Commercial applications.
CNAF 18/11/2004 Federica Fanzago INFN Padova a/grape... BAT... BATMAN...o? M.Corvo, F.Fanzago, N.Smirnov (INFN Padova) + tutte le persone che fanno i test.
Workshop sulle problematiche di calcolo e reti nell’INFN Paestum,9-12 giugno 2003 Report sull’ultimo HEPiX e proposte per le prossime edizioni Roberto.
10 azioni per lo scheduling su Grid Uno scheduler per Grid deve selezionare le risorse in un ambiente dove non ha il controllo diretto delle risorse locali,
16 Maggio CSN1 Computing-Software-Analysis CMS-INFN TEAM Analisi in CMS: stato e prospettive del supporto italiano.
LNL CMS M.Biasotto, Roma, 22 novembre I Tier2 in CMS Italia Massimo Biasotto - LNL.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
Draft planning of the report Massimo Sgaravatto INFN Padova.
Flavia DonnoCommissione I, Perugia Novembre I progetti di integrazione di GRID EU-US Flavia Donno INFN Sezione di Pisa Riunione Comm. I sul.
Sistemi operativi di rete Ing. A. Stile – Ing. L. Marchesano – 1/18.
La clessidra di Globus Focus su problemi architetturali –Propone un insieme di servizi di base come nucleo dell’infrastruttura –Utilizzo per la costruzione.
Layered Grid Architecture. Application Fabric “Controlling elements locally”: Access to, & control of, resources Connectivity “Talking to Grid elements”:
I testbed ed il loro uso 1 I testbed ed il loro uso L. Gaido, A.Ghiselli CSN1, Perugia novembre 2002.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
Claudio Grandi Workshop CCR 2015 Claudio Grandi INFN Bologna.
CCR - Frascati 29 settembre 2008 Gruppo storage CCR Status Report Alessandro Brunengo.
Overview del middleware gLite Guido Cuscela INFN-Bari II Corso di formazione INFN su aspetti pratici dell'integrazione.
FESR Trinacria Grid Virtual Laboratory La sicurezza dei dati in ambiente Trigrid Giordano Scuderi.
IV Corso di formazione INFN per amministratori di siti GRID Tutorial di amministrazione DGAS Giuseppe Patania.
FESR Trinacria Grid Virtual Laboratory Workload Management System (WMS) Muoio Annamaria INFN - Catania Primo Workshop TriGrid VL Catania,
La gestione della rete e dei server. Lista delle attività  Organizzare la rete  Configurare i servizi di base  Creare gli utenti e i gruppi  Condividere.
Transcript della presentazione:

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Uso di griglie computazionali per il calcolo degli esperimenti LHC Claudio Grandi INFN - Bologna

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 2 Outline Le problematiche del calcolo ad LHC Griglie Computazionali (GRID) I progetti GLOBUS e Condor I progetti di sviluppo del middleware per HENP LHC Computing Grid (LCG)

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Le problematiche del calcolo ad LHC

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 4 Calcolo per gli esperimenti LHC Gli esperimenti LHC sono “grandi”, con partecipanti distribuiti sull’intero globo. Anche la mole dei dati è “grande”: non possono essere replicati tutti in tutti i siti. L’accesso ai dati deve essere garantito ad ognuno, indipendentemente dalla sua locazione e dalla sua preparazione informatica (l’utente non è in generale un esperto di software). La produzione di dati simulati (oggi) ma soprattutto l’analisi (sempre) non sono concentrate in un unico sito ma distribuite su molti (se non tutti) i siti.

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 5 Accesso ai dati distribuiti

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 6 Modello di calcolo a-la Monarc Tier 1 Tier2 Center Online System CERN Center PBs of Disk; Tape Robot CNAF Center IN2P3 Center FNAL Center RAL Center Institute Workstations ~ MBytes/sec Gbps 0.1 to 10 Gbps Physics data cache ~PByte/sec ~ Gbps Tier2 Center ~ Gbps Tier 0 +1 Tier 3 Tier 4 Tier2 Center Tier 2 Experiment

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 7 Il problema… È necessario “nascondere” all’utente la complessità del sistema sottostante L’utente deve lavorare come se: avesse di fronte un unico cluster di macchine i dati fossero su un unico pool di dischi accessibile da ogni macchina del cluster e da ogni utente tutti i dati fossero sul pool di dischi lo spazio disco accessibile in scrittura dall’utente fosse sul pool di dischi e “virtualmente” infinito È impossibile?!?

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 Griglie computazionali: GRID

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 9 Da dove nasce la Grid? Il concetto è introdotto da Ian Foster e Carl Kesselman È un “paradigma” di utilizzo delle risorse distribuite Si materializza negli anni ’90 in Globus, nato per interconnettere alcuni centri di calcolo USA Evoluzione: utilizzo dei Web Services (WSDL) –Open Grid Service Infrastructure (OGSI): introdotto nel 2001 –WS Resource Framework (WSRF): introdotto il 20/1/2004 (!) rimpiazza OGSI ma non c’ è ancora nulla…

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 10 Una definizione di Grid Grid è l'insieme delle tecnologie software che consentono la condivisione di risorse e la risoluzione coordinata di problemi nell'ambito di organizzazioni virtuali multi istituzionali, dinamiche e scalabili [ I.Foster]

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 11 Organizzazioni Virtuali I partecipanti: insieme dinamico di individui e istituzioni Le risorse: computers, software, dati, strumenti Grid fornisce la capacità di negoziare la condivisione delle risorse fra le diverse parti in causa (fornitori e clienti) e quindi uso dell’insieme delle risorse risultanti per perseguire uno scopo [I.Foster]

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 12 Un parallelo: la rete elettrica La rete elettrica Richiesta di risorse (potenza: KWatt installati) Si inserisce la spina di un apparecchio elettrico Si usa l’apparecchio: non è necessario sapere da dove arriva l’energia elettrica!!! La manutenzione è a carico del fornitore La Grid Computazionale Richiesta di risorse (CPU, disco, ecc…) Si collega alla rete un computer Si usa il computer: non è necessario sapere da dove arrivano le risorse!!! La manutenzione e’ a carico del fornitore

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 13 Accesso alle risorse con Grid Grid

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 I progetti GLOBUS e Condor

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 15 L’iniziativa Globus Nasce agli Argonne National Laboratories (ANL) E’ un toolkit e un insieme di servizi che indirizzano problemi tecnici chiave: modello “bag of services” modulare non è una soluzione “verticalmente integrata” strumenti di infrastruttura generale (middleware) che possono essere applicati a molti domini applicativi Utilizza standard e implementazioni “open source” ovunque possibile

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 16 Globus: architettura a layers Core services Local OS A p p l i c a t i o n s Diverse global services Application Fabric Controllo locale ed accesso alle risorse Connectivity Comunicazione tra le risorse e sicurezza delle transazioni Resource Controllo dell’uso condiviso delle singole risorse Collective Coordinamento e condivisione di gruppi di risorse Supporto per una varietà di ambienti locali (OS, etc…) Supporto per una varietà di utenti finali Il toolkit implementa i Core services che devono essere semplici e generali

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 17 Globus: componenti base Fabric Layer: –meccanismi di base: start di programmi accesso ai files … Connectivity Layer: –comunicazione via IP –sicurezza tramite Grid Security Infrastructure (GSI) basata su meccanismi a chiave pubblica (TSL/SSL, certificati X.509 & Certification Authorities, ecc…). meccanismo uniforme per la autenticazione e autorizzazione degli utenti Autenticazione: verifica dell’identità di un utente (o una risorsa) Autorizzazione: accesso alle risorse ad uno specifico utente

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 18 Globus: componenti base Resource Layer: –Usa GSI per la sicurezza –Grid Resource Allocation Management (GRAM) gira su ogni risorsa; garantisce il controllo remoto delle risorse –GridFTP (FTP modificato) per il trasferimento files –Grid Resource Information Server (GRIS) raccoglie e pubblica dinamicamente le informazioni sulla risorsa (ad es. memoria installata, code dponibili, ecc…) Collective Layer: esempi: –Metacomputing Directory Service (MDS): GRIS e GIIS –Grid Index Info Server (GIIS) raccoglie, e pubblica informazioni selezionate da diversi GRIS –Resource Broker seleziona risorse adatte per un job –Replica Catalog e Replica Services gestiscono l’accesso e la copia dei dati distribuiti

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 19 Accesso ad una risorsa Grid Security Infrastructure Job Manager GRAM client API calls to request resource allocation and process creation. MDS client API calls to locate resources Query current status of resource Create RSL Library Parse Request Allocate & create processes Process Monitor & control Site boundary ClientMDS: Grid Index Info Server Gatekeeper MDS: Grid Resource Info Server Local Resource Manager MDS client API calls to get resource info GRAM client API state change callbacks Da: “ Introduction to Grid Computing and the Globus Toolkit™”

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 20 Condor Sviluppato alla University of Wisconsin negli anni ’80 Punta a fornire “cicli di CPU” altrimenti non utilizzati Gestiti insiemi (pool) di calcolatori eterogenei L’INFN lo utilizza dal 1997 su scala geografica Robusto, ma ha alcune limitazioni per HEP: –sistema monolitico (e non totalmente open source) –inefficiente nell’accesso a grandi moli di dati distribuiti –usa canali di rete non sicuri per la comunicazione –alcune componenti di Condor usate dai progetti grid

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 I progetti di sviluppo del middleware per HEP

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 22 Principali progetti Grid per HENP PPDG –Produce il Virtual Data Toolkit (include Globus, Condor, …) –Stretta collaborazione con ciascuno degli esperimenti European DataGrid –Servizi di alto livello basati su Globus e Condor-G –Supporto per diverse scienze GriPhyN –Partner di PPDG per VDT. Introduce i Virtual Data European DataTAG –Europeo, dedicato all’interoperabilità con gli USA iVDGL –Americano, dedicato all’interoperabilità con l’Europa Progetti in fase di start-up: EGEE (UE), Grid3 (USA)

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 23 Architettura di DataGrid Collective Services Information & Monitoring Replica Manager Grid Scheduler Local Application Local Database Underlying Grid Services Computing Element Services Authorization Authentication and Accounting Replica Catalog Storage Element Services SQL Database Services Fabric services Configuration Management Configuration Management Node Installation & Management Node Installation & Management Monitoring and Fault Tolerance Monitoring and Fault Tolerance Resource Management Fabric Storage Management Fabric Storage Management Grid Fabric Local Computing Grid Grid Application Layer Data Management Job Management Metadata Management Object to File Mapping Service Index Da: B.Jones

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 24 Esempio di Job Submission UI JDL Logging & Book-keeping ResourceBroker Job Submission ServiceStorageElementComputeElement InformationService Job Status ReplicaCatalogue DataSets info Author. &Authen. Job Submit Event Job Query Job Status Input “sandbox” Input “sandbox” + Broker Info Globus RSL Output “sandbox” Job Status Publish grid-proxy-init Expanded JDL SE & CE info Da: B.Jones

Claudio Grandi INFN Bologna IFAE Torino 15 Aprile 2004 LHC Computing Grid LCG

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 26 Ruolo di LCG LCG è il progetto CERN nato nel 2002 che supporta tutte le esigenze di calcolo di LHC –infrastruttura hardware, librerie numeriche, event- generators, persistenza dei dati, grid, ecc… Due releases di sistemi grid: LCG-1 e LCG-2 –Basate su middleware di VDT, DataGrid e DataTAG E’ in fase iniziale il progetto ARDA (assieme ad EGEE) –Middleware e strumenti software comuni agli esperimenti per il supporto all’analisi dei dati –Userà anche software dagli esperimenti, in particolare Alien: sistema grid per il supporto all’analisi dati distribuita di ALICE, che usa direttamente middleware di basso livello (non dai “grid projects”)

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 27 Decomposizione funzionale di Alien Program Root SE Wrapper Node VO Job Catalog File Catalog Posix Data Placement Batch queue Internal User ID VO Unix ID UI External User ID Job Optimizer CE

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 28 Utilizzo di LCG in CMS User Interface BOSS DB McRunjob + ImpalaLite CMSProd RefDB JDL Grid (LCG) Scheduler RLS SE CE CMS software CE CMS software CE CMS software CE SE WN SE CE CMS software Job metadata Dataset metadata Push data or info Pull info Grid Information System (bdII)

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 29 Data challenges su grid Produzione dati simulati su Grid3 negli USA per il Data Challenge 2004 di CMS Jobs nel sistema AliEn di Alice durante il Data Challenge 2004 Number of simulated events

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 30 I servizi di ARDA

Claudio Grandi INFN Bologna 15 Aprile 2004 IFAE Torino 31 Conclusioni Gli strumenti grid forniscono una grande opportunità per gestire l’accesso a dati e risorse distribuiti –In modo sicuro e con la corretta gestione dei privilegi –In modo trasparente per l’utente Tre anni di (faticosa) esperienza con i progetti grid hanno permesso di identificare le componenti base –Gli esperimenti hanno costruito prototipi per i loro sistemi di calcolo anche se a volte privilegiando aspetti diversi sia in termini di funzionalità che di affidabilità –Alcuni strumenti sono già “in produzione” Il prossimo passo è quello di consolidare gli strimenti per reggere all’impatto dell’analisi dati di LHC –LCG al CERN, assieme ai progetti grid EGEE e Grid3, ci deve fornire il sistema in tempo per l’inizio della presa dati Non ci sono vere alternative a grid per gestire i dati di LHC!!!