Luca Lista - Capri - 10-11/04/2003 Nuovo Computing Model L. Lista.

Slides:



Advertisements
Presentazioni simili
Profilazione d’utente nei sistemi di e-commerce
Advertisements

Le tecnologie informatiche per l'azienda
L’Informatica dal Problema alla Soluzione
File System Cos’è un File System File e Directory
Introduzione al linguaggio C Dr. Francesco Fabozzi Corso di Informatica.
Mario Paolo Giordani 1 Pixel Online Monitoring Responsabile ATLAS: Mario Paolo Giordani Scopo: verifica in tempo reale del funzionamento del.
Realizzazione del file system
IL PATRIMONIO DI DATI - LE BASI DI DATI. Il patrimonio dei dati Il valore del patrimonio di dati: –Capacità di rispondere alle esigenze informative di.
Computing: Attività 2010 Reprocessing e ri-simulazione dati Run7 Extra-production di dati MC alla Y(4S) 10 x cross section bb e cc, 2 x cross section u.
Computing: Attività 2009 Reprocessing e ri-simulazione dati Run7 Extra-production di dati MC alla Y(4S) 10 x cross section bb e cc, 2 x cross section u.
1 Corso di Informatica (Programmazione) Lezione 4 (24 ottobre 2008) Architettura del calcolatore: la macchina di Von Neumann.
Introduzione alle attivita Software e Computing di Atlas Napoli M. Biglietti – G. Carlino – F. Conventi - A. Doria – L. Merola - A. Migliaccio Software:
Introduzione a Scrum
Future Astronomical Software Environment
g.contardi1 EVOLUZIONE INDICE SBN Uninfrastruttura per i servizi catalografici.
2) Sistemi operativi Lab. Calc. AA2004/05 - cap.2.
Sistemi Operativi GESTIONE DEI PROCESSI.
WP 14 Grid Applications for Geophysics Istituto Nazionale di Geofisica e Vulcanologia INGV Progetto FIRB Grid.it Documento di rimodulazione.
Workshop CNAF – Bologna 8 Luglio 2011 FARO Accesso Web a risorse e servizi remoti in ambiente Grid/Cloud A. Rocchi, C. Sciò, G. Bracco, S. Migliori, F.
Modello Relazionale Definisce tipi attraverso il costruttore relazione, che organizza i dati secondo record a struttura fissa, rappresentabili attraverso.
Progetto Di Uninfrastruttura Che Permetta La Modifica Di Dati Condivisi Distribuiti Su Più Nodi Reti di calcolatori L-S Gozzi Daniele
Distributed File System Service Dario Agostinone.
Introduzione alla modellazione di sistemi interattivi
Software per il b-tagging Gabriele Segneri Firenze, 16 Gennaio 2003.
Il software delle DT Attività in corso Stato della simulazione e ricostruzione hit in ORCA Calibrazione Validazione con dati di Testbeam Testbeam Ottobre.
Btag phisics object group Andrea Bocci Scuola Normale Superiore e INFN, Pisa CMS Italia 2007 – 13 Febbraio.
Physics Analysis Tools Luca Lista INFN. Physics Analysis Tools Luca Lista INFN.
La progettazione di un sistema informatico
Modulo 1 - Concetti di base della Tecnologia dell'Informazione
Il processo di sviluppo del Sw: strategia make
Introduzione alla programmazione Object Oriented
Lo sviluppo del progetto informatico
Strumento per l'innovazione di prodotto eco-compatibile per le PMI
VIRTUALIZZAZIONE Docente: Marco Sechi Modulo 1.
Servizi Grid ed agenti mobili : un ambiente di sviluppo e delivering
Design Goals Definiamo le fondamenta dello sviluppo del sistema.
LA GESTIONE DELLASSISTENZA. LO SCENARIO LHelp Desk è Il Servizio di Assistenza Tecnica che si rivolge alla clientela esterna allazienda. LHelp Desk gestisce.
Dati e DBMS DBMS relazionali SQL Progettazione di una base di dati Programma del Corso.
INFN-BOLOGNA-T3 L. Rinaldi I siti Tier-3 nel modello di calcolo di Atlas Configurazione del sito INFN-BOLOGNA-T3 Attività di Analisi e Produzione Attività.
Analysis unibo una proposta. Work flow di una tipica analisi 1.Simulazione di piccoli campioni di eventi per studio segnale 2.Generazione in grande.
Il Sistema Operativo Il Sistema Operativo è costituito dall’insieme dei programmi necessari per far funzionare tutto l’hardware del calcolatore e per nascondere.
CNAF 18/11/2004 Federica Fanzago INFN Padova a/grape... BAT... BATMAN...o? M.Corvo, F.Fanzago, N.Smirnov (INFN Padova) + tutte le persone che fanno i test.
SCHEDA INFORMATIVA DI UNITÀ. Introduzione Applicazione della gerarchia di memoria –Memoria cache fra la CPU e la memoria centrale Il processore vedrà.
SCHEDA INFORMATIVA DI UNITÀ. Introduzione Applicazione della gerarchia di memoria –Memoria cache fra la CPU e la memoria centrale Il processore vedrà.
We make it 1 L’ infrastruttura Virtuale e la gestione Dinamica Fabiano Finamore Infrastructure Optimization Sales Brain Force Italia.
Attivita' Grid in BaBar Workshop sulle Problematiche di Calcolo e Reti nell'INFN Maggio 2004.
Perugia - 12 novembre 2002 M. Morandin - INFN Padova Budget calcolo Babar 2003 e contributo INFN.
Algoritmi euristici per l’ottimizzazione dell’offerta nella raccolta di rifiuti Tesi di laurea di Nicola Bindini Relatore: Chiar.mo Prof. Ing. DANIELE.
Riccardo Capra 1 B A B AR Italia – 10 Aprile 2003 Ricerca dell’h c in decadimenti radiativi Misura del BR(B ±   0c K ± ) Ricerca dell’  c (2S) in decadimenti.
Sistemi operativi di rete Ing. A. Stile – Ing. L. Marchesano – 1/18.
Le norme ISO 9000 ed il Manuale della Qualità
Alex Marchetti Infrastruttura di supporto per l’accesso a un disco remoto Presentazione del progetto di: Reti di calcolatori L-S.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
Stato del calcolo in BaBar e richieste per il 2004, F. Galeazzi, Giugno 2003 Calcolo in BaBar Stato e richieste al CSN1 per il 2004 presentato da F. Galeazzi.
BaBar: stato ed utilizzo delle farms, F. Galeazzi, Settembre 2004, pag. 1 BaBar: stato ed utilizzo delle farms presentato da Fulvio Galeazzi a nome del.
Riunione CCR 21/12/2005 Gruppo Storage Relazione sulla analisi di infrastrutture Fibre Channel e presentazione attivita’ per il 2006 Alessandro Brunengo.
ATLAS Computing Model Lamberto Luminari CSN Gennaio, 2005.
Gruppo ITAS Servizio Elaborazione Dati IAM. Gruppo ITAS Servizio Elaborazione Dati IAM ITAS e IAM Obiettivi  identity management (primario)  access.
Interazione Persona Computer prova di progetto Gruppo: IO Componenti: Carlo Solimando Sito analizzato:
Implementazioni di un analizzatore di protocollo Esistono quattro fondamentali tradeoff per la realizzazione di un analizzatore di protocollo:  Analisi.
Dal problema al programma – ciclo di sviluppo del software La scrittura del programma è solo una delle fasi del processo di sviluppo di un'applicazione.
Domenico Elia1Riunione PRIN STOA-LHC / Bologna Attività per ALICE: sommario e prospettive Domenico Elia Riunione PRIN STOA-LHC Bologna, 18 Giugno.
Utilizzo della VO di theophys per il calcolo lattice QCD G. Andronico M. Serra L. Giusti S. Petrarca B. Taglienti.
19 Ottobre 2012ATLAS Milano1 Stato delle risorse locali di calcolo L. Carminati, L. Perini, D. Rebatto, L. Vaccarossa.
Hardware Struttura fisica (architettura) del calcolatore formata da parti meccaniche, elettriche, elettroniche.
PHP HyperText Prepocessor.  Linguaggio di scripting lato server sviluppato per generare pagine web.  Permette ad un sito web di diventare dinamico 
Servizi ENEA per l’EE Comparto industria Nino Di Franco Sigfrido Vignati ENEA UTEE-IND.
Silvia Arezzini 2 luglio 2014 Consiglio di Sezione per Preventivi.
Il calcolo per l’esperimento GERDA Luciano Pandola INFN, Laboratori del Gran Sasso Riunione della CSN2, LNF Frascati, 29 Novembre 2011.
Esigenze di Rete degli Esperimenti LHC e di Gr1 G. Carlino – INFN Napoli CCR – Roma 8 Settembre 2014.
Transcript della presentazione:

Luca Lista - Capri /04/2003 Nuovo Computing Model L. Lista

Luca Lista - Capri /04/2003 Sommario Metodi di analisi attuali Motivazioni del nuovo modello di calcolo Strumenti per il Bookkeeping Nuovo modello di analisi Stato del progetto

Luca Lista - Capri /04/2003 Il processo di analisi oggi 1.Identificazione dei campioni di dati da analizzare Dati (skim, …), Monte Carlo 2.Sottomissione job di produzione per l’analisi Analisi combinatoria (D, D*, B-reco, …) Calcolo delle quantità fisiche (Fisher, thrust, missing momentum,  E, m ES ) Scrittura ntuple in formato specifico per il Working Group 3.Riduzione delle ntuple per le analisi specifiche (anche in più passi) 4.Produzione dei risultati con analisi interattiva (PAW, ROOT, fit, …) 5.Preparazione dei documenti di analisi (BAD)

Luca Lista - Capri /04/2003 Distribuzione delle produzioni Produzione dei dati e degli skim  Centralizzata, SLAC Produzioni di grosse ntuple  Responsabilità degli AWG Produzione di ntuple ridotte  Responsabilità delle singole analisi Svantaggi:  Occupazione di spazio disco non necessario per le ntuple  Duplicazione delle informazioni  Mantenimento di mini-framework di analisi per gestire le ntuple Es.: semiexcl (“IBU”), cp-framework, …

Luca Lista - Capri /04/2003 Il modelli di calcolo attuale Il modello attuale ha consentito di svolgere analisi in modo soddisfacente  Molti risultati prodotti e pubblicati senza ritardi significativi dovuti alle metodologie di calcolo Molte opinioni giudicano il modello migliorabile  In termini di prestazioni  In termini di funzionalità  In termini di flessibilità

Luca Lista - Capri /04/2003 Motivazioni per un nuovo modello Estendere il modello di calcolo attuale per l’aumento di luminosità  Prompt reconstruction  Ri-processamento  Produzione Monte Carlo Ottimizzare l’uso delle risorse  Spazio disco per gli Analysis Working Groups  Utilizzo CPU  Manutenzione del codice, … Adattarsi a metodologie future  Objectivity  Root  Grid, …

Luca Lista - Capri /04/2003 Il nuovo modello di analisi 1.Identificazione dei campioni di dati da analizzare con strumenti di bookkeeping Omogenei per dati e Monte Carlo 2.Sottomissione (e monitaggio) job di l’analisi Analisi combinatoria (D, D*, B-reco, …) Calcolo delle quantità fisiche Scrittura nuovo micro-DST ridotto contenente le informazioni per l’analisi Working Group Produzione centralizzata per tutta la collaborazione (ogni 3 mesi) 3.Riduzione dei micro-DST per le analisi specifiche 4.Produzione dei risultati con accesso interattivo ai micro-DST (ROOT, …) Oppure produzione di ntuple ridotte e istogrammi nel formato finale per l’analisi 5.Preparazione dei documenti di analisi (BAD)

Luca Lista - Capri /04/2003 Dal vecchio al nuovo modello Skim Ntuple AWG Ntuple ridotte Istogrammi AWG Skim micro ridotti Istogrammi Analysis Document prod. centrale Job AWG Job analisi Root interattivo prod. centrale + cand. compositi + user data AWG job analisi: skim ridotti + user data Root interattivo su nuovi micro Scenari intermedi possibili…

Luca Lista - Capri /04/2003 Requisiti per il nuovo modello Introduzione di nuovi Micro (= Mini ridotti)  Migliori prestazioni (~1kHz), competitive con ntuple  Output configurabile con l’aggiunta di prodotti degli algoritmi di analisi: Dati utente, Candidati compositi  Accesso interattivo (Root/Cint), per evitare proliferare di ntuple Produzione di skim  Centralizzazione della produzione per gli AWG  Deep-copy / pointer-copy prodotte a seconda delle esigenze Estensione dell’uso e funzionalità del Mini  Accesso rapido (~ 1 ora per uno specifico file, 2 settimane per in run complesso)  Esportabilità e distribuzione  Accesso ai Mini a partire dai corrispettivi Micro, se richiesto Documento ufficiale: Computing/internal/CMWG2/Requirements2.pdf

Luca Lista - Capri /04/2003 Nuovi tool di Bookkeeping Antonio Ceseracciu Alvise Dorigo Martino Piemontese

Luca Lista - Capri /04/2003 Bookkeeping: situazione attuale Tracciare i diversi data set  Diversi strumenti esistenti, non sempre consistenti: skimData GoodRun Lumi Bfreport getdata Task management  Intervento manuale richiesto per configurare i job da sottomettere  Frammentazione in job multipli a carico dell’utente

Luca Lista - Capri /04/2003 Obiettivi del nuovo Bookkeeping Migliorare l’interfaccia per gestire i data set  Definizione di concetti generali e dei costituenti di base  permettere richieste con miscele di concetti come “good run”, dati “off-” e “on-resonance”, “processato con la release x.y.z”, etc.  Semplici “short alias”  Uniformità tra dati di collisioni e simulazioni Task management  Per i job di analisi, strumenti per: Configurare Sottomettere Monitorare  Soddisferà i requisiti tipici di un sistema di produzione Il sistema di Bookkeeping funzionerà nei siti TierA  Funzionalità limitate nei siti che mantengono copie parziali dei dati

Luca Lista - Capri /04/2003 Integrazione dei diversi componenti

Luca Lista - Capri /04/2003 Nuovo modello di Analisi Mario Bondioli Guglielmo De Nardo Luca Lista

Luca Lista - Capri /04/2003 Obiettivi del nuovo modello di Analisi Integrare i Mini e i Micro Supportare prodotti aggiuntive dell’analisi all’interno dei Micro (skims)  Candidati Compositi  User Data generici Informazioni dell’evento e dei singoli candidati Fornire supporto per l’accesso ai Micro attraverso Root/CINT Migliorare le prestazioni dell’analisi all’interno del Framework  miglioramenti attraverso studi dettagliati con il profiler Fino ad ora mai fatto per Beta in dettaglio, ma solo per rec/sim  "load on demand" per i dati dell'analisi  Gamma

Luca Lista - Capri /04/2003 Candidati compositi Scrivere il risultati più costosi per il calcolo  Non è necessario ri-processare l’analisi combinatoria Inizialmente due implementazioni separate sono state portate avanti  Mini (D. Brown, G. Finocchiaro) Ricostruzione del candidato composito in fase di lettura e fit del vertice  Micro (E. Charles, G. Raven) Scrivere anche informazioni del candidato ricostruito (P4 + Vertice) I due prototipi sono stati integrati  Implementazione prototipale per i testi di Aprile  Implementazione finale per Luglio

Luca Lista - Capri /04/2003 Dati Utente Generici Supporto per quantità definite dall’utente da incorporare nei Micro-DST Esempi comuni di variabili per l’analisi:   E, m ES,  m D*,D, cos  B,D*l, … I tipi di variabili utilizzabili sono sia quelli nativi:  double, int, … Che qualsiasi altro tipo:  ThreeVector, LorentzVector, … I dati utente possono essere associati a candidati, ma anche a qualsiasi altri tipo di oggetti (cluster, traccia, etc.) I dettagli tecnologici saranno nascosti quanto più possibile all’utente

Luca Lista - Capri /04/2003 Interfaccia proposta: UsrCandidateBlock B0Data; UsrVariableFloat mES( “mES” ); UsrVariableFloat deltaE( “deltaE” ); for each BtaCandidate * cand { mES =...; deltaE =...; // compute the values B0Data.put( cand, mES ); // put in the micro B0Data.put( cand, deltaE ); } for each BtaCandidate * cand { bool found = B0Data.get( cand, mES ); // get candidate mES from micro found &= B0Data.get( cand, deltaE ); // get candidate deltaE } Inizio del job: Declare variables Scrittura dati (AWG) Lettura dati (Utente)

Luca Lista - Capri /04/2003 Dimensioni attuali dei nuovi Micro Nuovi Micro = Mini ridotti (solo le liste interessanti)  Quntità persistenti = “reco” solo quantità usate dei candidati, niente dati di basso livello Dimensione fisica dei file: 2.5KBytes/event (AllEvents)  Includendo le sovrastrutture di Objy  Senza compressione (ROOT I/O) Kbytes/eventTot.SvtDchTrkDrcEmcIfrPidTrg Mini standard Mini Ridotti Circa la dimensione attuale dei micro!

Luca Lista - Capri /04/2003 Velocità di accesso Ricostruire le liste di candidati standard Accesso a tutti i candidati di tutte le liste  Ricostruire il MicroAdapter per ogni candidato  Momento, energia, … Tempo necessario: 26 msec/event  pentium 800MHz, AllEvents msec/eventoSum Bdb (read + unpack) Emc (trk match) Beta (load) Beta (Quals) Mini Ridotti I CalQual vengono ricalcolati

Luca Lista - Capri /04/2003 Miglioramenti nelle prestazioni Re-implementazione di Beta  La maggior causa delle inefficienze è nella struttura di Beta Inefficiente gestione della memoria e del modello ad oggetti  Il progetto prende il nome di Gamma Jane Tinslay è la coordinatrice del progetto e principale ideatrice  Scopo del progetto: Migliorare l’efficienza di Beta Garantire la compatibilità col codice di analisi esistente Aggiornamento dell’Event-store  Lettura e decodifica sono rimandati quando richiesto La lettura dei dati dal framework sarà efficiente quanto ROOT/Cint Miglioramenti dell’efficienza generali:  Identificare e risolvere problemi nel codice di analisi standard

Luca Lista - Capri /04/2003 Scadenze del progetto Test di aprile  Produrre prototipi per i nuovi Micro per un piccolo sottoinsieme di stream  Supportare solo un sottoinsieme delle nuove possibilità: Candidati compositi Accesso interattivo  Primi riscontri da parte dei fisici 20 marzo:  Conceptual design review di Gamma Test di luglio  Sviluppare il design finale dei nuovi Micro Struttura persistente integrata con i Mini  Supportare tutte (o quasi) le nuove possibilità: Diversi livelli di persistenza per i candidati compositi con diverse informazioni Dati utenti generici persistenti Collegamento di dati tra più file  Ulteriori riscontri da parte degli analisti Ottobre  Prima vera produzione In seguito alla modifica all’event store è anche previsto un aggiornamento delle procedure di Prompt Reconstruction e Simulation Production